Додайте свій проект безкоштовно і почніть отримувати пропозиції від фрілансерів-виконавців вже через хвилини після публікації!
200 ₴

Поиск в непроиндексированном тексте (русский язык)

минув час актуальності


Нужно реализовать поиск фразы в непроиндексированном тексте. При этом поиск должен выполняться с учетом словоформ. Подозреваю, что нужно использовать лемматизацию (то есть генерировать набор комбинаций словоформ слов и производить поиск по тексту). Возможно, вы предложите более эффективный/правильный вариант. Язык русский.


Реализация C# VS2013. С вас исходники проекта (лучше всего на bitbucket). При необходимости можно использовать сторонние словари и наработки вроде Яндекс Томита парсера.


В будущем будем обсуждать доработку ранжирования результатов поиска, например, по расстоянию между словами, порядку и т.д.


Зробити ставку!

Замовник не бажає робити передплату? Запропонуйте оплату через Сейф, щоб уникнути можливого шахрайства.
  • Это ж фраза, несколько слов (со знаками), не кусок текста - тест все равно будет проходить сравнение посимвольно: поставьте параллельную проверку всех нахождения всех слов в фразе (и, при необходимости, знаков пунктуации), желательно, через switch case, в теле установите счетчик для индексации текстового массива и массив (массивы) integer для регистрации мест находок. Все дальше просто проходите сравнение последовотельностей найденых слов в нужном порядке и колличестве. Может я не до конца понял ваше задание или найдется идея получше, ну, как говорится, чем смог. Конкретная реализация будет зависить от того, что у вас за программа, тобишь какими средствами работы со строками и символами пользуетесь.

  • Додати

Замовник
Артем Фролов
Україна Дніпро  7   0
Проект опублікований
4 січня 2017
79 переглядів
Способи оплати