Serega • 11.05.2001 13:31
Да что ж это такое , а?:)))
ДЛ, обратите внимание
https://www.anekdot.ru:8083/poetry-100-00.html
Май 2001 Пн Вт Ср Чт Пт Сб Вс 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Serega • 11.05.2001 13:31
Да что ж это такое , а?:)))
ДЛ, обратите внимание
https://www.anekdot.ru:8083/poetry-100-00.html
Африканец• 11.05.2001 11:46
Дима Лихачев,
правильно ли я понимаю, что причина проблемы в данном случае - именно отсутствие слова "джакузи" в словаре, заставляющее применять великий искуссивенный интеллект? А если слово есть в словаре, то нормальная форма определяется по нему, или тогда тоже будет применяться интеллект? Без словаря неизбежно будут постоянные ошибки, поскольку по виду слова в общем случае часть речи определить невозможно. Во фразе "У отца было три сына: один мордаст, второй педераст, третий - Родину продаст" три похожих слова относятся к разным частям речи.
Интересно, а слово "ламер" - определится ли как прошедшее время от глагола "ламереть"? Ведь вряд ли это слово есть в словаре.
На самом деле, как мне кажется, задачу по приведению искомого слова к нормальному виду можно возложить на пользователя. Пусть, если ему надо найти, как что-то трут, то так и напишет "тереть", а не "тру" или "три". А если ему надо искать, как кто-то сел, то пусть ищет "сесть", а не "село". Для многих это было бы гораздо удобнее нынешней формы. Можно предоставить оба варианта - как я понимаю, предлагаемый отличается от ныне реализованного только отсутствием вызова функции канонизации слова. Тогда если кто получит резултьатты поиска в пару тысяч вхождений, то применит второй вариант.
На самом деле есть еще и другой вид поиска, который часто бывает полезен, а именно поиск по точному вхождению слова. Даже более того - по точному вхождению словосочетания или фразы. Примером является недавний вопрос - какой анекдот кончается словами "так и ходите"? Поиск по этим словам в новых анекдотах выдает 683 результата. Вы не думали над такой возможностью? Технически-то это проще, чем существующая, но придется строить новый индекс, раз существующий устроен по каноническим формам.