Дима Лихачев, зам.пом.программиста :)• 08.05.2001 21:59
"""Для ДЛ. В списках повторных открываются пятерки (кстати - было бы логичнее - десятки), которых нет. Номера продолжают наращиваться, а содержание остается по последнему вызванному из существующих. """
вроде бы починил.. там это во всех местах появилось, т.е. все ограничения слетели, когда показать 5 лучших, или там 1 лучший и т.п.
Сейчас вроде бы нормально работает....
Оченно я люблю коллективное творчество программистов, убыв бы :((
"""Мы должны стремиться к идеалу или к Яндексу? """
да ни, просто как иллюстрация того, что принципы всех поисковых машинок на данном этапе - одинаковы, т.е. чтобы новые принципы сообразить -- это давно, на сам деле в искусственном интеллекте разработано все, еще в 60-80 гг., но это сложные механики, которые завязаны на то, что машинка действительно пытается *понять* об чем спрашивают, а не просто формально слова/статистика
"""...ее все же можно отучить делать некоторые глупости..."""
а как?? основной принцип работы такой -- если все слова подряд сохраниять в словаре во всех видах - то это миллионы слов, и находиться будут именно в этом же падеже. Неудобно. Если при индексировании и поиске слова приводить к каноническому виду -- то это 100 тыс. слов, и при поиске "три" будет находиться и "трех", "тремя" и проч -- т.к. они все как-бы-одинаковы, канонический вид - один и тот же..
Саму *процедуру* приведения к такому виду - я не программировал, это большое кнов-хав, тут надо быть мат.лингвистом, млн правил, исключений, вариантов склонений и спряжений -- см. напр. словарь Зализняка, там все это дело расписано. Т.е. - какая есть, такая есть,.. Т.е. даже лезть в словарь - и вносить туда напр. слово "джакузи" и как сего склонять - а я это знаю?? :)) Много .. кого-чего - джакузей? :))
Т.е. для меня это вариант покупного черного ящика - который вот превращает слова в нормальный вид, иногда неудачно, но пока вроде бы свою функцию исполняет относительно хорошо -- т.е. *потерь* при поиске я не обнаруживал. Чтобы вот - есть такое слово в тексте -- а текст при поиске не находится..
Ну вот мой телик меня тож не очень устраивает, и просто было бы, в принципе его слегка перепаять - чтоб например рекламу не показывал :)), но я в него не лезу с паяльником.
на сам деле есть несколько таких программ, я буду смотреть - возможно есть какие-то более умные варианты, например, у которых и имена в словаре есть, и "джакузи" и др.
http://beta.anekdot.ru/