Автодополнение и спелл-чекер

У кого-нибудь получилось реализовать на большом индексе что-то вменяемое из этих двух возможностей?

Подсказки аля как у Яндекса и спелл-чекер тоже.

С первым по-моему полный швах, а со вторым без использования словаря русских слов в приоритетном порядке тоже получается иногда не очень (до Яндекс.Спеллера, который пока еще жив, далековато).

Я общем я пришел к выводу, что спелл-чекер вполне можно сделать, но только для академических текстов. Пока не будет словаря для, например, форумов он не очень годится т.к. там много слов с ошибками и он будет исправлять ошибочные слова на тоже ошибочные порой ошибочные слова.

Может быть и так, хотя не хочется верить, что на абстрактном форуме рандомное слово настолько часто встречается в ошибочном варианте, что перевешивает правильное написание и в итоге call keywords/suggest двигают ошибочный вариант в топ.

Но в таком случае, нужно ответить себе на вопрос, насколько правильно автодополнять или корректировать слово до корректного варианта, если этот вариант найдёт меньше результатов, чем неправильный?

Сергей, словарь - это 100% надежный источник. Форум - нет.

Я не знаю как поведет себя ваш Спеллер в реальной жизни, но сейчас делаю скрипт, который сначала будет делать запрос к словарю (при чем SELECT, а потом SUGGEST для лучшей морфологии), а потом к SUGGEST форуму. Вот так хитро :rofl:

Может быть буду комбинировать. В любом случае скорее всего сначала соберу данные по Яндекс.Спеллеру за несколько месяцев, а потом прогоню через свой.

Результатами поделюсь.

Да, Сергей, тут вот еще какое дело. SUGGEST как я понял не работает со словоформами.
Т.е., если в исходном тексте есть слова “большая” и “большое”, а человек набрал “бальшие”, то ему исправится на один из этих вариантов, что мягко говоря неправильно. :laughing:

Хорошо бы как в Яндекс.Спеллере все-таки сделать поддержку словоформ в сочетании с расстоянием Левенштейна :grinning: