Lemmatizer другой

Приветствую друзья и товарищи !
Скажите пожалуйста, есть ли возможность подключить более солидную библиотеку через конфиг мантикоровский как родную мантикоровскую? К примеру - могу ли я сделать так : lemmatizer = external
lemmatizer_cnd =…/путь/hunspell -d ru_RU -m итд? Та и вообще есть ли идеи на этот счет? Вот как это делается… Спасибо! :wink:

1 Like

нет, каждый лематайзер требует интеграции кода

вы можете использовать только те лематайзеры, что уже имеют интеграцию в коде и соответствующие опции конфигурации индекса / таблицы

Мы делали внешний лемматизатор на питоне для лемматизации украинского языка - GitHub - manticoresoftware/lemmatizer-uk: UK lemmatizer for Manticore Search

Та и вообще есть ли идеи на этот счет?

Есть идеи подружить C++ код с кодом на расте для использования либ на расте на этапе индексации в контексте векторного поиска. Если это получится, то в теории можно будет подумать и над использованием каких-то либ на расте для лемматизации/токенизации.

А слушайте, кажется у сфинкса была похожая тема. Да - нужен именно уровень индексации - всё остальное нерационально. Может внедритье в новые версии эту фишку.

Да - это лучше чем ничего - но не мой вариант. Было бы здорово мултиязычность, так сказать, подключение любых библиотек…, что позволит значительно расширить границы точности и универсальности Мантикора.