C2BlEv wrote:Можно ли отсеивать при поиске в индексе знаки ударения (т.е., ́ умы́шленный)Сейчас они считаются полноправными буквами и нужно их удалять.
ikm wrote:Да, это ошибка на самом деле. Распространенные случаи диакритики в составе готовых символов оно и раньше ловило, но не произвольные. В общем, добавил выкидывание всех combining ranges. Как следствие, полная реиндексация.
Users browsing this forum: No registered users and 23 guests