1

Я тестирую hunspell в командной строке с помощью шведского словаря. Ввод в интерактивном режиме заменяет все специальные символы (например, ä ä ö) пробелами перед проверкой заклинаний.

Hunspell 1.3.2
sjögräs
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*

sj gr s
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*

Как видите, кодировка приглашения работает, показывая å ä и ö как на входе, так и на выходе.

Трубопровод дает тот же результат:

echo sjögräs | hunspell -d sv_SE

Я попытался задать различные параметры для hunspell, в том числе -i UTF-8 , -i UTF-16 и сохранить в файле SET ISO8859-1 . Ничего не получалось.

То же самое происходит с французским:

C:\Users\gauthier>echo résultat | hunspell -d fr-moderne
Hunspell 1.3.2
*
& sultat 2 2: sultan, rAcsultat

с дополнительными проблемами с выходом.

Я скомпилировал hunspell в MinGW и переместил необходимые файлы куда-то на моем пути, но я не думаю, что эта информация очень важна.

Как заставить hunspell распознавать специальные символы на входе?

0