Я тестирую hunspell в командной строке с помощью шведского словаря. Ввод в интерактивном режиме заменяет все специальные символы (например, ä ä ö) пробелами перед проверкой заклинаний.
Hunspell 1.3.2
sjögräs
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*
sj gr s
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*
Как видите, кодировка приглашения работает, показывая å ä и ö как на входе, так и на выходе.
Трубопровод дает тот же результат:
echo sjögräs | hunspell -d sv_SE
Я попытался задать различные параметры для hunspell, в том числе -i UTF-8
, -i UTF-16
и сохранить в файле SET ISO8859-1
. Ничего не получалось.
То же самое происходит с французским:
C:\Users\gauthier>echo résultat | hunspell -d fr-moderne
Hunspell 1.3.2
*
& sultat 2 2: sultan, rAcsultat
с дополнительными проблемами с выходом.
Я скомпилировал hunspell в MinGW и переместил необходимые файлы куда-то на моем пути, но я не думаю, что эта информация очень важна.
Как заставить hunspell распознавать специальные символы на входе?