Заставьте hunspell игнорировать начальные и конечные символы одинарных кавычек (апострофы)

Question

Hunspell всегда рассматривает одинарные кавычки (апострофы) как часть слова. Это означает, что когда текст использует одинарные кавычки для цитирования, hunspell помечает их как ошибки. Даже одна цитата сама по себе считается словом (с ошибкой).

% echo "He asked, 'Why can't I quote?'" | hunspell
Hunspell 1.3.2
*
*
& 'Why 3 10: why, whey, whiny
*
*
*
& ' 15 29: 's, e, s, i, a, n, r, t, o, l, c, d, u, g, m

Аспелл понимает это правильно:

% echo "He asked, 'Why can't I quote?'" | aspell -a
@(#) International Ispell Version 3.1.20 (but really Aspell 0.60.7-20110707)
*
*
*
*
*
*

Я бы предпочел использовать hunspell, но чтобы он игнорировал начальные и конечные символы одинарных кавычек, сохраняя при этом встроенные символы кавычек, такие как «not».

Как я могу это сделать?

score 1 · Answer 1 · 2011-03-09T19:38:42

Удалите все ' , за которыми следует не алфавитно-цифровая, или перед которой стоит не буквенно-цифровая, или в начале или в конце строки:

echo "He asked, 'Why can't I quote?'" | perl -pe 's/'"'"'(\W)/$1/g;s/(\W)'"'"'/$1/g;s/^'"'"'//;s/'"'"'$//;' | hunspell

score 1 · Answer 2 · 2011-03-09T19:38:42

Вам необходимо добавить следующую строку в файл аффикса словаря (т.е. /usr/share/hunspell/en_US.aff)

IGNORE '

К сожалению, я не нашел способ указать личный файл аффикса, как вы можете сделать с личным файлом словаря.

Сейчас выбран русский

Заставьте hunspell игнорировать начальные и конечные символы одинарных кавычек (апострофы)

2 ответа2

Всё ещё ищете ответ? Посмотрите другие вопросы с метками command-line spell-check.

Заставьте hunspell игнорировать начальные и конечные символы одинарных кавычек (апострофы)

2 ответа2

Всё ещё ищете ответ? Посмотрите другие вопросы с метками command-line spell-check.

Похожие