Я хочу получить список всех слов из словаря Aspell. Я загрузил польский словарь aspell и aspell, а затем распаковал его, используя:
preunzip pl.cwl
Я получил pl.wl
:
...
hippie
hippies
hippiesowski/bXxYc
hippika/MNn
hippis/NOqsT
hippisiara/MnN
hippiska/mMN
hippisowski/bXxYc
...
но они появляются с суффиксом вроде /bXxYc
или /MNn
. Эти суффиксы определены в pl_affix.dat
, который выглядит как
...
SFX n Y 5
SFX n a 0 [^ij]a
SFX n ja yj [^aeijoóuy]ja
SFX n a 0 [aeijoóuy]ja
SFX n ia ij [^drt]ia
SFX n ia yj [drt]ia
...
Это связано с склонением и сопряжением. Как добавить в первый список все формы (со всеми соответствующими суффиксами, как определено в файле .dat
)?
Кстати, мне нужен этот список для проверки орфографии jazzy
.