Попробуйте это:
aspell -d pl dump master | aspell -l pl expand > my.dict
Отредактировано, чтобы соответствовать исправлениям в комментарии.
Я хочу получить список всех слов из словаря Aspell. Я загрузил польский словарь aspell и aspell, а затем распаковал его, используя:
preunzip pl.cwl
Я получил pl.wl
:
... hippie hippies hippiesowski/bXxYc hippika/MNn hippis/NOqsT hippisiara/MnN hippiska/mMN hippisowski/bXxYc ...
но они появляются с суффиксом как /bXxYc
или /MNn
. Эти суффиксы определены в pl_affix.dat
, который выглядит как
... SFX n Y 5 SFX n a 0 [^ij]a SFX n ja yj [^aeijoóuy]ja SFX n a 0 [aeijoóuy]ja SFX n ia ij [^drt]ia SFX n ia yj [drt]ia ...
Это связано с склонением и сопряжением. Как я могу добавить в первый список все формы (со всеми соответствующими суффиксами, как определено в .dat
файле)?
Кстати: мне нужен этот список для проверки орфографии jazzy
.
Попробуйте это:
aspell -d pl dump master | aspell -l pl expand > my.dict
Отредактировано, чтобы соответствовать исправлениям в комментарии.