Получение списка слов из словаря GNU aspell

1595
Velvet Ghost

Я скачал пакет aspell для поддержки словаря бенгальского языка. Из архива я смог выделить файл bn.wl, который представляет собой список из 100 000 слов, по одному в каждой строке.

Проблема заключается в том, что кодировка, по-видимому, - 13194-bn, и любой текстовый редактор, с которым я открываю файл, показывает мусор (одно слово-мусор в строке). Это, вероятно, ожидает utf8 или что-то.

Как я могу преобразовать этот файл в читаемую форму? Я попытался использовать iconv, но он не может распознать кодировку.

2
Вы пытались использовать сам aspell для предоставления списка слов: `aspell -l bn dump master`? Paul 12 лет назад 0
Я получал ошибку, когда пытался сделать это на своей машине с Ubuntu, но я пробовал ее на машине с Fedora, и она работала! Большое спасибо! Можете ли вы опубликовать это как ответ, чтобы я мог принять это? Velvet Ghost 12 лет назад 0

1 ответ на вопрос

1
Paul

Используйте aspell для предоставления списка слов в удобочитаемом формате:

aspell -l bn dump master 

Ключ -l предназначен для определенного словаря, если он отсутствует, то выбирается словарь по умолчанию.

Есть ли способ сделать то же самое с установкой aspell, но без установки языка 'bn'? Например, указав aspell на местоположение загруженного словаря aspell (файл .cwl). bliako 7 лет назад 1

Похожие вопросы