Как я могу найти самую длинную запись в словаре?

314
Cesar

Я спросил на бирже английского стека: «Какое английское слово с самым длинным определением?» Лучший ответ, который они могли бы дать, - это то, что мне нужна программа, которая могла бы определить самую длинную запись в (текстовом) файле со списком определений словаря, подсчитав количество символов или слов в данной записи, а затем предоставить список самые длинные записи.

Мне удалось найти файл словаря, который преобразован в текст, имеет следующий формат:

a / a / неопределенный артикль (перед гласным) 1 любой, какой-то один (есть cookie). 2 одна вещь (нет магазина для миль). 3 на каждого (принимайте это два раза в день).

aardvark / ard-vark / n африканское млекопитающее с длинной мордой, которая питается муравьями.

abacus / a-ba-kus, a-ba-kus / na Счетная рамка с бисером.

Как видите, каждое определение следует за произношением (заключенным в косую черту), а затем либо:

1) заканчивается точкой или

2) заканчивается перед примером (заключенным в круглые скобки), или

3) следует за числом и заканчивается точкой или перед примером, когда слово имеет несколько определений.

В таком случае мне потребуется функция или программа, которые могут различать каждое определение (включая рассмотрение нескольких определений одного слова как отдельных), а затем подсчитывать количество символов и / или слов внутри (игнорируя примеры в скобках, поскольку это не правильное определение), и, наконец, приведу список самых длинных определений (я не думаю, что мне нужно больше, чем, скажем, топ-20 или около того для сравнения). Если формат файла был проблемой, я могу конвертировать файл в PDF, EPUB и т. Д. Без проблем. И, думаю, в идеале я бы хотел иметь возможность выбирать между подсчетом длины по символам и по словам, если это было возможно.

Как я должен пойти, чтобы сделать это? Заранее спасибо.

1
Вы можете импортировать список в Excel, удалить дубликаты, использовать функцию LEN для подсчета количества символов, а затем отсортировать по столбцу с помощью функции LEN. BillDOe 6 лет назад 0
Это очень просто с помощью скрипта `bash` в Linux. AFH 6 лет назад 0
Я на Windows 7. Как Excel различает несколько определений, если они не разделены переносом строки? Cesar 6 лет назад 0

0 ответов на вопрос