У file
инструмента есть куча эвристик для угадывания типов файлов, включая тот, который сообщает «английский текст». Я не знаю, знает ли он о других человеческих языках, но он определенно может быть улучшен, чтобы догадываться между ними.
Инструмент для определения языка текста?
2047
Flethuseo
Есть ли инструмент, который может определить язык текста из нескольких абзацев?
2 ответа на вопрос
1
dmckee
1
Mortimer
Есть много инструментов, чтобы сделать это, первый из которых я думаю, это собственные Google: http://code.google.com/apis/ajax/playground/#language_detect
- В Java есть http://textcat.sourceforge.net/
- В Ruby https://github.com/peterc/whatlanguage
- В Perl http://search.cpan.org/~ambs/Lingua-Identify-0.29/lib/Lingua/Identify.pm и т. Д.
Надеюсь, поможет
Инструмент language_detect от Google кажется многообещающим, я должен сделать это для более чем одного текста. Я вижу там некоторый код, но не знаю, смогу ли я запустить его на своей машине.
Flethuseo 13 лет назад
0
google API probably has limits on the amount of queries you can send, so you might need to use one of the other libraries to do it I guess.
Mortimer 13 лет назад
0
Похожие вопросы
-
9
Почему Windows меняет язык ввода случайно?
-
1
Распознавание речи в Vista на нескольких языках
-
2
Переключение между клавиатурами в Mac - сочетание клавиш?
-
-
3
Можно ли закрыть «языковую панель» из командной строки?
-
1
В Windows 7 как я могу назначить языки (немецкий / английский) для учетных записей пользователей?
-
2
Windows 7 + Lang Pack против национальной версии?
-
3
Изменить язык системы с русского на английский в Vista
-
5
Microsoft Outlook зависает при переключении языка ввода
-
4
Почему Alt + Shift не переключает языки в Microsoft Word?
-
3
Как мне ввести греческие символы в Ubuntu?