Инструмент для определения языка текста?

2051
Flethuseo

Есть ли инструмент, который может определить язык текста из нескольких абзацев?

0

2 ответа на вопрос

1
dmckee

У fileинструмента есть куча эвристик для угадывания типов файлов, включая тот, который сообщает «английский текст». Я не знаю, знает ли он о других человеческих языках, но он определенно может быть улучшен, чтобы догадываться между ними.

1
Mortimer

Есть много инструментов, чтобы сделать это, первый из которых я думаю, это собственные Google: http://code.google.com/apis/ajax/playground/#language_detect

Надеюсь, поможет

Инструмент language_detect от Google кажется многообещающим, я должен сделать это для более чем одного текста. Я вижу там некоторый код, но не знаю, смогу ли я запустить его на своей машине. Flethuseo 13 лет назад 0
google API probably has limits on the amount of queries you can send, so you might need to use one of the other libraries to do it I guess. Mortimer 13 лет назад 0