Как создать TMX из существующих TXT-файлов

498
nitech

У меня есть несколько книг в печатном формате. Они были переведены с английского на норвежский до того, как компьютеры стали массовыми, поэтому я провел перевод через сканер и распечатал его. Английская версия была уже оцифрована.

Есть ошибки OCR, которые мне нужно исправить, и я также должен сопоставить пункты в норвежском переводе с английским оригиналом.

Кажется, мне следует использовать какую-то программу Translation Memory, например Zanata, в качестве инструмента и репозитория для переводов, но прежде чем я смогу это сделать, мне нужно создать файл TMX, который соответствует сегментам между существующими переводами.

Есть идеи, как мне это сделать? Или я атакую ​​эту проблему под неправильным углом?

1
Похоже, «выровнять переводы» является описательным термином http://www.across.net/online-help/across/acrossHaupt141.htm nitech 8 лет назад 1
Как этот http://tag-aligner.sourceforge.net/ nitech 8 лет назад 0
И этот: http://sourceforge.net/projects/aligner/ - работает в Windows nitech 8 лет назад 1

1 ответ на вопрос

0
nitech

Если вы ищете «Выровнять переводы», вы найдете несколько инструментов, специально предназначенных для выравнивания абзацев (или предложений) в уже переведенных документах.

Я использовал sourceforge.net/projects/aligner, который является кросс-платформенным. Я не слишком впечатлен этим инструментом, но он выполняет свою работу, поскольку вопрос, о котором идет речь выше (позволяет выравнивать текст, а затем создает файл TMX).

Однако я закончил тем, что оставил инструмент по причине, которая не ясна из вопроса выше. Мне нужен был выравниватель для вывода текстового файла, который точно соответствовал оригиналу, с учетом количества разрывов строк. Хотя LF Aligner хранит текущий проект в текстовых файлах, было несколько проблем:

  • Когда я открыл проект во второй раз, часть выравнивания была испорчена. В частности, это относится к местам, я добавил пустой абзац.
  • Общие проблемы обработки пустых абзацев как на языке оригинала, так и на переводе.

Я добавлю больше информации в этот пост, если найду инструмент, способный это сделать.

Похожие вопросы