Разбиение изображения текста на слова - возможно ли это?
373
user1993
Мне интересно, есть ли способ разделить отсканированную копию страницы (то есть изображение) на изображения составляющих ее слов. Сканируемая книга написана на индийском языке, для которого OCR (оптическое распознавание символов) не будет работать.
Цель состоит в том, чтобы иметь цифровую версию книги (на том же языке), и для этого я думал о следующем:
- отсканировать книгу
- разделить содержимое страницы на составляющие слова
- отправьте изображения слов транскриберам, которые могут напечатать слово на изображении
- собрать слова на каждой странице
Поскольку сопоставление изображения с изображением является достаточно хорошим, изображения одного и того же слова могут быть идентифицированы, и, таким образом, не нужно будет транскрибировать повторно.
Любая помощь будет отличной!
0 ответов на вопрос
Похожие вопросы
-
14
PDF Viewer в Windows
-
8
Firefox PDF плагин для просмотра PDF в браузере на Windows
-
17
Как распечатать документы в pdf
-
-
2
Firefox печать в PDF-файл
-
4
PDF Reader для iPhone
-
10
Как сжать огромное количество PNG изображений?
-
6
Adobe Reader: запомните пароль для файла PDF
-
4
Можно ли добавить свои собственные закладки / вкладки в файл PDF?
-
5
Какие альтернативы Adobe Acrobat имеют функции подписи PDF
-
3
Какое программное обеспечение может преобразовать почерк в текст?