You will need to update the page number (6th column) in each box file and then concatenate the files into one. The page number is zero-based and needs to match the order of the individual pages in the multi-page TIFF image. Once done, you can verify by opening the image in jTessBoxEditor to check if the boxes match up with the image.
В jTessBoxEditor for Tesseract, как объединить несколько файлов TIFF / boxfile в один файл с обученными данными
984
coldbreeze16
Я думаю, что это было бы возможно с командной строкой, но как это сделать с помощью jTessBoxEditor, поскольку это автоматизировало бы большую часть рабочего процесса.
Так как jTessBox поддерживает многостраничный TIFF, я думаю, что так может быть, но как мне организовать box-файлы в этом случае?
1 ответ на вопрос
1
nguyenq
Похожие вопросы
-
3
Какое программное обеспечение может преобразовать почерк в текст?
-
3
Как я могу определить шрифты на изображении?
-
3
Что такое хорошее программное обеспечение для распознавания рукописного ввода?
-
-
9
Как извлечь текст с помощью OCR из PDF в Linux?
-
8
Практическое решение для оптического распознавания текста для преобразования большой книги в цифрово...
-
8
Как я могу преобразовать отсканированные изображения в формате PDF в PDF-файл с возможностью поиска?
-
1
Можно ли вызвать Acrobat из командной строки для выполнения OCR?
-
7
Извлечение текста из отсканированной книги .PDF
-
3
Как запустить сканирование OCR в Microsoft Office Word 2010?
-
2
Преобразователь изображения в текст