Вы можете использовать следующую ссылку, чтобы узнать больше о том, как тренировать тессеракт. Для исправления файлов ящиков вы можете использовать jTessBoxEditor . Не забывайте, что иногда вам может понадобиться предварительно обработать изображения.
TesseractOCR специализированное обучение
1409
Jim
Я не понимаю, как я должен сказать Тессеракту, что это на самом деле a b c
буквы?
Добавляя makebox в cli, выдает этот файл:
C 78 127 104 166 0 l 96 127 118 166 0 . 116 127 126 140 0 - 124 127 130 145 0 j 145 127 162 188 0 o 154 127 183 158 0 b 203 131 241 164 0
1 ответ на вопрос
0
Pranaysharma
Похожие вопросы
-
1
Почему Tesseract CLI показывает «не удается создать выходной файл» в Windows 7?
-
1
Тренинг Tesseract-OCR для шрифтов английского языка
-
3
Установите tesseract ocr 3 на OSX
-
-
1
Буфер обмена gImageReader не работает в Windows
-
0
Tesseract не может сканировать `Ошибка: поддерживаются только 1,2,4,5,6,8 бит / с: 32`
-
3
OCR Tesseract, Ошибка пустой страницы?
-
2
Невозможно обработать GIF с помощью Tesseract в OSX
-
1
Tesseract hocr и txt одновременно, или преобразование из Tesseracts hocr в txt
-
1
OCR с неязыковым текстом
-
2
Tesseract 3.03 данные английского языка