Tesseract 4.0 не читает изображения только одним словом текста
287
YounesCHTIOUI
Я использую Tesseract v4.0.0-beta.1-108-gf291 Изображение 5.jpg не читается (одно слово: символы хорошего размера) tesseract 5.jpg out.txt Я перепробовал все виды параметров --psm и до сих пор не читается Однако изображение (50.jpg) читается очень хорошо ... Что здесь происходит? Одно слово не читается, и большой документ с небольшим сложным тестом читается нормально ... Любая помощь приветствуется. С уважением
Я не использую этот инструмент, только несколько общих советов: 1. Инструменты OCR имеют оптимальный размер символов, они могут не распознавать слишком большие символы. 2. эти инструменты также анализируют несколько символов, чтобы определить тип шрифта, имея только несколько символов, которые они могут не идентифицировать. 3. кажется, что вы используете бета-версию, по определению она еще не закончена, вы должны связаться с разработчиком и оставить отзыв (= помочь им улучшить) вместо того, чтобы спрашивать здесь.
Máté Juhász 6 лет назад
2
0 ответов на вопрос
Похожие вопросы
-
6
Насколько хороша защита паролем Word?
-
4
Вставить Flash видео в документ MS Word (2003 или 2007)
-
1
Как сделать так, чтобы меню по умолчанию открывалось «полностью» в MS Word 2003?
-
-
1
Office 2007 - ссылки на источники в Word
-
6
Есть ли сочетание клавиш для выделения выделенного текста в MS Word 2007?
-
2
Word 2007 не открывает старые файлы
-
3
Минимизируйте размер файла документов Microsoft Word
-
6
Рекомендация для простого (японского) текстового процессора
-
1
Используя OpenOffice.org, есть ли способ напечатать не только контент, но и комментарии к документу?
-
7
одновременное совместное использование текстовых документов