Tesseract 4.0 не читает изображения только одним словом текста

287
YounesCHTIOUI

Я использую Tesseract v4.0.0-beta.1-108-gf291 Изображение 5.jpg не читается (одно слово: символы хорошего размера) tesseract 5.jpg out.txt Я перепробовал все виды параметров --psm и до сих пор не читается Однако изображение (50.jpg) читается очень хорошо ... Что здесь происходит? Одно слово не читается, и большой документ с небольшим сложным тестом читается нормально ... Любая помощь приветствуется. С уважением

50.jpg

5.jpg

0
Я не использую этот инструмент, только несколько общих советов: 1. Инструменты OCR имеют оптимальный размер символов, они могут не распознавать слишком большие символы. 2. эти инструменты также анализируют несколько символов, чтобы определить тип шрифта, имея только несколько символов, которые они могут не идентифицировать. 3. кажется, что вы используете бета-версию, по определению она еще не закончена, вы должны связаться с разработчиком и оставить отзыв (= помочь им улучшить) вместо того, чтобы спрашивать здесь. Máté Juhász 6 лет назад 2

0 ответов на вопрос

Похожие вопросы