Установите tesseract ocr 3 на OSX

6413
Billy Moon

Я пытаюсь установить Tesseract OCR на OSX 10.6 ...

Я дошел до установки leptonic ( скачав src и установив с помощью ./configure; make; sudo make install), казалось бы, без проблем - но я не знаю, как это проверить.

Я также установил Tesseract OCR 3 (из Google Code с ./runautoconf; ./configure; make; sudo make install) также, казалось бы, без проблем - но опять же я не знаю, как проверить.

Когда я бегу, tesseract input.jpg .я получаю ошибку ...

 bash-3.2$ tesseract ~/Desktop/DCIM/101_FUJI/DSCF1043.JPG .  Tesseract Open Source OCR Engine with Leptonica Error in pixReadStreamJpeg: function not present Error in pixReadStream: jpeg: no pix returned Error in pixRead: pix not read  Error in fopenReadStream: file not found  Error in pixRead: image file not found Image file ###### Exif cannot be read!  

Подобная ошибка, если я использую TIFF файл в качестве входных данных.

Я думаю, что мне нужны некоторые библиотеки - инструкции для Ubuntu говорят, чтобы установить libjpeg12-dev и т.д ...

У кого-нибудь есть детали как установить tesseract на OSX?

0

3 ответа на вопрос

2
tajh

Установите macports: см. Http://www.macports.org/ для загрузки и инструкции по установке.

Обновите дерево портов: sudo port selfupdate

Установите тессеракт: sudo port install tesseract

Порт tesseract, по-видимому, не имеет варианта, поддерживающего jpeg, поэтому вам необходимо установить конвертер графических файлов и пакет для настройки изображения (яркости, контрастности и резкости): sudo port install imagemagick

Конвертируйте ваш jpeg в формат tiff, затем выполните OCR для него с помощью tesseract: convert input.jpg input.tiff ; tesseract input.tiff ocr-text-ouput -l eng ; rm input.tiff

Полученный текст должен быть найден в файле ocr-text-ouput.txt.

ps, вы можете немного откорректировать изображение для потенциально лучшего распознавания текста с такими параметрами конвертации: convert -sharpen 1 -brightness-contrast 3X30 input.jpg input.tiff

мне пришлось установить 'tesseract-eng', чтобы обойти ошибку сегментации 11. Ian 10 лет назад 0
2
shig

Я использую homebrew на osx 10.7, и это было так же просто, как запуск этих двух команд:

brew install leptonica brew install tesseract 

На нем установлены leptonica 1.68 и tesseract 3.01 с их зависимостями

0
user3291575

Working one command solution for me:

sudo brew install tesseract 

This install tesseract and all dependencies. sudo necessary for some purposes, like jpeg packet linking.

Похожие вопросы