На SuperUser было несколько других вопросов о OCR, которые, возможно, стоит проверить на предмет возможных решений.
В частности, этот ответ Молли выглядит многообещающе:
Мне действительно нравится TopOCR, безусловно, отличное дополнение к вашим средствам сканирования:
- Невероятная точность распознавания, до 99,8% с 3 Мп камерой
- Нет ограничений на количество страниц, не требуются дополнительные загрузки или компоненты
- Обрабатывает изображения со смешанным текстом и графикой (ручное или автоматическое зонирование)
- Выдерживает перекос и неравномерное освещение
- Несколько форматов вывода текста, включая PDF и HTML с возможностью поиска
- Умеет читать 11 разных языков
- Мощная, простая в использовании обработка изображений с искажением изображения
- Поддерживает смартфоны: см. Некоторые образцы смартфонов
- Включает встроенные полнофункциональные текстовые и графические редакторы WYSIWYG
- Проверка орфографии пост-обработки для всех 11 языков
- Встроенное программное обеспечение Text-To-Speech. Как насчет OCR в MP3?
- Включает встроенный многоязычный текстовый переводчик
- Поддерживает интерфейс командной строки и графический интерфейс
- Создание высокопроизводительной системы поиска и индексации документов
- Browser Helper Mode поддерживает создание бесплатных аудио книг
- С WebOC Engine TopOCR легко добавлять новые функции
это очень точно и отлично работает с изображениями низкого качества, такими как фотографии страниц / документов
TopOCR является бесплатным (может быть сделан переносимым с помощью Universal Extractor )
Дальнейшее чтение:
Какое программное обеспечение для распознавания текста имеет больше всего вариантов?