Захват текста на странице с белым фоном от фотографии

265
Edgar Oliveira

Я намереваюсь преобразовать фотографию с текстом на странице с белым фоном в текстовый файл. Цель - захватить весь текст на этих изображениях.

Я Google, и я основал imagemagick и этот инструмент: SCAN Image to TEXT

Но это ли лучший вариант? Возможно ли захватить текст на фотографии? Спасибо

0
то, что вы пытаетесь сделать, называется OCR (оптическое распознавание символов). Есть много решений для этого. выбранный вами вариант может работать для вас. Sassafras_wot 7 лет назад 0
@Sassafras_wot ты говоришь о imagemagick? Эта программа не должна конвертировать текст в изображение? Edgar Oliveira 7 лет назад 0

3 ответа на вопрос

1
timfredo

Другое хорошее и бесплатное решение (веб-сервис) - https://ocr.space/ - оно хорошо работает с текстом на фоне, например с субтитрами к фильмам.

Google предлагает лучшее распознавание текста, но для этого нужно программирование: https://cloud.google.com/vision/

0
cybernard

Будет ли купить продукт? Я давно пользуюсь Omnipage и / или Pro-версией и очень доволен ее результатами.

http://www.nuance.com/for-individuals/by-product/omnipage/index.htm

Чем выше ваша мегапиксельная скорость цифровой камеры, тем лучше. Если это фотопленка, отсканируйте ее с разрешением 600 точек на дюйм.

0
Sassafras_wot

верхний ответ в вашей ссылочной ссылке похож на этот. Я предлагаю вам использовать существующее решение «черного ящика», а не пытаться свернуть свое собственное. если это не ваш проект.

одним из решений является TesseractOCR мультиплатформенный OCR с открытым исходным кодом

другой с зависимостью MSOffice - OCR с Microsoft® Office

и еще один GOCR - распознавание символов с открытым исходным кодом

Похожие вопросы