Распознавание форм с использованием OCR и возврат изображения значения

304
Jonathan

Я нахожусь на проекте, который обрабатывает сотни форм. Формы имеют согласованные форматы, но заполняются вручную разными людьми. Мне нужен способ быстро обработать все эти данные в электронном виде.

Распознавание распознавания для напечатанных документов кажется зрелым, но для рукописного ввода очень не хватает.

Для этого рассмотрим форму с несколькими полями, структурированными так:

Field1 : Значение1

Например:

Name: John

где Nameполе и Johnзначение.

Учитывая, что формы структурированы и типизированы, OCR должен иметь возможность распознавать / интерпретировать поля. Тем не менее, значения полей написаны от руки, и OCR будет работать очень плохо для них.

Итак, есть ли способ, где поля будут распознаны на изображении, а затем будет возвращен фрагмент изображения значения?

2
Вы ищете библиотеку OCR для интеграции в программу, чтобы получить эту информацию, или отдельный пакет, который бы сделал это для вас? В любом случае, у вас есть конкретное место назначения программного обеспечения, с которым должно работать решение? Alan Shutko 12 лет назад 0

1 ответ на вопрос

2
Vitalik

Вы можете попробовать использовать FineReader Engine. Он может распознавать не только печатные документы (технология OCR), но и почерк (технология ICR).
Таким образом, вы можете распознать оба поля и экспортировать данные в электронные формы.

Работа для ABBYY, и если вам понадобится дополнительная информация о наших продуктах, я буду рад вам помочь.

Похожие вопросы