Программное обеспечение для сканирования OpenSource?

8873
user155695

Кто-нибудь может порекомендовать программное обеспечение для сканирования документов / изображений? Предпочтительно с открытым исходным кодом / бесплатное программное обеспечение.

В идеале я хотел бы захватить изображения и обеспечить некоторую форму индексации, если это возможно, и сохранить документы либо в каталог, либо непосредственно в базу данных (например, Oracle BLOB)

Я ищу хорошие альтернативы Kofax или Oracle Document Capture

Спасибо

3
Лучше всего не хранить изображения в базе данных как BLOB-объекты, вместо этого сохраните путь к файлу. Lunatik 14 лет назад 3
Я согласен с Лунатиком в этом DaveParillo 14 лет назад 0
Причиной использования больших двоичных объектов является использование Oracle CMSDK. Если бы это была обычная среда php, я бы увидел преимущества хранения на диске. ;) user155695 14 лет назад 1
Лучше использовать http://softwarerecs.stackexchange.com/ для таких вопросов user291737 8 лет назад 0

2 ответа на вопрос

4
alex

Попробуйте CuneiForm или Tesseract (в настоящее время разработано Google).

2
harrymc

Попробуйте SimpleOCR

Форматы ввода
SimpleOCR работает со всеми полностью совместимыми TWAIN-сканерами, а также принимает входные данные из файлов TIFF.

Форматы вывода
SimpleOCR может сохранять полученные документы в текстовых форматах (TXT и RTF), которые можно импортировать в большинство программ, таких как Word, WordPerfect, HTML-редакторы и программы электронной почты, как полностью отформатированные, так и в виде простого текста. Кроме того, он может сохранять отсканированные документы в стандартном формате TIFF - формате, широко распространенном в формате PDF.

Похожие вопросы