Ищите программное обеспечение, чтобы переименовать имя файла JPEG сканирования изображения документа в текст на изображении

1838
therobyouknow

Я сканирую многие бумажные документы формата А4 в JPEG с помощью автоматического сканера устройства подачи документов.

Результаты: FILE0001.JPG FILE0002.JPG и т. Д.

Я хотел бы, чтобы программа переименовала название файла в текст, найденный в самом отсканированном изображении в формате JPEG. Предпочтительно, чтобы определить заголовок, программа будет искать самый большой текст на изображении и который кажется ближайшим к верхней части изображения.

Мне известно о нескольких коммерческих и некоторых бесплатных приложениях для оптического распознавания текста, и я хотел бы приобрести их при необходимости, однако, похоже, они имеют больше, чем мне нужно: они конвертируются в PDF и т. Д., В то время как я просто предпочел бы сделать это простым и работать с оригинальное отсканированное изображение.

Приветствуются готовые к использованию простые в использовании программы для Windows XP, 7 или MacOS.

2

2 ответа на вопрос

1
Julian Knight

Боюсь, что вы ищете что-то чрезвычайно сложное и вряд ли будет надежным, даже если это можно найти.

Я думаю, что лучшее, на что вы могли бы надеяться, это использовать Microsoft OneNote (часть Office) или Evernote (имеет бесплатную версию).

Они оба способны распознавать изображения в заметках - в фоновом режиме - оставляя любой обнаруженный текст доступным для поиска. Я не уверен, что они будут брать заголовок заметки из текста, хотя они могут, если вы убедитесь, что в заметке нет другого текста. Дай им попробовать.

Имейте в виду, что распознавание даже хорошо отсканированных типизированных или набранных документов далеко не надежно, и даже в этом случае знание того, что представляет собой заголовок, хотя его легко анализировать людям, является очень сложной задачей для компьютера.

ОБНОВЛЕНИЕ: Сложность проистекает из ряда вещей. Распознавание изображения в текст достаточно сложно для машины. В языке так много сложностей, что очень трудно выделить смысл из изображения, даже когда это изображение набрано. Даже набранные символы сильно различаются, особенно при сканировании из-за ограничений сканирования, изменений угла, нечеткого или иным образом поврежденного исходного текста (например, сгиба на бумаге) и так далее. Во-вторых, что такое заголовок? Очевидно, вы могли бы подумать - что-то большего размера, чем «среднее» в верхней части страницы? Как система определяет средний размер шрифта? Само по себе значительное задание, так как для этого нужно «разобрать» весь скан. Тогда есть много комбинаций макета - какие из них должен попытаться распознать машину? Возьмите средний бизнес-отчет, например,

Каждый из этих этапов обработки займет значительное время даже на современном ПК и потребует больших объемов обработки данных: очистите изображение, выровняйте изображение (распознавая края и «строки» текста), выберите стили шрифта, чтобы понять, что это текст, а что нет, попытка распознать текст (возможно, применяя правила орфографии и грамматики), определить размеры и средний размер шрифта, определить повторяющиеся элементы (верхние / нижние колонтитулы), которые следует игнорировать, попытаться определить более крупный текст в начале документа, Угадайте заголовок, проверьте, является ли оно действительным именем файла для платформы, измените, если нет, убедитесь, что имя уникально и не используется. Уф!

В лучшем случае большинство инструментов OCR стремятся обеспечить точность около 90% от стандартного сканирования с чистыми документами с прямой подачей. Хотите ли вы иметь 90% документов с точным названием? Это может быть хорошо для вас, но будут ли клиенты продукта терпеть это? После всех разработок риск будет стоить того для продавцов?

Я не знаю ответов на эти вопросы. Я вижу, что это может быть отличной функцией, но я не знаю, что кто-то предлагает это (я также сделал быструю проверку через Google).

Было бы проще, если бы все ваши документы имели одинаковый макет. Тогда вы могли бы использовать «зонирование», то, что предлагает большинство лучших инструментов, и взять соответствующую зону в качестве основы для имени файла. Это было бы более (но не полностью) надежно. Возможно, вам следует узнать у некоторых поставщиков, заинтересованы ли они в этом.

+1 Спасибо Джулиану Найту, за Evernote и за комментарии по надежности. Я оставлю это открытым для других. therobyouknow 11 лет назад 0
Нет проблем. Я надеюсь, что вы получите лучший ответ, я буду следить за этой веткой, чтобы увидеть, поступите ли вы так, как мне было бы интересно. Julian Knight 11 лет назад 1
+1 Спасибо Джулиану Найту. Я надеюсь закрыть и принять ответ (возможно, ваш!). Я приветствовал бы дальнейшие размышления о том, почему это может быть сложно, так как, если OCR может распознать текст, он должен знать о «ограничивающей рамке» вокруг текста, то есть он должен быть в состоянии определить, какую область занимает текст и, следовательно, размер. Он также должен иметь возможность определить, насколько близко он находится к верхней части страницы с ее позиции. Так что да, я бы согласился с тем, что само OCR * является сложным и, возможно, не всегда на 100% правильно с «занятыми» страницами, но как только этот бит будет сделан, координаты и размер должны быть проще, не так ли? therobyouknow 11 лет назад 0
Это действительно что-то для дискуссионного форума, а не здесь. Но я постараюсь добавить немного больше информации. Julian Knight 11 лет назад 0
Вероятно, мне следовало добавить комментарий о некоторых процессорах RECEIPT, которые теперь доступны онлайн. Они предлагают автоматическое определение поставщика, валюты и количества и довольно удивительны в своей точности благодаря наличию большого количества вычислительной мощности. Julian Knight 11 лет назад 0
+1, принимая этот ответ как заявление о том, что я прошу это высокий заказ, большой спрос. Спустя более года после того, как я задал этот вопрос, я отсканировал все упомянутые документы и назвал их вручную, что поможет некоторым именам партий для части имени, в основном с использованием Beyond Compare. Так что проблема решена: другая история одного и того же конца. Все оригинальные документы были уничтожены, и остались только цифровые. therobyouknow 10 лет назад 0
0
J.Anthony

Вы можете сделать это, просто нажав на изображение> переименовать> (ваше имя) .jpg> введите

Будет сделано! Просто не забудьте сохранить расширение файла: .jpg

Это все. Всего наилучшего!

Прочтите вопрос еще раз. therobyouknow 10 лет назад 1