Какой формат лучше всего подходит для захвата экрана при подготовке к распознаванию?

192
humanengr

В каком формате должен быть сделан снимок экрана (png, tiff, pdf), чтобы получить лучшее распознавание текста?

Некоторые пакеты OCR выполняют OCR для png или tiff, чтобы извлечь текст перед преобразованием изображения в pdf, чтобы воспользоваться преимуществами более высокого разрешения первого?

1
Проблема не столько в формате, сколько в разрешении и уровне сжатия. JakeGould 8 лет назад 0
Как это можно контролировать на Mac при съемке экрана? humanengr 8 лет назад 0
Обычная крышка экрана должна работать. JakeGould 8 лет назад 0
Я получаю различное качество распознавания текста на моем MacBook Pro Retina в зависимости от того, какой формат используется для крышки экрана. Из моей небольшой серии тестов кажется, что использование экранной шапки в pdf дает немного лучшее распознавание текста. Но это только из ограниченного образца. Итак, мой первый вопрос был о том, какой формат обычно рекомендуется. humanengr 8 лет назад 1
Проблема с вашим вопросом - это вопрос, основанный на мнении. И я оставил комментарий моего мнения, а не ответ. Так что, честно говоря, не так много, чтобы добавить. JakeGould 8 лет назад 0
Первый вопрос - какой процесс дает наименьшее количество ошибок. Это не мнение, это количественный эксперимент. Второй вопрос о структуре программного обеспечения. humanengr 8 лет назад 0
OCR относится к общему процессу. Различные программы используют разные алгоритмы и оптимизируются по-разному. Если вы начнете с изображения без потерь, между форматами изображений не должно быть никакой разницы. Если вы начинаете с изображения с потерями, одно приложение OCR может работать лучше, чем другое, в зависимости от изображения. Вам нужно будет провести эксперименты, используя ваши собственные файлы и программное обеспечение. fixer1234 8 лет назад 0
Чтобы было понятно - вы захватываете текст с экрана, а не что-то сканируете? Riking 8 лет назад 0
@ fixer1234 - Я надеялся найти более широкую базу экспериментальных результатов, чем мои тесты. И спасибо всем за взад и вперед; это заставило меня переформулировать мой веб-поиск как "OCR a tiff". Это привело меня к тессеракту (см., Например, обсуждение на https://www.quora.com/Optical-Character-Recognition-What-are-some-available-free-OCR-APIs-iOS-Android-REST -для-сканирования-квитанции). Поскольку это может быть немного прежде, чем я смогу проверить это, я хотел обновить здесь. humanengr 8 лет назад 0
@Riking - да, захват текста с экрана. humanengr 8 лет назад 0
Мне пришло в голову, что снимок экрана - не лучшая отправная точка. Большая часть распознавания текста оптимизирована для основного текста, сканируемого с разрешением около 300 точек на дюйм (если вы не используете программное обеспечение, предназначенное для снимков экрана). Большинство мониторов около 96 точек на дюйм. Дисплей Mac Retina выше, но захват экрана не дает много возможностей для распознавания текста. Он будет свободен от артефактов, но с низким разрешением. Вы можете получить лучшие результаты, распечатывая содержимое, а затем сканируя его со скоростью 250-300 точек на дюйм и сохраняя его со сжатием без потерь. Не используйте JPEG; он разработан с учетом характеристик фотографии и создает тяжелые артефакты с текстом / рисунками. fixer1234 8 лет назад 0
@ fixer1234 Спасибо - попробую, если чистый путь SW не удовлетворителен. humanengr 8 лет назад 0

0 ответов на вопрос

Похожие вопросы