Распознавание текста на страницах, содержащих текст и изображения, в Acrobat XI Pro

Question

Распознавание текста на страницах, содержащих текст и изображения, в Acrobat XI Pro

404

P Fitz 2016-08-21 в 20:55

Почему Acrobat XI Pro не разрешает сканирование с помощью оптического распознавания текста на страницах, содержащих как изображения, так и отображаемый текст? Образец PDF на скриншоте был создан из документа MS Word. Первая строка была напечатана; вторая строка - скриншот отдельного документа.

Это кажется произвольным ограничением. Есть ли веская причина, почему Acrobat не может просто пропустить визуализируемый текст и отсканировать все остальное? Есть ли простой способ запустить OCR только на части страницы?

1

1 ответ на вопрос

1

Accepted Answer · 2016-08-21 22:08:13

Да, это произвольное ограничение, и оно не будет исправлено в Acrobat XI (больше).

Рекомендуется экспортировать страницу в формате TIFF и загрузить ее в Acrobat. Теперь все изображение, и, следовательно, страница может быть OCRd.

Распознавание текста на страницах, содержащих текст и изображения, в Acrobat XI Pro

1 ответ на вопрос

Похожие вопросы