Распознавание текста на страницах, содержащих текст и изображения, в Acrobat XI Pro

367
P Fitz

Почему Acrobat XI Pro не разрешает сканирование с помощью оптического распознавания текста на страницах, содержащих как изображения, так и отображаемый текст? Образец PDF на скриншоте был создан из документа MS Word. Первая строка была напечатана; вторая строка - скриншот отдельного документа.

Это кажется произвольным ограничением. Есть ли веская причина, почему Acrobat не может просто пропустить визуализируемый текст и отсканировать все остальное? Есть ли простой способ запустить OCR только на части страницы?

enter image description here

1

1 ответ на вопрос

1
Max Wyss

Да, это произвольное ограничение, и оно не будет исправлено в Acrobat XI (больше).

Рекомендуется экспортировать страницу в формате TIFF и загрузить ее в Acrobat. Теперь все изображение, и, следовательно, страница может быть OCRd.

Похожие вопросы