Да, это произвольное ограничение, и оно не будет исправлено в Acrobat XI (больше).
Рекомендуется экспортировать страницу в формате TIFF и загрузить ее в Acrobat. Теперь все изображение, и, следовательно, страница может быть OCRd.
Почему Acrobat XI Pro не разрешает сканирование с помощью оптического распознавания текста на страницах, содержащих как изображения, так и отображаемый текст? Образец PDF на скриншоте был создан из документа MS Word. Первая строка была напечатана; вторая строка - скриншот отдельного документа.
Это кажется произвольным ограничением. Есть ли веская причина, почему Acrobat не может просто пропустить визуализируемый текст и отсканировать все остальное? Есть ли простой способ запустить OCR только на части страницы?
Да, это произвольное ограничение, и оно не будет исправлено в Acrobat XI (больше).
Рекомендуется экспортировать страницу в формате TIFF и загрузить ее в Acrobat. Теперь все изображение, и, следовательно, страница может быть OCRd.