Поскольку вы написали, что выбрали «текст поверх изображения страницы», у вас все равно должны быть оригинальные отсканированные изображения в ваших файлах PDF. Чтобы вернуть его: Если у вас есть Adobe Acrobat, есть опция «Сохранить как»> «Изображение»> «JPG», «TIFF» и т. Д. В противном случае используйте бесплатный редактор PDF, например PDF-XChange Viewer, и в меню «Файл» выберите «Экспорт»> «Экспорт в изображение». и выберите формат изображения, например, TIFF. Таким образом, я могу вернуть свои документы OCRed PDF (текст + изображение) обратно к первоначально отсканированным изображениям.
Вы написали, что пытались экспортировать их обратно в изображения (в Finereader?), И полученные изображения все еще содержали «неправильные символы». Похоже, вы выбрали не «текст поверх изображения страницы», а опцию, которая не сохраняет отсканированное изображение, а восстанавливает его макет с помощью текста OCRed (Adobe Acrobat называет это ClearScan). Эта функция восстанавливает компоновку сканирования как можно ближе к тексту OCRed в наиболее подходящем фонде и не сохраняет отсканированное изображение в PDF.