Как я могу портировать текстовый слой из одного PDF в другой? (в окнах)

418
marlonob

У меня есть несколько файлов в формате .djvu, размер которых невелик, но, к сожалению, mi e-reader не может их отобразить. Я использую DjvuToy, чтобы преобразовать его в PDF, и он сохраняет небольшой размер; но затем, когда я использую Abby FineReader для распознавания и сохранения, размер увеличивается примерно в восемь раз (это происходит только тогда, когда файл содержит цветные или полутоновые изображения). Итак, я полагаю, что было бы возможно взять второй текстовый слой файла и добавить его к первому, чтобы я мог получить как маленький размер, так и OCR. Как я могу это сделать?

Примечание. Исходный файл djvu не имеет текстового слоя, хотя было бы неплохо узнать, как преобразовать djvu в pdf, включая текст напрямую.

2
На самом деле, он конвертирует его в XML, блок за блоком с координатой, которая эффективно отображает местоположения слов / букв Dave 11 лет назад 1

1 ответ на вопрос

0
alexei

Ghostscript может быть использован непосредственно для редактирования свойств PDF при сохранении текстового слоя:

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dColorConversionStrategy=/Gray -dProcessColorModel=/DeviceGray -sOutputFile=output.pdf input.pdf 

От сюда .

Похожие вопросы