PDF файл безумно сложен, два слоя, оптическое распознавание невозможно

333
Arthur van Erps

Я имею дело с загадкой. У меня есть этот файл PDF, который я аннотировал и выделил. Думая, что смогу позже скопировать и вставить абзацы. Это оказалось неправильно, копирование текста невозможно. Поэтому я скачал программное обеспечение для распознавания текста «PDF Elements Pro 6». И все же по какой-то причине он не может распознавать текст ... Этот PDF-файл проклят, я вам говорю! Но так как мне нужно это для моей диссертации, я подумал спросить это здесь. Пожалуйста, будь так любезен, чтобы помочь мне. Спасибо.

PDF файл

0
Скриншот это, почисти как можешь. OCR картинка. Учтите, что аннотации, возможно, придется обрабатывать отдельно. Tetsujin 7 лет назад 3
@ Tetsujin Интересно, лучше распечатать его или лучше распечатать в файл и распознать, что было бы лучше, чем снимать скриншоты. (Снимки экрана, по сути, ограничены DPI монитора, в то время как печать может быть намного выше) davidgo 7 лет назад 2
@davidgo - конечно; все, что останавливает распознавание текста, пытающееся прочитать извилистые уровни, потенциально содержащиеся в PDF, и заставляет его просто читать «лист бумаги». Tetsujin 7 лет назад 0
Это более 300 файлов, поэтому печать или снимки экрана невозможны в моем таймфрейме. Но все равно спасибо! Arthur van Erps 7 лет назад 0

0 ответов на вопрос