PDF файл безумно сложен, два слоя, оптическое распознавание невозможно
333
Arthur van Erps
Я имею дело с загадкой. У меня есть этот файл PDF, который я аннотировал и выделил. Думая, что смогу позже скопировать и вставить абзацы. Это оказалось неправильно, копирование текста невозможно. Поэтому я скачал программное обеспечение для распознавания текста «PDF Elements Pro 6». И все же по какой-то причине он не может распознавать текст ... Этот PDF-файл проклят, я вам говорю! Но так как мне нужно это для моей диссертации, я подумал спросить это здесь. Пожалуйста, будь так любезен, чтобы помочь мне. Спасибо.
Скриншот это, почисти как можешь. OCR картинка. Учтите, что аннотации, возможно, придется обрабатывать отдельно.
Tetsujin 7 лет назад
3
@ Tetsujin Интересно, лучше распечатать его или лучше распечатать в файл и распознать, что было бы лучше, чем снимать скриншоты. (Снимки экрана, по сути, ограничены DPI монитора, в то время как печать может быть намного выше)
davidgo 7 лет назад
2
@davidgo - конечно; все, что останавливает распознавание текста, пытающееся прочитать извилистые уровни, потенциально содержащиеся в PDF, и заставляет его просто читать «лист бумаги».
Tetsujin 7 лет назад
0
Это более 300 файлов, поэтому печать или снимки экрана невозможны в моем таймфрейме. Но все равно спасибо!
Arthur van Erps 7 лет назад
0
0 ответов на вопрос
Похожие вопросы
-
3
Почему Macbook Pro Unibody вылетает в спящем режиме под Windows?
-
14
PDF Viewer в Windows
-
8
Firefox PDF плагин для просмотра PDF в браузере на Windows
-
-
2
iTunes на Mac: как использовать внешнюю музыкальную библиотеку на NAS (общий ресурс Windows)?
-
4
Как я могу конвертировать ISO-образ CD в формат bin / cue на Mac?
-
6
Как вы отключите звук запуска на Mac?
-
5
Почему мой Macbook сильно нагревается при использовании Boot Camp?
-
5
Macbook Pro продолжает извлекать все, что я положил во внутренний оптический привод
-
4
Есть ли альтернативы TextExpander в Mac OS X?
-
6
Способ переноса данных Time Machine на новый диск