Это было бы хорошо попробовать:
- Откройте PDF
- Выбрать все, Скопировать
- Вставить в текстовый процессор, такой как Word
- Используйте встроенную функцию « Найти и заменить», чтобы найти « НЕ КОПИРОВАТЬ » и заменить ее ничем.
Я пытаюсь выделить слова в документе PDF. Однако за словами написано большими буквами «НЕ КОПИРОВАТЬ» по всему документу. Иногда, когда я пытаюсь выделить слова, вместо них выделяются те большие буквы. Как я могу выделить слова, которые я хочу, вместо этих больших букв на заднем плане?
Это было бы хорошо попробовать:
Ваш PDF-документ может быть защищен для того, чтобы сделать его не копируемым .. так что это может быть проблемой. Во-вторых, этот текст также может быть водяным знаком ... который можно удалить из программного обеспечения для создания PDF-файлов, такого как Adobe Acrobat proffessional или NitroPDF.
для снятия ограничений вы можете использовать такие сервисы, как http://freemypdf.com/ ... но удаление ограничений из PDF может быть незаконным, что также предупреждается на этом сайте .. так что это зависит от содержимого PDF.
Удачи..
Большие буквы с надписью «НЕ КОПИРОВАТЬ», вероятно, были добавлены, чтобы остановить выделение текста и его копирование в буфер обмена.
Это также затруднит выделение текста и его выделение.
Может быть достаточно начать выделение с другой точки.
Попробуйте выделить с конца отрывка, а не с начала, или чуть раньше текста, который вас интересует.
Похоже, что вы хотите удалить водяной знак, сохраняя файл в формате PDF.
В Интернете я нашел файл с тем же фоновым изображением «Не копировать», и, хотя он не мешает вам выбирать / выделять текст, на самом деле это иногда может сделать его немного сложным.
Чтобы не изобретать велосипед, здесь представлены три решения (у вас еще есть PDF в конце) и обходной путь (у вас есть серия изображений):
Какой из них лучше, зависит, вероятно, от количества файлов, из которых вы хотите удалить водяной знак, и от того, является ли это условной потребностью или чем-то, что вы будете делать день за днем. Если это только один раз, то я предлагаю попробовать решение Adobe Acrobat, упомянутое в связанном блоге.
Если вы не можете скопировать, потому что это «зашифровано» и разрешения не позволяют, просто используйте программу для удаления паролей PDF. Однако не существует каких-либо простых в использовании бесплатных программ, о которых я знаю. Даже большинство PDF-программ с открытым исходным кодом обеспечивают бессмысленную чепуху. (хотя pdftotext не волнует, и позволяет вам вывести PDF в текст).
Для собственного использования я изменил источник pdftk, чтобы не проверять ограничения. Недавние обновления библиотеки, основанные на ней, заставили меня заново сделать это изменение, которое я пока не получил, чтобы начать работать, или я бы опубликовал патч.
Вы можете использовать бесплатный PDF Reader, который знает, как извлечь текст:
PDF-XChange Viewer :
может извлекать текст из PDF-страницы / файла.
Foxit Reader :
может конвертировать весь PDF документ в простой текстовый файл.
Оба эти читателя быстрые и простые в использовании.