Выделение слов в документе PDF

2761
Phenom

Я пытаюсь выделить слова в документе PDF. Однако за словами написано большими буквами «НЕ КОПИРОВАТЬ» по всему документу. Иногда, когда я пытаюсь выделить слова, вместо них выделяются те большие буквы. Как я могу выделить слова, которые я хочу, вместо этих больших букв на заднем плане?

2

7 ответов на вопрос

4
Travis

Это было бы хорошо попробовать:

  1. Откройте PDF
  2. Выбрать все, Скопировать
  3. Вставить в текстовый процессор, такой как Word
  4. Используйте встроенную функцию « Найти и заменить», чтобы найти « НЕ КОПИРОВАТЬ » и заменить ее ничем.
Вы также можете использовать функцию «Экспортировать как текст» в Adobe Reader, а затем удалить «Не копировать». Daniel H 14 лет назад 2
В PDF есть картинки. Я хочу, чтобы PDF выглядело одинаково, за исключением того, что в нем нет этих слов. Phenom 14 лет назад 0
Возможно, вам просто придется отдельно скопировать эти картинки и вставить их в документ Word. В основном полная реконструкция звучит как единственный вариант. Travis 14 лет назад 0
3
ashishsony

Ваш PDF-документ может быть защищен для того, чтобы сделать его не копируемым .. так что это может быть проблемой. Во-вторых, этот текст также может быть водяным знаком ... который можно удалить из программного обеспечения для создания PDF-файлов, такого как Adobe Acrobat proffessional или NitroPDF.

для снятия ограничений вы можете использовать такие сервисы, как http://freemypdf.com/ ... но удаление ограничений из PDF может быть незаконным, что также предупреждается на этом сайте .. так что это зависит от содержимого PDF.

Удачи..

Нелегальная? К чему этот мир приближается. Элементы управления PDF даже не зависят от шифрования или чего-либо еще. Это полностью зависит от программы просмотра PDF, чтобы обеспечить их выполнение на основе некоторых битов, которые установлены в PDF. Это не криптография, поэтому обойтись нечего, поэтому я не понимаю, как может применяться DMCA. Очевидно, что вы можете делать незаконные вещи, такие как нарушение авторских прав, но я не понимаю, как удаление пароля из PDF-файла само по себе может быть незаконным. Peter Cordes 14 лет назад 0
Я также хотел бы отметить, что Okular, читатель PDF с открытым исходным кодом, может быть настроен так, чтобы игнорировать эти ограничения. Вы можете попробовать это приложение ... marcusw 14 лет назад 0
2
pavium

Большие буквы с надписью «НЕ КОПИРОВАТЬ», вероятно, были добавлены, чтобы остановить выделение текста и его копирование в буфер обмена.

Это также затруднит выделение текста и его выделение.

2
blahdiblah

Может быть достаточно начать выделение с другой точки.

Попробуйте выделить с конца отрывка, а не с начала, или чуть раньше текста, который вас интересует.

1
TataBlack

Похоже, что вы хотите удалить водяной знак, сохраняя файл в формате PDF.

В Интернете я нашел файл с тем же фоновым изображением «Не копировать», и, хотя он не мешает вам выбирать / выделять текст, на самом деле это иногда может сделать его немного сложным.

Чтобы не изобретать велосипед, здесь представлены три решения (у вас еще есть PDF в конце) и обходной путь (у вас есть серия изображений):

  1. из исходного документа заново создайте PDF без водяного знака (да, ну, я не думаю, что это применимо, не так ли?);
  2. установить Adobe Acrobat (не Reader) даже в пробной версии и использовать его для удаления водяного знака;
  3. преобразуйте PDF-файл в файл Word, удалите водяной знак, а затем снова экспортируйте его как PDF-файл (результат действительно зависит от форматирования и содержимого вашего PDF-файла);
  4. конвертировать PDF в изображения и удалить водяной знак вручную (может быть, немного работы).

Какой из них лучше, зависит, вероятно, от количества файлов, из которых вы хотите удалить водяной знак, и от того, является ли это условной потребностью или чем-то, что вы будете делать день за днем. Если это только один раз, то я предлагаю попробовать решение Adobe Acrobat, упомянутое в связанном блоге.

0
Peter Cordes

Если вы не можете скопировать, потому что это «зашифровано» и разрешения не позволяют, просто используйте программу для удаления паролей PDF. Однако не существует каких-либо простых в использовании бесплатных программ, о которых я знаю. Даже большинство PDF-программ с открытым исходным кодом обеспечивают бессмысленную чепуху. (хотя pdftotext не волнует, и позволяет вам вывести PDF в текст).

Для собственного использования я изменил источник pdftk, чтобы не проверять ограничения. Недавние обновления библиотеки, основанные на ней, заставили меня заново сделать это изменение, которое я пока не получил, чтобы начать работать, или я бы опубликовал патч.

Я не пытаюсь копировать, я пытаюсь редактировать. Phenom 14 лет назад 0
Да, извини. Вы пробовали несколько программ для редактирования PDF? Есть несколько открытых источников. Peter Cordes 14 лет назад 0
0
harrymc

Вы можете использовать бесплатный PDF Reader, который знает, как извлечь текст:

PDF-XChange Viewer :
может извлекать текст из PDF-страницы / файла.

Foxit Reader :
может конвертировать весь PDF документ в простой текстовый файл.

Оба эти читателя быстрые и простые в использовании.

Похожие вопросы