Для водяных знаков на основе изображений есть несколько инструментов, которые обещают их автоматическое удаление. Например:
Все это можно попробовать бесплатно, но для получения желаемого результата требуется лицензия.
Тем не менее, водяной знак этого конкретного файла PDF (который ОП прислал мне по электронной почте) - это не одно изображение, которое повторяется на всех страницах. Как оказалось, PDFCreator жестко закодировал его (почти пиксель за пикселем) в каждый из них. Это значительно затрудняет удаление водяного знака (и приводит к довольно раздутому файлу PDF).
Поскольку водяной знак на самом деле состоит из множества крошечных изображений, вы можете удалить их с помощью редактора PDF (например, Foxit Advanced PDF Editor ), просто выбрав их и нажав Delete. К сожалению, вы должны повторить это для каждой страницы.
Менее трудоемким решением было бы удаление водяного знака программным способом. Нам нужно:
- Pdftk : инструмент для (раз) сжатия и исправления потоков PDF.
- Notepad ++ : текстовый редактор, способный заменить Perl-совместимые регулярные выражения .
меры
Загрузите Pdftk и извлеките pdftk.exe и libiconv2.dll в % windir% \ System32, каталог по пути или в любое другое место по вашему выбору.
Скачайте и установите Notepad ++.
Потоки PDF обычно сжимаются с использованием алгоритма DEFLATE . Это экономит место, но делает источник PDF неразборчивым.
Команда
pdftk original.pdf output uncompressed.pdf uncompress
распаковывает все потоки, поэтому их можно изменить с помощью текстового редактора.
Откройте uncompressed.pdf с помощью Notepad ++, чтобы раскрыть структуру водяного знака.
В этом конкретном случае каждая страница начинается с блока
q 9 0 0 9 2997 4118.67 cm BI /CS/RGB /W 1 /H 1 /BPC 8 ID Ÿ®¼ EI Q
и почти 4000 блоков, как этот. Этот конкретный блок устанавливает только один (
/W 1 /H 1
) пикселей водяного знака.Прокрутка вниз до изменения шаблона показывает, что поток водяного знака имеет длину 95 906 байт (считая новые строки). Точно такой же поток повторяется на каждой странице файла PDF.
Нажмите Ctrl+ Hи установите следующее:
Find: q 9 0 0 9 2997 4118\.67 cm. Replace: (blank) Match case: checked Wrap around: checked Regular expression: selected . matches newline: checked
Регулярное выражение
q 9 0 0 9 2997 4118\.67 cm.
соответствует первой строке указанного выше блока (q 9 0 0 9 2997 4118.67 cm
) и всем следующим 95 881 символам, т. Е. Потоку водяного знака.Нажатие « Заменить все» удаляет его со всех страниц файла PDF.
Водяной знак теперь удален, но в файле PDF есть ошибки (неправильная длина потоков), и он не сжат.
Команда
pdftk uncompressed.pdf output nowatermark.pdf compress
заботится о обоих.
uncompressed.pdf больше не нужен. Вы можете удалить его.
В результате получается тот же PDF-файл без водяного знака (и примерно вдвое меньше).