Вы можете загрузить библиотеку XPDF с http://www.foolabs.com/xpdf/download.html для Linux и Windows. Затем запустите, pdfimages -j input.pdf output
и вы должны получить output-000.jpg
, output-001.jpg
и т. Д. Кроме того, проверьте http://linuxcommand.org/man_pages/pdfimages1.html для получения дополнительных возможностей использования.
Извлечение фоновых изображений из файла PDF?
У меня есть файл PDF, содержащий карты здания, в котором я работаю, здесь:
http://www.libsys.und.edu/dev/FloorPlans_All.pdf
Исходные исходные файлы были утеряны, и меня попросили извлечь изображения карты, желательно без текста и значков, наложенных поверх них. Это оказалось досадно трудным.
До сих пор я пробовал следующие программы с графическим интерфейсом:
- Adobe Reader: позволяет мне выбирать текст, но не фоновые изображения
- FoxIt PDF Viewer: позволяет мне выбирать текст, но не фоновые изображения
- XPDF в Ubuntu 10.10: позволяет выбирать текст, но не фоновые изображения
А также следующие программы командной строки:
- pdfimages: извлекает значки, обозначающие ванные комнаты просто отлично, но не фоновые изображения
- pdftohtml: так же, как pdfimages, плюс он делает плохо размеченный HTML-документ
- pdfextract: такой же, как pdfimages
- конвертировать: успешно сохраненные изображения, но с записанным в них текстом
Я даже пытался открыть PDF вручную в текстовом редакторе и извлечь объекты потока, вставив их в новый файл и сохранив его с расширением .jpg, .png или .bmp (каждый по очереди). Учитывая то, как мало я знаю о внутренней структуре файлов PDF, неудивительно, что это не сработало.
Итак ... есть ли способ получить изображения карты из этой вещи, не получая также текст и значки?
6 ответов на вопрос
- Популярные
- Новые
- С комментариями
- Активные
Хорошо, после того, как я возился с этим в течение 5 минут, мой анализ состоит в том, что PDF даже страннее, чем я думал, и это о чем-то говорит.
Не уверен, каков ваш бюджет, но с Acrobat Pro Extended 9 вы можете использовать:
A. Инструменты, Расширенное редактирование, Touchup Text Tool
-Select All -Right click, Properties -Text tab -Select a standard font (e.g. Arial), close -Hit Delete
B. Инструменты, Расширенное редактирование, Инструмент Touchup Object
-Выберите объект (вы можете получить большинство, но не все, из них (например, значки компьютеров учеников не могут быть выбраны), затем удалите
Вот как выглядела Страница 1 после быстрой очистки: http://dl.dropbox.com/u/7434256/p1test.pdf
Возьмите PDF, созданный Крейгом Н, и немного оптимизируйте его, запустив его через Ghostscript. В Windows командная строка:
gswin32c.exe ^ -o p1test-gs-optimized.pdf ^ -sDEVICE=pdfwrite ^ -dPDFSETTIINGS=/prepress ^ p1test.pdf
В Linux / Unix / Mac OS X выполните:
gs \ -o p1test-gs-optimized.pdf \ -sDEVICE=pdfwrite \ -dPDFSETTIINGS=/prepress \ p1test.pdf
Это уменьшит размер файла с 3.000 кБайт до 60 кбайт без потери содержимого. Тогда его импорт в Inkscape (или InDesign, Illustrator, ...) должен быть намного быстрее ....
... вы можете попробовать Photoshop. Он читает PDF, и «возможно», он возник в PS и, возможно, все еще содержит слои ... но это очень далеко.
In a Linux environment I have used pdfmod to extract all the images in one go. See https://wiki.gnome.org/Apps/PdfMod or, for Ubuntu users, https://apps.ubuntu.com/cat/applications/pdfmod/
To download and install it in Ubuntu, it is sufficient to type sudo apt-get install pdfmod
.
- Start the pdfmod GUI (type in
pdfmod
in the dashboard or command-line terminal) - Open the PDF document
- Select all the pages (or any that you want to extract the images from)
- The Edit menu item will present the option of extracting as many images as they can be extracted within the selected range (
export n images
, with n the appropriate number). You can also access this command by hovering with your mouse on the selection and activating the local menu (right-click for the right-handed). - Once you go ahead with this, a new window will open up where you select the location to save the images into.
Hope this helps.
Откройте документ на экране, увеличьте изображение, чтобы сделать его как можно больше, но все еще видно. Нажмите alt + prnt scrn (или эквивалент в вашей операционной системе), и он должен сделать снимок экрана программы. Теперь откройте краску или ваш любимый графический редактор (фотошоп, gimp и т. Д.), Вставьте изображение и обрежьте все, что вам не нужно.
Похожие вопросы
-
14
PDF Viewer в Windows
-
8
Firefox PDF плагин для просмотра PDF в браузере на Windows
-
17
Как распечатать документы в pdf
-
-
2
Firefox печать в PDF-файл
-
4
PDF Reader для iPhone
-
8
Программное обеспечение для получения аудио с домашних DVD?
-
6
Извлечение файла .zip в Program Files (x86)
-
6
Adobe Reader: запомните пароль для файла PDF
-
4
Можно ли добавить свои собственные закладки / вкладки в файл PDF?
-
5
Какие альтернативы Adobe Acrobat имеют функции подписи PDF