Как отсканированный документ может иметь несколько слоев в итоговом PDF?

1850
Mike Skott

Мы с коллегой находимся в разногласиях по поводу деталей сделки. В качестве подтверждения своих требований я попросил его выслать мне копию формы счета-фактуры, которую он получил вместе с заказом. Коллега говорит, что он использовал сканер, который был частью большого многофункционального копира, когда он сканировал счет в PDF-документ.

Получив документ в формате PDF, я подумал, что некоторые вещи о сканировании выглядят необычно. В попытке взглянуть поближе я решил открыть документ в своей копии Adobe Photoshop CS5. Сразу после открытия я заметил, что документ имеет несколько слоев. Фоновый слой для красочно окрашенного водяным знаком фона счета, другой слой содержит большую часть статического формата текста, который является общим для всех счетов этой компании. Еще один слой содержит большую часть текста, который изменяется в зависимости от заказа, и еще один слой с подписью менеджера по отгрузке со склада.

Я знаю, что некоторые сканеры могут использовать OCR (оптическое распознавание символов) для встраивания дополнительной информации в PDF, чтобы ее можно было искать и редактировать, но я никогда не видел информацию, полученную в результате сканирования, на несколько слоев в документе, подобном этому. Мой вопрос: каким образом любой сканер может разделить содержимое отсканированного физического документа на несколько слоев в файле PDF?

2
https://www.youtube.com/watch?v=hljkZxgogcY&feature=youtu.be&t=13 Это ваше странствие напоминает мне о том, что там написано на голограмме. Psycogeek 9 лет назад 0
Программное обеспечение OCR может отделять «картинки» от текста, тогда они будут иметь эти картинки в объектах (блоках), которые затем можно будет отформатировать в документах Word или PDF. То, что он не может сделать (легко), это создать полностью правильный пустой счет в качестве фона, в зависимости от многих вещей. Таким образом, вы можете проанализировать этот фон и подумать, оставила ли программа там дырки для заполнения, или это был какой-то пустой счет-фактура. В любом случае, можно было что-то сделать в фотошопе (все еще можно), вы можете запросить простое сканирование без ocr, как это было бы приемлемо для «доказательства», но вы все еще в том же положении, доверять или нет. Psycogeek 9 лет назад 0
Если документ был просто отсканирован, не было бы слоев. Слои, которые вы описываете, будут от создания PDF из программного обеспечения, которое создает счет. Поэтому он либо отправил вам копию счета, который уже был в электронном виде, либо создал его. Это та же проблема, что была поднята в свидетельстве о рождении президента Обамы. Утверждалось, что он был отсканирован с печатной копии, которая предшествовала компьютерным записям, но файл содержал обширные слои, которые были модификациями. fixer1234 9 лет назад 1

3 ответа на вопрос

0
Just Passing Through

Я считаю, что «слои», которые вы видите, называются «аннотациями» в спецификациях PDF: http://www.adobe.com/content/dam/Adobe/en/devnet/acrobat/pdfs/pdf_reference_1-7.pdf

Похоже, сканер создан с использованием PDF с изображением документа и аннотирован его текстом из OCR и водяным знаком. Наличие там подписи в качестве отдельной аннотации кажется мне странным.

You might want to add your answer - http://www.snopes.com/politics/obama/birthers/birthcertificate.asp, scanners may be smart enough to pull the signature, etc out as well. dsolimano 7 лет назад 0
0

Я склонен склоняться к практическим решениям. Здесь вы хотите знать, является ли то, что вы получили, подлинным или нет.

Итак, незаметно найдите марку и модель многофункционального устройства. Затем:

  • Отправьте это здесь. Один из нас может знать, что он может сделать, а что нет.
  • Свяжитесь с производителем. Начните с их сайта, затем, возможно, онлайн-чата или телефонного звонка. Они скажут вам, что он может сделать.
  • Если у вас есть навыки общения, найдите магазин, в котором продается устройство, и попросите продавца показать, что он может сделать.
-2
Roy Pat

This is precisely why we have never seen a photocopy of Obama's birth certificate. It is a scanned image, not a photocopy. The two are completely and utterly different and one cannot be easily manipulated without leaving evidence. Obamas scanned birth certificate is layered and may or may not be real. Best example you can find that answers your question.

Конечно, любой документ без таких функций безопасности, как деньги, можно легко манипулировать. Это включает как оригинальный электронный документ, так и любую его растеризованную копию. Ваш ответ мне кажется неверным. Это также не отвечает на вопрос ОП. Daniel B 8 лет назад 1
Добро пожаловать в Супер пользователя! Пожалуйста, внимательно прочитайте вопрос. Ваш ответ ** не ** отвечает на оригинальный вопрос. DavidPostill 8 лет назад 0

Похожие вопросы