Автор документа PDF был создан?

3505
user1729

Я преподаю в колледже, и некоторое время назад мне было весело наблюдать за студентами, которые копировали работу других студентов, просто взяв их файл слов и «перефразируя» предложения. Таким образом, студент А невинно передавал свои файлы студенту Б, который злонамеренно копировал их работу. Плагиат было легко заметить, но я обнаружил, что когда они сделали это, «автор» файла Word, представленный студентом B, был указан как студент A (студент B был только редактором).

Мои ученики завоевали популярность. На этот раз двое из них представили PDF-файлы.

Опять же, плагиат легко обнаружить. Однако было бы неплохо иметь такие же веские доказательства, как и раньше.

Можно ли узнать автора файла, из которого был создан pdf?

Я пытался использовать ExifTool, который дает метаданные для PDF, но это не достаточно далеко назад. Поэтому я ожидаю, что ответ на мой вопрос будет «нет». Но было бы неплохо, если бы это подтвердилось для меня :-)

2

2 ответа на вопрос

0
jredd

Проверьте PDFParser Дидье Стивенс или другой инструмент, упомянутый на его сайте, и вам может повезти .

Насколько я понимаю, «автор» будет либо содержаться в метаданных, либо нет. В PDF нет свободного места или чего-то подобного, чтобы вы могли вырезать его, но я думаю, вы могли бы попробовать поискать строки, содержащиеся в файле, и искать упоминания имени, которого нет в самом документе.

0
Vinayak

У вас нет определенного способа узнать, является ли человек автором документа, который он / она вам представил, потому что удаление метаданных из документа Word - тривиальная задача.

Личная информация может быть легко удалена с помощью функции проверки документов Microsoft Word (2007 и более поздние версии )

Однако, если ваши студенты не редактировали / не удаляли его до преобразования документа в PDF, вы можете узнать автора, просто открыв документ в Microsoft Reader, Adobe Reader, Foxit Reader и т. Д. И просмотрев его метаданные (Файл → Свойства в Adobe Reader)

Однако, чтобы проверить плагиат, вы можете попробовать конвертировать документ в HTML или простой текстовый формат (просто скопируйте и вставьте содержимое в Блокнот и сохраните как .TXT) и загрузите его на веб-сервер, которым вы управляете (публичные файлы в Dropbox также работают). ) и укажите URL-адрес документа в Copyscape .

Похожие вопросы