Каковы шансы, что размер файла останется прежним, если вы фотошопите изображение?

193
Sander Schaeffer

Мой дядя - фотограф с большим количеством фотосессий. Он хранил (дублирует) резервные копии на различных внешних жестких дисках. 90% всех резервных копий одинаковы, но некоторые имеют некоторые изменения, такие как добавленные файлы или фотографии с фотошопом. Теперь я получил ему NAS с настройкой RAID и внешнее NAS для дополнительного резервного копирования основного компьютера, чтобы хранить все его данные на одном устройстве. Он попросил меня дедуплицировать все резервные копии и сохранить только последнюю версию, удалив все копии.

Уже есть несколько приложений (конечно, порекомендуйте одно, если вы знаете одно (Mac / Windows) для идентификации копируемых изображений, когда размер файла и имя файла совпадают. Но мне было интересно ...


TL; DR
Каковы шансы на то, что изображение сохранит тот же размер файла, когда оно будет готово?

//

В качестве альтернативы: Как лучше всего определить идеальные дубликаты изображений?
В случае, если мой предыдущий метод работы (имя файла / размер) не лучший способ пойти на это.


У меня было предположение, что если шансы очень низкие (<1%), я мог бы просто искать и уничтожать и сохранять 1 из каждого файла, у которого и имя, и размер файла равны.

0

1 ответ на вопрос

1
Hefewe1zen

You can compute checksums on originals/copies and compare to see if anything has been changed.

This link explains it a bit more and offers some tools to help.

Прежде чем на самом деле проверить свою ссылку: насколько легко это, 200 изображений одновременно, в общей сложности около 100 000 изображений? Обновление: я прочитал страницу. Контрольные суммы - отличный способ проверить различия. Оставшийся вопрос: насколько легко это для партии Sander Schaeffer 8 лет назад 0
Я уверен, что вы могли бы написать это, если бы вы действительно этого хотели. Однако есть вопрос суперпользователя, который может помочь - http://superuser.com/questions/137155/mass-checksumming-tool-for-windows Hefewe1zen 8 лет назад 0
Дело в том, что большинство программ, ориентированных на резервное копирование (например, встроенная robocopy для Windows), уже используют контрольные суммы, чтобы определить, были ли изменены файлы. Я думаю, что реальная проблема заключается в надежном датировании файлов, поскольку контрольные суммы не скажут вам, какой из них является исходным файлом, а какой - измененным файлом. (отредактируйте: robocopy фактически не может, но большинство все еще делает!) Yorik 8 лет назад 0

Похожие вопросы