Как проверить наличие двух визуально похожих изображений в каталоге, содержащем много подпапок?

366
Anubhav Singh

У меня есть изображение в формате JPEG в подпапке. Я хочу проверить, присутствует ли то же изображение в любой другой подпапке в этой папке. Все подпапки имеют много изображений. Такое же изображение может присутствовать в любой другой подпапке, но определенно не с тем же именем. Что я должен сделать, чтобы проверить, присутствует ли то же изображение в любой другой подпапке в папке, содержащей много подпапок со многими изображениями, а также текстовыми документами.

2
Будет ли имя файла таким же, только с другим расширением? то есть `bird.jpg` может быть` bird.png`? JaredT 6 лет назад 0
@JaredT Может быть или не быть. Я должен на самом деле искать избыточные изображения, чтобы я мог удалить дополнительные изображения, занимающие мое дисковое пространство. Anubhav Singh 6 лет назад 0

1 ответ на вопрос

1
DavidPostill

Что я должен сделать, чтобы проверить, присутствует ли то же изображение в любой другой подпапке?

Для этого я использую dupeGuru - он может найти дубликаты, просматривая содержимое файла, игнорируя имена файлов.

dupeGuru - это кроссплатформенный (Linux, OS X, Windows) инструмент с графическим интерфейсом для поиска дубликатов файлов в системе. Он написан в основном на Python 3 и имеет особенность использования нескольких GUI-инструментариев, причем все они используют один и тот же основной код Python. На OS X уровень пользовательского интерфейса написан на Objective-C и использует Какао. В Linux 7 Windows она написана на Python и использует Qt5.

dupeGuru - это инструмент для поиска дубликатов файлов на вашем компьютере. Он может сканировать либо имена файлов, либо содержимое. Сканирование имени файла имеет алгоритм нечеткого сопоставления, который может найти повторяющиеся имена файлов, даже если они не совпадают. dupeGuru работает на Mac OS X и Linux.

dupeGuru эффективен. Найдите дубликаты файлов за считанные минуты благодаря алгоритму быстрого нечеткого соответствия. dupeGuru не только находит одинаковые имена файлов, но также находит похожие имена файлов.

...

dupeGuru хорош с картинками. Он имеет специальный режим изображения, который позволяет сканировать изображения нечетко, что позволяет находить изображения, которые похожи, но не совсем то же самое.

Источник dupeGuru | находит дубликаты файлов


отказ

Я никак не связан с dupeGuru, я просто конечный пользователь их программного обеспечения.

Это может соответствовать для изображений? Потому что изображения не имеют содержимого. Они представляют собой набор пикселей. Anubhav Singh 6 лет назад 0
Да, смотрите мой ответ. Я регулярно использую его для удаления дубликатов изображений и музыки на жестком диске с данными. DavidPostill 6 лет назад 0
@AnubhavSingh Изображения содержат содержимое, состоящее из заголовка и данных (представляющих пиксели). DavidPostill 6 лет назад 1