найти дубликаты файлов по размеру и MDF

Question

449

user231620 2013-06-16 в 19:53

Я пишу скрипт для поиска файлов дупс и группировки их по размеру, а затем по их контрольной сумме MD5.

вот мой сценарий:

find . -type f -printf "%s\n" | sort -rn | uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 | xargs -0 md5sum | sort | uniq -w32 > ./dups.txt

Я хочу убедиться, что мой скрипт генерирует мои файлы дупс по их размеру и MD5 правильно.

В любом случае я могу убедиться, что мой результат верен, или вы поможете мне проверить мой сценарий и дайте мне знать, пожалуйста?

0

2 ответа на вопрос

1

0

Gilles Quenot 2013-06-16 в 22:28

I recommend you to use fdupes, it's designed for this purpose.

Description :

a program for identifying or deleting duplicate files residing within specified directories

Я не могу установить fdupes :( это моя проблема :( user231620 11 лет назад 0

Accepted Answer · 2013-06-16 23:27:26

D McKeon 2013-06-16 в 23:27

Here's a similar duplicate-finding tool, in Perl, under the GPL:

You may also wish to explore the -exec option to find(1).

Спасибо, но пока не знаю много в Perl :( Большое спасибо user231620 11 лет назад 0