найти дубликаты файлов по размеру и MDF

413
user231620

Я пишу скрипт для поиска файлов дупс и группировки их по размеру, а затем по их контрольной сумме MD5.

вот мой сценарий:

find . -type f -printf "%s\n" | sort -rn | uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 | xargs -0 md5sum | sort | uniq -w32 > ./dups.txt 

Я хочу убедиться, что мой скрипт генерирует мои файлы дупс по их размеру и MD5 правильно.

В любом случае я могу убедиться, что мой результат верен, или вы поможете мне проверить мой сценарий и дайте мне знать, пожалуйста?

0

2 ответа на вопрос

1
D McKeon

Here's a similar duplicate-finding tool, in Perl, under the GPL:

https://github.com/omps/myperlscripts/blob/master/dup-files.pl

You may also wish to explore the -exec option to find(1).

Спасибо, но пока не знаю много в Perl :( Большое спасибо user231620 10 лет назад 0
0
Gilles Quenot

I recommend you to use fdupes, it's designed for this purpose.

Description :

a program for identifying or deleting duplicate files residing within specified directories

Я не могу установить fdupes :( это моя проблема :( user231620 10 лет назад 0

Похожие вопросы