Here's a similar duplicate-finding tool, in Perl, under the GPL:
https://github.com/omps/myperlscripts/blob/master/dup-files.pl
You may also wish to explore the -exec option to find(1).
Я пишу скрипт для поиска файлов дупс и группировки их по размеру, а затем по их контрольной сумме MD5.
вот мой сценарий:
find . -type f -printf "%s\n" | sort -rn | uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 | xargs -0 md5sum | sort | uniq -w32 > ./dups.txt
Я хочу убедиться, что мой скрипт генерирует мои файлы дупс по их размеру и MD5 правильно.
В любом случае я могу убедиться, что мой результат верен, или вы поможете мне проверить мой сценарий и дайте мне знать, пожалуйста?
Here's a similar duplicate-finding tool, in Perl, under the GPL:
https://github.com/omps/myperlscripts/blob/master/dup-files.pl
You may also wish to explore the -exec option to find(1).
I recommend you to use fdupes, it's designed for this purpose.
Description :
a program for identifying or deleting duplicate files residing within specified directories