На самом деле это довольно сложная алгоритмическая проблема, но, к счастью, она уже была написана. MusicBrainz Picard идентифицирует песни по звуку, а затем присваивает им названия на основе большой базы данных отпечатков пальцев аудио.
Если он идентифицирует дубликат, он присвоит песне то же имя, что и оригинал, с номером, добавленным в конец, так что вы можете легко удалить дубликаты, удалив любую песню, к которой добавлен номер. Прошло несколько лет с тех пор, как я использовал Picard, поэтому возможно удаление дубликатов.
MusicBrainz Picard http://musicbrainz.org/doc/PicardTagger