Сравнивает ли какое-либо экономически осуществимое общедоступное программное обеспечение аудиофайлы, чтобы определить, являются ли они обманщиками?

365
jcolebrand

В духе этого вопроса https://unix.stackexchange.com/questions/3037/is-there-an-easy-way-to-replace-duplicate-files-with-hardlinks есть ли какое-либо программное обеспечение, которое будет автоматически анализировать библиотека моих песен и найти те, которые действительно являются дубликатами, которые можно удалить? Вот пример:

Мой брат был большим поклонником ремиксов на CD. Он брал все свои любимые треки и ставил их на один. Тогда он использовал бы мой компьютер, чтобы прочитать их. Так что теперь у меня есть 6 копий Californication на моем жестком диске, и все они имеют разницу в несколько байтов в целом. У меня есть сотни песен в моей библиотеке, как это. Я хочу урезать их до уникальности. Они не все имеют правильные теги ID3, поэтому выясните, что Untitled(74).mp3это то же californication.mp3самое, что whowrotethis.mp3и хитрое.

Я НЕ хочу рассматривать концертный альбом и разрыв студийного альбома как одно и то же (если бы я просто сопоставил имя исполнителя / исполнителя, я бы закончил с этим сценарием, который мне не подходит).

Я использую Windows (выбираю вашу платформу) и получу OSX box позже в этом году. Я буду запускать Linux, если это то, что нужно для его организации. У меня есть незащищенные файлы AAC и mp3. Бонусные баллы за работу с WAV или MIDI и бонусные баллы за конвертацию из них в MP3 (я всегда могу использовать Audacity и LAME, чтобы конвертировать позже, если я знаю, что они совпадают, или конвертировать заранее, если это облегчит задачу).

Есть ли какие-либо предложения, или мне нужно перейти к Программистам или SO и составить список требований для сравнения этих вещей и написать программное обеспечение самостоятельно?

2
«Бонусные баллы» означает, что я предложу вознаграждение любому, кто может это сделать :-) Josh 13 лет назад 0
Ну, у меня нет очков, чтобы предложить награду, я не думаю, но если вы хотите идти вперед `: P` jcolebrand 13 лет назад 0
Я тоже хочу получить ответ, поэтому, если вы его не получите, я предложу вознаграждение. Josh 13 лет назад 0
Программисты и StackOverflow предназначены для программирования и задач и инструментов для программистов, а не для разработки программного обеспечения. Если вы отправили запрос, подобный этому, он будет удален в довольно короткие сроки, так что не делайте этого. David Ma 13 лет назад 0
@ Дэвид ~ Я знаю немного о сети. Я ценю вашу собранную репутацию 2 тыс., Но я мод в одной из сетей, и я знаю все о SO и программистах и ​​более 10 тыс. Повторений в сети в целом. Смотрите любой из моих профилей. Но я ценю беспокойство. Просто я знаю, как формулировать вопросы, такие как «Каков наилучший способ обобщить форму волны для песни в формате MP3, чтобы я мог сопоставить ее [генетический код] с аналогичными работами, чтобы определить сходство?» это очень ответственный вопрос. Возможные ответы: WAV или перекодировать все песни в 64kbps и придерживаться кадров mod8. jcolebrand 13 лет назад 1

1 ответ на вопрос

2
David Ma

На самом деле это довольно сложная алгоритмическая проблема, но, к счастью, она уже была написана. MusicBrainz Picard идентифицирует песни по звуку, а затем присваивает им названия на основе большой базы данных отпечатков пальцев аудио.

Если он идентифицирует дубликат, он присвоит песне то же имя, что и оригинал, с номером, добавленным в конец, так что вы можете легко удалить дубликаты, удалив любую песню, к которой добавлен номер. Прошло несколько лет с тех пор, как я использовал Picard, поэтому возможно удаление дубликатов.

MusicBrainz Picard http://musicbrainz.org/doc/PicardTagger

Я несколько забыл об этом инструменте, но, похоже, я помню, что он работал, дактилоскопируя их в базе данных, и у меня, кажется, большое число, которое, по-видимому, плохо распознает отпечатки пальцев. ~ Что касается алгоритмически сложной проблемы, я вижу это как вызов. Мне нужно кое-что узнать о разборе MP3 и поиске уникальной формы волны, которую я могу использовать для снятия отпечатков пальцев с ряда битрейнгов, но это может быть очень полезно для обучения. В противном случае я вижу в этом способ научиться делать что-то полезное для мира в целом. Теперь я вижу и другие потенциальные результаты. jcolebrand 13 лет назад 0

Похожие вопросы