Является ли это возможным?
Нет.
Когда вы смотрите на музыкальную пьесу с точки зрения обработки сигнала, это просто сигнал с определенными частотами. Люди хороши в психоакустической фильтрации человеческой речи или пении из музыки, но компьютер не может этого сделать.
Проблема заключается в том, что и музыка, и вокал смешиваются вместе, и что частоты человеческого голоса (300 Гц - 3,4 кГц) перекрываются большинством музыкальных инструментов (например, фортепиано от 28 Гц до 4,1 кГц). Таким образом, вы не можете обрезать определенные частоты и получить взамен только вокал. Это просто неосуществимо.
«… Но есть программы« удаления вокала »?» Вы можете спросить.
Некоторые программы удаления вокала используют тот факт, что поп-песни обычно микшируются таким образом, что вокал одинаково громкий на левом и правом каналах, что делает их центрированными в стереопанораме. Если вы отфильтруете все, что отцентрировано, у вас останутся панорамированные инструменты (обычно гитары), но вы также удалите другие центрированные инструменты, такие как басовые барабаны, бас-гитара или малые барабаны.
Так что, проще говоря, даже если вы найдете другие программы, такие как Vocal Remover или та, что в Audacity, это может звучать просто глупо. Потому что не каждая песня микшируется таким образом, и эффекты реверберации на вокале появляются и в стереопанораме.