Как уже упоминалось, запись для произнесенного слова на частоте 22,05 кГц сама по себе не является «плохой»; но он также не может быть «исправлен», потому что в записи нет информации, которую можно было бы подчеркнуть. Вы можете работать только с тем, что уже есть.
Некоторое объяснение ... Человеческий голос действительно наиболее различим на частоте 2-6 кГц. Вот где все согласные и что действительно помогает слушателю решить, что на самом деле говорится; это также то, почему засунув пальцы в уши, вы понимаете, что блокирует эти более высокие частоты.
В речи есть информация выше 6 кГц, но она намного выше, а на 11 кГц остается очень мало полезной информации.
Так что - для произнесенного слова они используют частоту дискретизации 22,05 кГц.
Существует очень сложный аудиоанализ, называемый теоремой выборки Найквиста-Шеннона, часто называемый пределом Найквиста, который в основном сводится к
«Наивысшая частота звука, которая может быть записана в аудиофайл, составляет половину частоты дискретизации».
Это соответствует примерно 11 кГц при записи 22,05 кГц.
Это достаточно для человеческого голоса.
Это также означает, что больше нет никакой информации выше, с которой можно работать, даже если вы измените частоту дискретизации до 44,1 кГц [качество звука CD].
На вашей аудиокниге.
Проблема, насколько я понимаю, в том, что читатель был немного ближе к микрофону. Это подчеркивает более низкие частоты, из-за того, что называется эффектом близости . Не нужно вдаваться в подробности здесь, но в целом это делает запись немного скучной.
Он также несколько сжат - динамический диапазон уменьшен, поэтому тихие биты громче, а громкие биты тише. Это должно помочь понять, но это было сделано не так хорошо, как могло бы быть, и имеет тенденцию подчеркивать бас еще больше. Единственная причина, по которой я могу придумать, заключается в том, что это заставляет читателя звучать «более мужественно, более авторитетно» ... но на самом деле не помогает понять в малейшей степени: /
Что нам нужно сделать, это уменьшить басы, подчеркнуть максимумы и попытаться снять акцент с некоторых тяжелых компрессий.
Большая часть этого может быть сделана в Audacity, в большей или меньшей степени, но я чувствую себя более комфортно в Cubase, поэтому позвольте мне показать вам там ...
Большинство людей сказали бы вам сначала нормализовать файл.
Не делайте этого сначала - вы убьете свой потенциальный запас.
Если вам нужно сделать это вообще, делайте это в последнюю очередь .
Также обратите внимание, что вы не можете "отменить" сжатие, которое уже было применено - это было бы эквивалентно возвращению яиц и муки из выпеченного пирога - вместо этого вы можете попытаться смягчить его только в наиболее пострадавших районах.
Если все, с чем вам нужно работать, это эквалайзер, то вы можете попробовать уменьшить уровни ниже 250 Гц, плавно опустившись ниже этого уровня. Затем вы можете попытаться получить некоторые согласные обратно, добавив противоположный наклон выше, возможно, 2 или 3 кГц.
В 3:40 я заметил раздражающий щелчок или сильный удар по губам, который я просто выбрал и повернул к нулю - вы можете получить все умные с помощью кликера, но это не стоило усилий.
Моим оружием выбора для любой спасательной операции, подобной этой, является многополосный компрессор.
Я нашел бесплатный многоканальный комп для Audacity, хотя сам не пробовал, так что YMMV - https://www.gvst.co.uk/gmulti.htm
Я использую значительно более дорогой Waves LinMB, но общая идея та же. Вот как я это настроил ...
На картинке видно, что я очень сильно бью нижний конец, пытаясь убрать этот чрезмерный бум. Середину я почти не трогал. Максимумы Я увеличил их выходной уровень, в то же время применив небольшое сжатие только для того, чтобы некоторые из более тяжелых S и т. Д. Не становились слишком резкими. Кроме того, на данный момент я вообще не увеличил общую громкость - у нас все еще есть достаточно места, чтобы поиграть, и будет лучше, если, когда вы включаете и выключаете свой эффект для сравнения, вы не просто дурачите себя громкостью менять.
Быстрые примеры -
до ...
https://soundcloud.com/graham-lee-15/antal-vegh-orig?in=graham-lee-15/sets/intelligibility-fix
после...
https://soundcloud.com/graham-lee-15/antal-vegh-linmb?in=graham-lee-15/sets/intelligibility-fix
На данный момент, когда вы довольны тем, как это звучит, теперь вы можете нормализовать.
Обратите внимание, что мои примеры с более высокой частотой дискретизации, потому что я не могу экспортировать напрямую в 22.05. Это никак не повлияет на результат.