- Скорость передачи - это насколько хорошо звук может быть аппроксимирован заданным количеством данных. Слишком низкие битрейты приводят к искаженному голосу, странным артефактам и неестественным, сглаженным переходным процессам (короткие звуки, подобные букве T). Более высокие битрейты будут более точно соответствовать исходному контенту, но потенциально бесполезно, если выгоды не будут четко слышны (излишнее количество). Переменная скорость передачи битов всегда будет обеспечивать лучшее качество, чем CBR с постоянной скоростью передачи битов при той же заданной скорости передачи битов, поскольку кодер не будет концентрировать больше усилий (данных) на самых трудных для кодирования частях.
Давайте назовем битрейт: целостность звука .
- Частота дискретизации влияет на возможный частотный спектр, который может иметь аудиофайл. Типичное значение составляет 44 кГц, поскольку оно практически охватывает весь слышимый диапазон (0-22 кГц). Снижая частоту дискретизации, вы сбрасываете более высокие частоты, которые больше не будут кодироваться, упрощая кодирование того, что осталось с лучшей целостностью. Однако снижение частоты дискретизации может изменить фоновый шум, который присутствует в большинстве записей, и который может привести к нежелательным побочным эффектам (более резкий шум) и, в конечном итоге, к проблемам сибилирования (звуки "s") или просто к безжизненности - даже при очень высоких битрейтах. Снижение частоты дискретизации может быть очень эффективным компромиссом при работе на очень низких битрейтах; Протоколы передачи голоса по IP-телефонии являются отличной демонстрацией этого.
Давайте назовем частоту дискретизации Audio richness .
- Стерео: если ваш звук в основном монофонический, такой как речь, вы теряете половину полосы пропускания, кодируя его как стерео (если это не совместное стерео, но это уже другая история).
Что касается музыки, я думаю, что общеизвестно, что стерео со скоростью 128 кбит / с и 44,1 кГц с MP3 - это переломный момент, когда некоторая деградация музыки ощутима практически для любого человека, но при этом ее можно слушать. Поскольку речь легче кодировать, чем музыка, я думаю, что ее моноэквивалент -MP3 64 кбит / с 44,1 кГц обеспечивает отличную отправную точку с достаточным качеством для большинства целей, но при этом не является излишним.
Наконец, Windows Media Audio должен быть намного более эффективным, чем MP3. Таким образом, вы можете легко сместить эти контрольные точки на 25-40% (например, WMA 40 Кбит / с должно быть аналогично MP3 64 Кбит / с). WMA Professionnal должен быть лучше WMA 9, очевидно уменьшая количество вариантов кодирования с низкой скоростью передачи битов, которые есть у WMA9, и автоматически использует лучший метод для большинства контента. Поэтому, если вам не нужно воспроизвести его на устройствах, которые поддерживают только WMA9, это, вероятно, лучший вариант.
Надеюсь, вы сможете продвинуться вверх (или вниз) оттуда.