Оптимальный аудиокодек и соответствующий формат / опция для записи голоса в маленьких и больших аудиториях

Question

Оптимальный аудиокодек и соответствующий формат / опция для записи голоса в маленьких и больших аудиториях

3575

jhstuckey 2012-02-06 в 23:10

OneNote от Microsoft, поставляемый с Office2010, отлично подходит для создания заметок. Включает в себя функцию записи аудио / видео или только аудио. Опции в программе для кодека: а) Windows Media Audio 9, б) Windows Media Audio 9.2, и C) Windows Media Audio 10 Professional. Особенно в случае последнего кодека доступно много форматов: от <0 кбит / с, 8 кГц, моно CBR> до <320 кбит / с, 44 кГц, стерео (A / V> CBR>. Кажется, они делятся на две категории: ( A / V) и не A / V (что бы это ни значило, я не знаю), а затем в соответствии с их кГц, а затем из кбит / с. Также добавлены опции для стерео, моно и так называемой «низкой задержки». CBR».

Исходя из базового понимания этих терминов, можно предположить, что 320 Кбит / с 48 КГц CBR является избыточным для этой философии использования, а 0 Кбит / с 9 кГц, моно CBR оставляет желать лучшего по качеству, особенно с жесткими дисками на 1 ТБ в наши дни. Однако ответ на вопрос о том, какой именно формат лучше всего подходит для этой философии использования, является еще одним вопросом, который может потребовать другого уровня знаний, чем у большинства людей. Можно было бы попробовать «попробуй и посмотри», но этот вопрос, кажется, хорошо подходит суперпользователю, чтобы упустить возможность опубликовать.

Итак, мой вопрос: какая комбинация кодеков / форматов наиболее подходит для философии использования записи звука для заметок в большом или маленьком лекционном зале. Это может быть два вопроса; определенный кодек был бы желателен в комнатах определенного размера?

ps подвопрос: Что обозначает в кодеке Windows Media Audio 10 Professional формат (A / V)?

2

Вы когда-нибудь выясняли разницу между A / V и не-A / V форматами WMA 10? Brian Cauthon 11 лет назад 0

1 ответ на вопрос

2

Accepted Answer · 2012-02-07 03:11:12

Скорость передачи - это насколько хорошо звук может быть аппроксимирован заданным количеством данных. Слишком низкие битрейты приводят к искаженному голосу, странным артефактам и неестественным, сглаженным переходным процессам (короткие звуки, подобные букве T). Более высокие битрейты будут более точно соответствовать исходному контенту, но потенциально бесполезно, если выгоды не будут четко слышны (излишнее количество). Переменная скорость передачи битов всегда будет обеспечивать лучшее качество, чем CBR с постоянной скоростью передачи битов при той же заданной скорости передачи битов, поскольку кодер не будет концентрировать больше усилий (данных) на самых трудных для кодирования частях.

Давайте назовем битрейт: целостность звука .

Частота дискретизации влияет на возможный частотный спектр, который может иметь аудиофайл. Типичное значение составляет 44 кГц, поскольку оно практически охватывает весь слышимый диапазон (0-22 кГц). Снижая частоту дискретизации, вы сбрасываете более высокие частоты, которые больше не будут кодироваться, упрощая кодирование того, что осталось с лучшей целостностью. Однако снижение частоты дискретизации может изменить фоновый шум, который присутствует в большинстве записей, и который может привести к нежелательным побочным эффектам (более резкий шум) и, в конечном итоге, к проблемам сибилирования (звуки "s") или просто к безжизненности - даже при очень высоких битрейтах. Снижение частоты дискретизации может быть очень эффективным компромиссом при работе на очень низких битрейтах; Протоколы передачи голоса по IP-телефонии являются отличной демонстрацией этого.

Давайте назовем частоту дискретизации Audio richness .

Стерео: если ваш звук в основном монофонический, такой как речь, вы теряете половину полосы пропускания, кодируя его как стерео (если это не совместное стерео, но это уже другая история).

Что касается музыки, я думаю, что общеизвестно, что стерео со скоростью 128 кбит / с и 44,1 кГц с MP3 - это переломный момент, когда некоторая деградация музыки ощутима практически для любого человека, но при этом ее можно слушать. Поскольку речь легче кодировать, чем музыка, я думаю, что ее моноэквивалент -MP3 64 кбит / с 44,1 кГц обеспечивает отличную отправную точку с достаточным качеством для большинства целей, но при этом не является излишним.

Наконец, Windows Media Audio должен быть намного более эффективным, чем MP3. Таким образом, вы можете легко сместить эти контрольные точки на 25-40% (например, WMA 40 Кбит / с должно быть аналогично MP3 64 Кбит / с). WMA Professionnal должен быть лучше WMA 9, очевидно уменьшая количество вариантов кодирования с низкой скоростью передачи битов, которые есть у WMA9, и автоматически использует лучший метод для большинства контента. Поэтому, если вам не нужно воспроизвести его на устройствах, которые поддерживают только WMA9, это, вероятно, лучший вариант.

Надеюсь, вы сможете продвинуться вверх (или вниз) оттуда.

Оптимальный аудиокодек и соответствующий формат / опция для записи голоса в маленьких и больших аудиториях

1 ответ на вопрос

Похожие вопросы