Создатель стенограммы ИЛИ Речь к тексту

13706
AndyMcKenna

Я слушаю ежедневный подкаст, который длится около 4 часов. Я думаю, что это был бы классный проект, если бы я мог придумать какой-нибудь способ автоматически генерировать его стенограммы. Есть ли программное обеспечение, которое будет «слушать» mp3-файлы и создавать текст того, что они говорят?

Меня не очень интересует различие между тем, кто говорит, потому что я думаю, что это будет слишком много. Говорят 4 основных человека и другие реже.

3

7 ответов на вопрос

3
ToreTrygg

шаги:

  1. Загрузите бесплатный транскрипционный плеер Express Scribe и установите его.
    1. После того, как приложение установлено, вы найдете уже загруженный пример файла диктовки. Это даст вам возможность поиграть с элементами управления и опциями, чтобы настроить приложение в соответствии с вашими потребностями.
    2. В главном интерфейсе нажмите кнопку «Настройки».
    3. Express Scribe позволяет изменять или устанавливать несколько параметров, включая скорость перемотки назад и ускоренной перемотки вперед, горячие клавиши для всей системы (для управления приложением без использования мыши), настройку педального рычага управления (если она есть), автозагрузку файлов из папки LAN или FTP-сервера, выбор разрешенных типов файлов (поддерживается более 20) и настройка модуля распознавания речи.
    4. После настройки параметров вы можете загрузить свой первый аудиофайл. В зависимости от того, откуда вы его получаете, вы можете нажать «Загрузить» (откроется диалоговое окно, которое позволит вам найти файл на вашем ПК), «Загрузить сейчас» (если вы установили соединение по локальной сети или FTP) или «Док». (если вам нужен цифровой диктофон или диктофон).
    5. Выберите аудиофайл в главном окне интерфейса и нажмите кнопку Play, чтобы начать. При необходимости замедлите или увеличьте скорость воспроизведения звука с помощью регулятора скорости в правом нижнем углу. Выше этого элемента управления вы также можете настроить громкость воспроизведения.
    6. Если вы предпочитаете, чтобы Express Scibe находился над вашим текстовым приложением, вы можете выбрать Scribe Mini на главной панели инструментов интерфейса. Как следует из названия, эта опция предоставляет миниатюрную версию приложения.
    7. Как только вы закончите транскрибировать ваши аудиофайлы, вы можете пометить их как «Готово» (удаление файла из списка) или «Отправка» (возврат и отправка по электронной почте исходному отправителю вместе с приложением trext и удаление аудиофайла из списка. ,

подсказки

  • Потратьте некоторое время, чтобы изучить все варианты приложения.
  • Если вы получаете аудиофайл низкого качества, вы можете выбрать Special Audio Processes в меню File, чтобы попытаться очистить его.
  • Когда Express Scribe получает аудиофайл, он сохраняется в C: \ Documents and Settings \ имя пользователя \ Application Data \ NCH Swift Sound \ scribe \ Current
  • Если вы пометили аудиофайл как «Готово», но хотите восстановить его, вы можете восстановить старые файлы из меню «Файл».
Я не думаю, что постер хотел сделать ручную транскрипцию. JeffP 14 лет назад 2
1
studiohack

Одна вещь, которую вы можете попробовать (хотя и не ежедневно), это загрузить аудио в виде видео на Youtube, а затем попросить YouTube транскрибировать видео с надписями на английском языке ... YouTube может сделать это до 24 часов, однако ... Файл заголовка можно загрузить, и вы можете редактировать его самостоятельно, чтобы вы могли скопировать и вставить текст в любое место ...

Фантастический трюк :) Хотя это не идеально, но работает довольно хорошо .. Mohib Sheth 13 лет назад 0
0
Snark

Вам нужно программное обеспечение для распознавания речи .

Для этого существует несколько программ, но я не знаю ни одной, которая могла бы выполнять пакетное преобразование. Я уверен, что это особенность хотя бы одного из них. Обратите внимание, что большинство из них далеко не дешево.

0
DaveParillo

Пробовал волна к тексту ? Это только окна и имеет ограниченную бесплатную пробную версию.

Сколько голосов в этих файлах? Все ли файлы содержат речь одним (обучаемым) голосом? Какое качество звука? Если ответы на эти вопросы не такие: «Только я», «Да» и «Качество CD», @Snark прав, вы должны сделать это по существу вручную. Получить хорошую программу распознавания речи, потратить некоторое время на ее обучение и воспроизводить файлы, пока вы пытаетесь сказать, что они говорят.

Ожидайте 90% - 95% успешной транскрипции, которая звучит великолепно, пока вы не поймете, что означает, что 1 или 2 из каждых 20 слов неверны.

Другие факторы, которые могут повлиять на точность:

  1. Много акронимов в твоей речи
  2. неполные предложения - речь к тексту имеет тенденцию работать намного лучше с подсказками контекста, которые это получает от полных предложений.
0

Я использую Dragon NaturalSpeaking для транскрипции. отличное программное обеспечение!

но это не бесплатно, Amazon предлагает актуальную версию 10 за 45 долларов, если вы посмотрите вокруг, вы получите DNS9 еще дешевле.

Может ли он расшифровать из файла, хотя? Есть много программ, которые делают это, но многие будут слушать только с живого микрофона Paul Betts 15 лет назад 0
Расшифровка записи с помощью Dragon Naturally Speaking: http://wiki.wsu.edu/ctowiki/Transcribing_a_recording_with_Dragon_Naturally_Speaking 15 лет назад 0
Да, это возможно - хотя я, кажется, напоминаю, что вам нужна версия Preferred или выше, чтобы включить эту функцию, хотя я не могу доказать это ... http://www.nuance.com/naturallyspeaking/resources/product- matrix.asp Goyuix 15 лет назад 0
0

Проблема с Dragon Naturally Speaking в таком контексте заключается в том, что вы действительно не сможете пройти учебный процесс, где он научится точно интерпретировать речь. Он не предназначен для такого использования. Может быть, у АНБ есть какое-то программное обеспечение для такого рода вещей. :)

я не знаком с обучением программ распознавания голоса, но кажется, что вы могли бы «тренировать» его, воспроизводя короткие фрагменты подкаста, снова и снова - в основном так же, как вы тренируете его для собственного голоса. конечно, не будет автоматическим, хотя quack quixote 14 лет назад 0
@ Quack Quixote: проблема в том, что уже достаточно сложно приучить его к вашему голосу, не говоря уже о 4-5 других голосах ... Когда я попробовал Dragon 9, его не было рядом с тем, где он должен был быть (или где я думал, что должно быть) ... studiohack 14 лет назад 0
-1
moshen

Я уверен, что Дракон позволит тебе сделать это. У вас могут быть проблемы с точностью, хотя.

Ой, немного дорогой в 199 долларов. AndyMcKenna 15 лет назад 0
Дракон недостаточно силён. Я попробовал это. studiohack 14 лет назад 1
Даже сегодня, в 2014 году, Dragon ничем не отличается. Чтобы он работал хорошо, вам нужно «обучить» его голосу, который говорит, прочитав до 500 слов из текстового файла. Даже после этого он будет пропустить пунктуацию более половины времени. fredsbend 10 лет назад 0