Распознавание речи - MP3 в текстовое программное обеспечение

22789
pako

Я ищу программу, независимую от динамиков (коммерческую или бесплатную), которая позволила бы мне транскрибировать файлы MP3, содержащие записи речи (особенно подкасты), в текст. Я хотел попробовать Dragon Naturally Speaking, но похоже, что он поддерживает только запись моих собственных речевых записей. Так каковы альтернативы?

15
Комментарий Ави: Я не верю, что это возможно - независимый оратор Ivo Flipse 14 лет назад 0
какая операционная система? studiohack 14 лет назад 0
Windows или Linux. pako 14 лет назад 0

6 ответов на вопрос

7
moioci

Dragon Naturally Speaking импортирует mp3-файлы и пытается их расшифровать. Он предпочитает настроить распознавание голоса на отдельного оратора, но справляется с этим без настройки. Вероятно, будет лучше, если ваши колонки подкастов будут звучать как Tom Brokaw.

Я попробовал Dragon Naturally Speaking, но он сделал ужасную работу для подкастов с неизвестными ораторами. После тренировки программа работала довольно хорошо с моим собственным голосом. pako 14 лет назад 2
Может ли он также импортировать другие аудиофайлы и транскрибировать их? Larry Morries 13 лет назад 1
4
studiohack

Одним из возможных решений было бы загрузить свое видео на Youtube и попробовать автоматические подписи, которые вы можете включить ... это еще не слишком точно, но вы можете загрузить файл подписей и отредактировать его самостоятельно, если это поможет ... как по вопросам авторского права / пиратства для песни, вы можете сделать видео приватным в своем профиле, если это вообще возможно?

@studioback: Этот метод на Youtube применяется только к собственным видео, а не к тем, которые были загружены другими? Tim 13 лет назад 1
@Tim: это для обоих, на самом деле. studiohack 13 лет назад 1
@studiohack: Как сделать это для видео, загруженных другими? Я имею в виду, без загрузки и загрузки как мои собственные видео? Tim 13 лет назад 1
На * большинстве * видео внизу есть значок CC, щелкните его, а затем автоматическая транскрипция ... studiohack 13 лет назад 1
Спасибо! На большинстве видео, которые я видел, нет значка CC. Вы знаете, какие видео есть, а какие нет? Я имею в виду только англоязычные видео. Tim 13 лет назад 0
Я заметил это @Tim, но не знаю, почему это ... studiohack 13 лет назад 0
[Смежный вопрос: Как использовать распознавание речи Google на YouTube без загрузки видео на YouTube?] (Http://superuser.com/q/734939/287352) Ответов пока нет; только что спросил 10 минут назад. fredsbend 10 лет назад 3
2
nvuono

Я бы рекомендовал не пытаться использовать Dragon Naturally Speaking - я написал несколько скриптов на своем джейлбрейкнутом iphone, чтобы скопировать / преобразовать все файлы голосовой почты с моего телефона в папку на моем компьютере, и для них была запущена служба транскрипции Dragon Naturally Speaking.

Результат запуска транскрипции для файлов с разными динамиками был абсолютно непригодным. Я пробовал некоторые альтернативы с открытым исходным кодом, но независимое от говорящего распознавание голоса все еще кажется ограниченным очень маленькими словарями.

1
Juan Antonio Tubío

I'm using http://www.voicebase.com with podcast and videos on english and it works very well. It's free for 50 audio hours.

You can download audio transcription on rtf, srt or pdf.

You can download machine transcriptions about 10-15 minutes after you upload, and sometimes, early.

1
BlueBerry - Vignesh4303

Open Source: CMU Sphinx

Shareware: http://www.e-speaking.com/ (Windows)

Commercial: Dragon NaturallySpeaking (Windows)

You could also try this method if you were trying with osx which can be done using audacity and soundflower

You could also find some relevant links for opensource another shareware worth to try was voxcribecc

If you are an .net programmer you could use this method to make your own kit

0
Zach

Podzinger был бы отличным решением, но я не уверен, что ramp (новое название для компании, которая раньше была EveryZing, которая производила Podzinger), предлагает услугу бесплатно ...

http://en.wikipedia.org/wiki/Podzinger

Похожие вопросы