Как я могу преобразовать уже записанную речь в текст?

66206
icu222much

Я ищу программное обеспечение, которое позволило бы мне ввести аудиофайл (.wav .mp3 ...) и вывести текст аудиофайла.

Такое программное обеспечение существует? Я нашел только программное обеспечение, которое преобразует (живой) голос в текст, но не аудио файлы в текст.

13

5 ответов на вопрос

3
Louis

Я не знаю ничего, что вы можете скачать, но я могу сделать неуклюжее предложение.

Google создал такое программное обеспечение, я знаю, что они используют его в YouTube и Google Voice.

Это не очень хорошо, но вы можете позвонить в свою учетную запись Google Voice, позволить автоответчику поднять трубку и воспроизводить звук во время записи голосовой почты.

Вы получите расшифровку голосовой почты в своем письме.

Я предлагаю это только потому, что вам не нужно тренировать движок Google.

Творческий! Никогда не думал об этом. icu222much 12 лет назад 1
Во французском это (все еще) не действительно работает. Это может быть от 20 до 30%, что впечатляет, но, к сожалению, не совсем функционально. JinSnow 9 лет назад 0
2
Dennis Wurster

Это не дает конкретного ответа на ваш вопрос, но в вашей ситуации я хотел бы распространить его как работу Amazon Mechanical Turk. Вы, вероятно, получите лучшие результаты и заплатите наименьшее количество долларов таким образом.

Здорово. Никогда не знал, что Amazon предоставляет услуги поиска толпы. icu222much 12 лет назад 0
1
ckhan

eMicrophones выпускает коммерческий продукт под названием Windows Speech Recognition Toolkit, который добавляет множество полезных возможностей в Windows Speech Recognition, включая возможность транскрибировать файлы * .WAV (при условии, что они от вас, т.е. запись, как будто вы говорите, а не произвольный голос), Из списка возможностей:

Транскрипция читает файлы .WAV с цифрового рекордера и транскрибирует их в текст. Это предназначено для использования человеком, который имеет личный профиль пользователя и диктует то же, что и перед компьютером, используя правильные формулировки и знаки препинания. Он не предназначен для расшифровки нескольких голосов с собрания.

1
Len

Вы можете добавить программное обеспечение VOICENOTE (бесплатно) в Google Voice. Это превращает разговор в текст. Затем просто воспроизведите запись голоса на вашем динамике прямо в микрофон в VOICENOTE.

Я планирую использовать VOICENOTE, чтобы переписать мои письменные заметки в текст и сохранить в MS Word. Затем, когда я сохраняю документ, Windows может искать мои рукописные заметки на компьютере. В противном случае рукописные заметки можно сохранить только как изображение. Только заголовки доступны для поиска, и вы не можете найти слова документа для поиска.

0
Dennis Wurster

There's a software project called 'fanscribe' that breaks up a recording and breaks it up into pieces, distributing them to interested people who can transcribe a portion of it.

https://github.com/fanscribed/fanscribed/blob/master/README.rst

Похожие вопросы