Хорошее решение для преобразования текста в речь для Windows

4192
Jim McKeeth

Я использую Windows 7 и знаю, что в моих приложениях есть возможность читать текст в моих приложениях, но я ищу хорошую утилиту для сохранения кусков текста в виде файла wav или mp3. Возможно, он уже встроен в ОС, но хитро замаскирован. Я знаю, что могу написать программу для вызова API, что является моим следующим шагом, если уже нет хорошего решения.

Мне очень нравится качество системы AT & T, но у нее есть довольно крутые ограничения на использование выпущенного MP3. Я хотел бы использовать их в моем подкасте.

С веб-интерфейсом тоже все в порядке, поскольку он легко создает довольно свободный (WAL, MP3 или другие стандартные аудиофайлы) файл (Public Domain или Creative Commons). Естественно, я предпочитаю бесплатный или открытый исходный код, а не коммерческий, но это не является обязательным требованием.

9

2 ответа на вопрос

6
John T

eSpeak является бесплатным и открытым исходным кодом и предлагает все, что вам нужно.

Он может работать как программа командной строки, чтобы произносить текст из файла или из стандартного ввода. Также доступна версия общей библиотеки.  * Включает в себя различные тембры, характеристики которых могут быть изменены. * Может производить речевой вывод в виде файла WAV. * SSML (язык разметки речи) поддерживается (не полностью), а также HTML. * Компактный размер. Программа и ее данные, в том числе на многих языках, составляет около 1 Мбайт. * Может переводить текст в коды фонем, так что он может быть адаптирован как фронт конец для другого двигателя синтеза речи. * Потенциал для других языков. Несколько включены в различные этапы прогресса. Помощь носителей языка для этих или других языков приветствуется. * Инструменты разработки доступны для производства и настройки данных фонем. * Написано на C ++.
В то время как eSpeak кажется интересным, оно может действительно выиграть от руководства по быстрому старту. Спасибо за совет, хотя. Я буду продолжать работать с этим. Jim McKeeth 15 лет назад 0
+1 за eSpeak. Я долго искал приложение для этого. Спасибо, сэр! Axxmasterr 15 лет назад 0
4
User

Я пробовал espeak, Festival и MaryTTS . Все они генерируют понятные голоса по большей части, но они не очень естественны. Даже с дополнительными голосовыми загрузками для этих систем (например, Mbrola, CMU Arctic) голоса не так велики.

Голоса IVONA - лучшее, что я когда-либо слышал. Они дают вам 30-дневную бесплатную демо-версию, которой достаточно, если у вас есть одноразовое задание. После этого они похожи на 45 долларов / голос. Amazon только что купила компанию, чтобы вы знали, что она солидная ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ ).

Они работают с интерфейсом Microsoft SAPI, что означает, что голоса доступны любой программе, которая поддерживает это (например, Adobe Reader). Я использую их с программой Text To Wav, которая хороша для массового преобразования текстовых файлов в волновые файлы.

редактировать

На самом деле просто перечитайте ваш вопрос, и я думаю, что для не личного использования (например, подкасты) цена, вероятно, намного выше для IVONA. В этом случае я бы сказал, проверить MaryTTS.

Я только что слушал MaryTTS, и это потрясающее завершение разговоров и фестивалей. thirtythreeforty 11 лет назад 0
У MaryTTS отличные голоса, и это тоже бесплатно. Jim McKeeth 11 лет назад 0
Похоже, что текст в речь для голосов Ivona для настольных компьютеров теперь предоставляется [TextAloud] (http://www.textaloud.com/) User 7 лет назад 0