Реалистичный голос для преобразования текста в речь

77288
Googlebot

Я пробовал несколько текстовых программ (на Linux), таких как Fetival, eSpeakи т.д .; но голос во всех них очень роботизированный. Существуют голосовые шаблоны для изменения голоса с мужского на женский, но проблема во всех них заключается в том, что система читает каждое слово отдельно, а не начинает читать предложение.

Есть ли какая-нибудь продвинутая программа или трюк для чтения текста относительно естественным голосом?

Нынешние искусственные голоса не могут быть прослушаны для длинного текста (слишком скучно, поскольку слушатель не может сосредоточиться).

7
Я думаю, что вы ищете, это Святой Грааль синтеза речи :) slhck 11 лет назад 3
Я не знаю, какое программное обеспечение они используют, но радиопередачи NOAA превосходны. Я не возражал бы против прослушивания этой программы, читая длинный текст. Jeanne Pindar 11 лет назад 0

6 ответов на вопрос

6
Kevin Junghans

Я думаю, что вы имеете в виду Text-To-Speech (TTS), так как вы говорите о роботизированном голосе. Механизмы TTS принимают письменный текст и озвучивают его, тогда как механизмы распознавания речи понимают человеческую речь и преобразуют ее в машиночитаемый формат. У Loquendo самый естественный двигатель TTS, который я когда-либо слышал. У них есть версия для Linux. У них есть интерактивная демоверсия, с которой вы можете поиграть, чтобы услышать, как это здорово звучит. Там движок TTS может принимать специальные символы в тексте, чтобы делать такие вещи, как выделение фраз или даже заставлять голос смеяться или плакать. Не многие двигатели TTS делают это.

Я был впечатлен качеством голоса. Тем не менее, это коммерческий продукт, и было трудно узнать цену. Кажется, это было объединено с продуктами Nuance, но ссылка мертва. Googlebot 11 лет назад 1
Loquendo был приобретен Nuance в прошлом году. Вам нужно будет поговорить с торговым представителем Nuance, чтобы узнать цены, и это будет дорого. Это компромисс между открытым исходным кодом и коммерческими продуктами. Я еще не слышал TTS с открытым исходным кодом, который сравнивается с чем-то вроде Loquendo. Иногда вы получаете то, за что платите. Kevin Junghans 11 лет назад 0
Loquendo Susan какое-то время был доступен на Android Market, но потом Nuance объяснил это необъяснимым образом. Странный ход ... до тех пор, пока не была раскрыта причина, когда они выпустили низкопробную [Siri-подобную имитацию] (https://play.google.com/store/apps/details?id=com.nuance.balerion) который использует голос Сьюзен. Очень разочаровывает. scatmoi 11 лет назад 0
хорошо этот ответ устарел. Ни одна из ссылок не работает, и я не смог найти никаких ссылок для загрузки loquendo для Linux из Google. Я нашел некоторые для окон akabhirav 8 лет назад 0
@akabhirav - Спасибо за ваши правки. Я одобрил их. Nuance переместил всю информацию на свой сайт после приобретения Loquendo. Kevin Junghans 8 лет назад 0
6
Mark

After weeks of researching the same question I found the voices from Ivona (here) and Loquendo (here and here) to be the best TTS voices available for Windows. Only Ivona lists prices on their website though. To actually use the TTS voices on your Windows PC I recommend Balabolka (free), Ivona MiniReader (free) or Ivona Reader.

Next check out Clearly from Evernote. It is a browser extension currently only available for Google Chrome. It provides TTS for premium customers only. The (iSpeech powered) TTS voice is not as good as Ivona's or Loquendo's but it gives you a nice reader view on blog posts/articles by stripping away distracting page elements. You can also set it to auto-highlight the currently read word!

Check out ReadSpeaker too which can be implemented by website owners into their site. Readspeaker provides auto-highlighting of the currently read paragraph/word, auto-scrolling and the ability to change the TTS speed.

[Edit:] There are some free useful Google Chrome extensions that are powered by iSpeech as well.

3
John B

Вы можете купить готовое устройство. http://www.textspeak.com делает звучание человека для речевых продуктов, досок и коробок. У них 20 языков, а простые TTS звучат лучше всего.

Там нет лицензии или разработки ... просто купите коробку, если вам нужен только один голосовой вывод.

(Это НЕ ПО для программного обеспечения, но мы использовали его в системах подкачки ... 5 минут для установки)

С их сайта

«Встраиваемые текстовые модули TextSpeak Text-To-Speech преобразуют текст ASCII в естественный, чистый голос с неограниченным словарным запасом. Компактное решение в виде плагина принимает широкий спектр входных данных для генерации речи в реальном времени для Security Transit Medical и Industry.

http://www.textspeak.com/oemtts.htm

1
Sheogorath

I don't know if it's open source, but Google's TTS is free, and is very natural sounding in comparison to Samsung's and Microsoft Anna.

0
thatidiotguy

Cepstral seems to provide reasonable prices for text to speech voices. You might want to check them out as an option.

http://www.cepstral.com

0
Art G

When it comes to having a good sound, what you really want to look for is not the text to speech software, but the good voices: they are a separate subject.

The same voice will work accross different software. The best one I know of at the moment is named Audrey. A female voice with a british accent. Although I have to change most ' that are on the text with copy-past to one from the keyboard, it is worth it for an almost realistic sounding voice. I also have to place a pausing symbol (.,: or such) at the end of titles so she doesn't keep talking right through them. I still think it's the best voice I have so far. But I wouldn't mind finding the one from that weather channel that was mentioned ealier:

"NOAA weather radio broadcasts are EXCELLENT. I would not object to listening to that program read a long text.– Jeanne Pindar"

Here is a website which has sample voices on it: including Audrey. I have others, but I have only used her for a long time now.

PS: you have to pay for the better voices, but they will work on free text-to-speech software afterwards... at least the one I have. (Free Natural Reader)

Voice Sample web page: http://www.digitalfuturesoft.com/attnaturalvoices.php