Почему программное обеспечение для звуковой диктовки, такое как Dragon, работает только со стороны говорящего?

573
ospeaks

Я не хочу, чтобы мой ноутбук или мобильный телефон просто диктовали / печатали то, что я говорю, а вместо этого пишу то, что говорит звонящий на другом конце линии. Почему Google или Nuance не включают эту функцию? Это вообще возможно? Что нужно для того, чтобы это работало?

4
Теоретически это * возможно * возможно, если бы Dragon смог контролировать выходной аудиосигнал, который генерирует Skype. * Почему * они этого не сделали? Там, вероятно, не достаточно спроса. Если у Dragon есть плагинная архитектура, это может быть хорошим хобби-проектом ...;) FrustratedWithFormsDesigner 13 лет назад 0
http://www.amazon.com/Parts-Express-3-5mm-Stereo-Cable/dp/B0002ZPJZO :) Ƭᴇcʜιᴇ007 10 лет назад 0

2 ответа на вопрос

1
M. Dudley

Когда вы говорите, ваш голос записывается через микрофон вашего компьютера и аудиооборудование. Этот аудиосигнал доступен для любых приложений на вашем компьютере. Когда вы разговариваете с кем-то через Skype, речевой сигнал кодируется в виде пакетов. Вам нужно будет перепроектировать протокол Skype, чтобы декодировать голосовой сигнал.

Если вы разговариваете по мобильному телефону в режиме громкой связи, качество может быть недостаточно хорошим для распознавания голоса. Кроме того, программное обеспечение для распознавания голоса должно быть обучено как по голосу, так и по голосу другого человека.

Я не уверен, какое значение имеет Google здесь.

Ну, в этом ответе есть какая-то неверная информация. Программное обеспечение всегда может просто захватить звуковой сигнал из линейного выхода, например. 13 лет назад 0
теоретически, это правда, что он может подхватить линию, но emddudley - это правда. Дракон требует тренировки вашего голоса, прежде чем он сможет правильно распознать слова. Хотя это только для Дракона, спецслужбы делают это в течение многих лет, но я догадываюсь, неохотно в выпуске их алгоритмов для большего блага! 0x7c0 13 лет назад 0
Не то, чтобы это здесь принадлежало, но есть также некоторые юридические проблемы с записью телефонных звонков. Chad 13 лет назад 0
Актуальность Google находится в инструменте Google Voice. Технически, Google Voice транскрибирует входящие звонки, но только когда вы отправляете их на голосовую почту. Затем он может отправить вам сообщение голосовой почты. music2myear 13 лет назад 2
Я с Чедом на этот раз. Здесь есть серьезные серьезные юридические последствия. Я не юрист, но я уверен, что вам нужно согласие на запись телефонного звонка. , , surfasb 13 лет назад 0
@surfasb В США это меняется от штата к штату. M. Dudley 13 лет назад 0
@emddudley: Я имею в виду Федеральный закон о прослушивании телефонных разговоров. Вместо того, чтобы иметь дело с государственной полицией, ФБР постучится в вашу дверь, независимо от того, в каком вы штате. surfasb 13 лет назад 0
0
Franck Dernoncourt

Dragon NaturallySpeaking (unlike Google) needs to be trained before being able to transcribe speech into words.

Google does speech to text transcriptions for the caller on the other end of the line when someone leaves a message on your autoresponder on Google voice.

Note that the voice quality is often altered quite heavily during a call, which makes voice recognition even harder.