Вы сделаете все возможное в поиске преобразователей речи в текст или транскрибера. gAudi (Google's Audio), ныне несуществующий проект Labs, работал над индексацией видео на основе их аудио.
Если вы найдете какую-то информацию, то я уверен, что размещение ее здесь поможет некоторым пользователям.