Я не хочу, чтобы мой ноутбук или мобильный телефон просто диктовали / печатали то, что я говорю, а вместо этого пишу то, что говорит звонящий на другом конце линии. Почему Google или Nuance не включают эту функцию? Это вообще возможно? Что нужно для того, чтобы это работало?
2 ответа
Когда вы говорите, ваш голос записывается через микрофон вашего компьютера и аудиооборудование. Этот аудиосигнал доступен для любых приложений на вашем компьютере. Когда вы разговариваете с кем-то через Skype, речевой сигнал кодируется в виде пакетов. Вам нужно будет перепроектировать протокол Skype, чтобы декодировать голосовой сигнал.
Если вы разговариваете по мобильному телефону в режиме громкой связи, качество может быть недостаточно хорошим для распознавания голоса. Также программное обеспечение для распознавания голоса должно быть обучено как по голосу, так и по голосу другого человека.
Я не уверен, какое значение имеет Google здесь.
Dragon NaturallySpeaking (в отличие от Google) необходимо обучить перед тем, как транскрибировать речь в слова.
Google выполняет преобразование речи в текст для абонента на другом конце линии, когда кто-то оставляет сообщение на вашем автоответчике в Google Voice.
Обратите внимание, что качество голоса часто сильно изменяется во время разговора, что делает распознавание голоса еще сложнее.