3

У меня есть возможность получать WAV-файлы голосовой почты, отправленные мне по электронной почте, но иногда я буду сидеть на собрании, и мне нужно знать содержание сообщения, не воспроизводя его вслух.

Есть ли хорошие (и, предпочтительно, бесплатные) инструменты для преобразования WAV-файлов в текст? Я знаю, что у Google Voice есть такая возможность, но я не могу определить, будет ли она работать на индивидуальной основе.

Я понимаю, что это сложная исследовательская проблема, но даже 80% -ое решение может быть работоспособным.

2 ответа2

3

Я считаю, что лучшее бесплатное программное обеспечение для распознавания речи - CMU Sphinx. Это выглядит довольно зрелым, хотя я не использовал его. Однако это скорее исследовательский проект, нежели сфокусированный на конечных пользователях, поэтому, хотя он, по-видимому, работает хорошо, его нужно немного отрегулировать; в частности, вам нужно будет тренировать его перед использованием.

Другое программное обеспечение, которое вы можете попробовать:

http://en.wikipedia.org/wiki/List_of_speech_recognition_software

Кстати, вы рассматривали просто прослушивание сообщений с помощью небольшой затычки для ушей, если вы находитесь на встрече. Может быть, самый простой способ :-). Или просто проводить меньше встреч ...

1

Посмотри на Юлия

mkdir -p $HOME/tmp/ 
cd $HOME/tmp 
if [ ! -f  Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz ] ; then
    wget http://www.repository.voxforge1.org/downloads/Nightly_Builds/AcousticModel-2011-07-21/Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz  -O  Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz
fi 
tar xvpfz Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz 
echo "It might be installed."

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .