Существует мало программ для распознавания речи (например, речь в текст (STT)), но я не уверен, в какой степени они смогут удовлетворить ваши потребности. Я думаю, что лучшие доступные решения стоят дорого. Например, Dragon NaturallySpeaking SDK должен уметь выполнять эту работу. Однако существует некоторая бесплатная альтернатива. Проверьте CMU Sphinx или Microsoft Speech Software Recognition, например.
Чтобы сузить свои исследования, вы должны принять во внимание систему, которую вы используете (Linux, BSD, Windows и т.д.), А также тип записи, которую вы будете использовать (известны ли спикеры заранее или нет). Это повлияет на решения, которые вы можете или не можете использовать. Кроме того, будьте осторожны, что, на самом деле, распознавание речи далеко не точно.
Надеюсь, поможет!
сфинкс
MS SAPI
Dragon NaturallySpeaking