9

Я использую Windows 7 и знаю, что в моих приложениях есть возможность читать текст, но я ищу хорошую утилиту для сохранения фрагментов текста в виде файла wav или mp3. Возможно, он уже встроен в ОС, но хитро замаскирован. Я знаю, что могу написать программу для вызова API, что является моим следующим шагом, если уже нет хорошего решения.

Мне очень нравится качество системы AT & T, но у нее есть довольно крутые ограничения на использование выпущенного MP3. Я хотел бы использовать их в моем подкасте.

С веб-интерфейсом тоже все в порядке, поскольку он легко создает довольно свободный (WAL, MP3 или другие стандартные аудиофайлы) файл (Public Domain или Creative Commons). Естественно, я предпочитаю бесплатный или открытый исходный код, а не коммерческий, но это не является обязательным требованием.

2 ответа2

6

eSpeak является бесплатным и открытым исходным кодом и предлагает все, что вам нужно.

It can run as a command line program to speak text from a file or from stdin.
A shared library version is also available.

* Includes different Voices, whose characteristics can be altered.
* Can produce speech output as a WAV file.
* SSML (Speech Synthesis Markup Language) is supported (not complete),
  and also HTML.
* Compact size. The program and its data, including many languages,
  totals about 1 Mbytes.
* Can translate text to phoneme codes, so it could be adapted as a front
  end for another speech synthesis engine.
* Potential for other languages. Several are included in varying stages
  of progress. Help from native speakers for these or other languages is
  welcomed.
* Development tools available for producing and tuning phoneme data.
* Written in C++.
4

Я пробовал espeak, Festival и MaryTTS. Все они генерируют понятные голоса по большей части, но они не очень естественны. Даже с дополнительными голосовыми загрузками для этих систем (например, Mbrola, CMU Arctic) голоса не так велики.

Голоса IVONA - лучшее, что я когда-либо слышал. Они дают вам 30-дневную бесплатную демо-версию, которой достаточно, если у вас есть одноразовое задание. После этого они похожи на 45 долларов / голос. Amazon только что купила компанию, чтобы вы знали, что она солидная (http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/).

Они работают с интерфейсом Microsoft SAPI, что означает, что голоса доступны любой программе, которая поддерживает это (например, Adobe Reader). Я использую их с программой Text To Wav, которая хороша для массового преобразования текстовых файлов в волновые файлы.

редактировать

На самом деле просто перечитайте ваш вопрос, и я думаю, что для не личного использования (например, подкасты) цена, вероятно, намного выше для IVONA. В этом случае я бы сказал, проверить MaryTTS.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .