16

Я ищу программу, независимую от динамиков (коммерческую или бесплатную), которая позволила бы мне транскрибировать файлы MP3, содержащие записи речи (особенно подкасты), в текст. Я хотел попробовать Dragon Naturally Speaking, но похоже, что он поддерживает только запись моих собственных речевых записей. Так каковы альтернативы?

6 ответов6

7

Dragon Naturally Speaking импортирует mp3-файлы и пытается их расшифровать. Он предпочитает настроить распознавание голоса на отдельного оратора, но справляется с этим без настройки. Вероятно, будет лучше, если ваши колонки подкастов будут звучать как Tom Brokaw.

4

Одним из возможных решений было бы загрузить свое видео на Youtube и попробовать автоматические подписи, которые вы можете включить ... это еще не слишком точно, но вы можете загрузить файл подписей и отредактировать его самостоятельно, если это поможет ... как по вопросам авторского права / пиратства для песни, вы можете сделать видео приватным в своем профиле, если это вообще возможно?

2

Я бы рекомендовал не пытаться использовать Dragon Naturally Speaking - я написал несколько скриптов на своем джейлбрейкнутом iphone, чтобы скопировать / преобразовать все файлы голосовой почты с моего телефона в папку на моем компьютере, и для них была запущена служба транскрипции Dragon Naturally Speaking.

Результат запуска транскрипции для файлов с разными динамиками был абсолютно непригодным. Я пробовал некоторые альтернативы с открытым исходным кодом, но независимое от говорящего распознавание голоса все еще кажется ограниченным очень маленькими словарями.

1

Я использую http://www.voicebase.com с подкастом и видео на английском языке, и это работает очень хорошо. Это бесплатно в течение 50 часов аудио.

Вы можете скачать аудио транскрипцию на RTF, SRT или PDF.

Вы можете скачать машинную транскрипцию через 10-15 минут после загрузки, а иногда и рано.

1

Открытый исходный код: CMU Sphinx

Условно-бесплатная: http://www.e-speaking.com/ (Windows)

Рекламный ролик: Dragon NaturallySpeaking (Windows)

Вы также можете попробовать этот метод, если вы пытаетесь с OSX, что можно сделать с помощью Audacity и Soundflower

Вы можете также найти некоторые соответствующие ссылки для OpenSource других условно стоит попробовать был voxcribecc

Если вы программист .net, вы можете использовать этот метод, чтобы сделать свой собственный комплект

0

Podzinger был бы отличным решением, но я не уверен, что ramp (новое название для компании, которая раньше была EveryZing, которая производила Podzinger), предлагает услугу бесплатно ...

http://en.wikipedia.org/wiki/Podzinger

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .