Я ищу программу, независимую от динамиков (коммерческую или бесплатную), которая позволила бы мне транскрибировать файлы MP3, содержащие записи речи (особенно подкасты), в текст. Я хотел попробовать Dragon Naturally Speaking, но похоже, что он поддерживает только запись моих собственных речевых записей. Так каковы альтернативы?
6 ответов
Dragon Naturally Speaking импортирует mp3-файлы и пытается их расшифровать. Он предпочитает настроить распознавание голоса на отдельного оратора, но справляется с этим без настройки. Вероятно, будет лучше, если ваши колонки подкастов будут звучать как Tom Brokaw.
Одним из возможных решений было бы загрузить свое видео на Youtube и попробовать автоматические подписи, которые вы можете включить ... это еще не слишком точно, но вы можете загрузить файл подписей и отредактировать его самостоятельно, если это поможет ... как по вопросам авторского права / пиратства для песни, вы можете сделать видео приватным в своем профиле, если это вообще возможно?
Я бы рекомендовал не пытаться использовать Dragon Naturally Speaking - я написал несколько скриптов на своем джейлбрейкнутом iphone, чтобы скопировать / преобразовать все файлы голосовой почты с моего телефона в папку на моем компьютере, и для них была запущена служба транскрипции Dragon Naturally Speaking.
Результат запуска транскрипции для файлов с разными динамиками был абсолютно непригодным. Я пробовал некоторые альтернативы с открытым исходным кодом, но независимое от говорящего распознавание голоса все еще кажется ограниченным очень маленькими словарями.
Я использую http://www.voicebase.com с подкастом и видео на английском языке, и это работает очень хорошо. Это бесплатно в течение 50 часов аудио.
Вы можете скачать аудио транскрипцию на RTF, SRT или PDF.
Вы можете скачать машинную транскрипцию через 10-15 минут после загрузки, а иногда и рано.
Открытый исходный код: CMU Sphinx
Условно-бесплатная: http://www.e-speaking.com/ (Windows)
Рекламный ролик: Dragon NaturallySpeaking (Windows)
Вы также можете попробовать этот метод, если вы пытаетесь с OSX, что можно сделать с помощью Audacity и Soundflower
Вы можете также найти некоторые соответствующие ссылки для OpenSource других условно стоит попробовать был voxcribecc
Если вы программист .net, вы можете использовать этот метод, чтобы сделать свой собственный комплект
Podzinger был бы отличным решением, но я не уверен, что ramp (новое название для компании, которая раньше была EveryZing, которая производила Podzinger), предлагает услугу бесплатно ...