3

Я слушаю ежедневный подкаст, который длится около 4 часов. Я думаю, что это был бы классный проект, если бы я мог придумать какой-нибудь способ автоматически генерировать его стенограммы. Есть ли программное обеспечение, которое будет "слушать" mp3-файлы и создавать текст того, что они говорят?

Меня не очень интересует различие между тем, кто говорит, потому что я думаю, что это будет слишком много. Говорят 4 основных человека и другие реже.

7 ответов7

3

шаги:

  1. Загрузите бесплатный транскрипционный плеер Express Scribe и установите его.
    1. После того, как приложение установлено, вы найдете уже загруженный пример файла диктовки. Это даст вам возможность поиграть с элементами управления и опциями, чтобы настроить приложение в соответствии с вашими потребностями.
    2. В главном интерфейсе нажмите кнопку "Настройки".
    3. Express Scribe позволяет изменять или устанавливать несколько параметров, включая скорость перемотки назад и ускоренной перемотки вперед, горячие клавиши для всей системы (для управления приложением без использования мыши), настройку педального рычага управления (если она есть), автозагрузку файлов из папки LAN или FTP-сервера, выбор разрешенных типов файлов (поддерживается более 20) и настройка модуля распознавания речи.
    4. После настройки параметров вы можете загрузить свой первый аудиофайл. В зависимости от того, откуда вы его получаете, вы можете нажать "Загрузить" (откроется диалоговое окно, которое позволит вам найти файл на вашем ПК), "Загрузить сейчас" (если вы установили соединение по локальной сети или FTP) или "Док". (если вам нужен цифровой диктофон или диктофон).
    5. Выберите аудиофайл в главном окне интерфейса и нажмите кнопку Play, чтобы начать. При необходимости замедлите или увеличьте скорость воспроизведения звука с помощью регулятора скорости в правом нижнем углу. Выше этого элемента управления вы также можете настроить громкость воспроизведения.
    6. Если вы предпочитаете, чтобы Express Scibe находился над вашим текстовым приложением, вы можете выбрать Scribe Mini на главной панели инструментов интерфейса. Как следует из названия, эта опция предоставляет миниатюрную версию приложения.
    7. Как только вы закончите транскрибировать ваши аудиофайлы, вы можете пометить их как "Готово" (удаление файла из списка) или "Отправка" (возврат и отправка по электронной почте исходному отправителю вместе с приложением trext и удаление аудиофайла из списка. ,

подсказки

  • Потратьте некоторое время, чтобы изучить все варианты приложения.
  • Если вы получаете аудиофайл низкого качества, вы можете выбрать Special Audio Processes в меню File, чтобы попытаться очистить его.
  • Когда Express Scribe получает аудиофайл, он сохраняется в C:\Documents and Settings\ имя пользователя \ Application Data \ NCH Swift Sound \ scribe \ Current
  • Если вы отметили аудиофайл как "Готово", но хотите восстановить его, вы можете восстановить старые файлы из меню "Файл".
1

Одна вещь, которую вы можете попробовать (хотя и не ежедневно), это загрузить аудио в виде видео на Youtube, а затем попросить YouTube транскрибировать видео с надписями на английском языке ... YouTube может сделать это до 24 часов, тем не мение...Файл заголовка можно загрузить, и вы можете редактировать его самостоятельно, чтобы вы могли скопировать и вставить текст в любое место ...

0

Пробовал волна к тексту? Это только окна и имеет ограниченную бесплатную пробную версию.

Сколько голосов в этих файлах? Все ли файлы содержат речь одним (обучаемым) голосом? Какое качество звука? Если ответы на эти вопросы не такие: «Только я», «Да» и «Качество CD», @Snark прав, вы должны сделать это по существу вручную. Получите хорошую программу распознавания речи, потратьте некоторое время на ее обучение и воспроизведите свои файлы, пока вы пытаетесь сказать, что они говорят.

Ожидайте 90% - 95% успешной транскрипции, которая звучит великолепно, пока вы не поймете, что означает, что 1 или 2 из каждых 20 слов неверны.

Другие факторы, которые могут повлиять на точность:

  1. Много акронимов в твоей речи
  2. неполные предложения - речь к тексту имеет тенденцию работать намного лучше с подсказками контекста, которые это получает от полных предложений.
0

Я использую Dragon NaturalSpeaking для транскрипции. отличное программное обеспечение!

но это не бесплатно, Amazon предлагает актуальную версию 10 за 45 долларов, если вы посмотрите вокруг, вы получите DNS9 еще дешевле.

0

Проблема с Dragon Naturally Speaking в таком контексте заключается в том, что вы действительно не сможете пройти тренировочный процесс, где он научится точно интерпретировать речь. Он не предназначен для такого использования. Может быть, у АНБ есть какое-то программное обеспечение для такого рода вещей. :)

0

Вам нужно программное обеспечение для распознавания речи.

Для этого существует несколько программ, но я не знаю ни одной, которая могла бы выполнять пакетное преобразование. Я уверен, что это особенность хотя бы одного из них. Обратите внимание, что большинство из них далеко не дешево.

-1

Я уверен, что Дракон позволит тебе сделать это. У вас могут быть проблемы с точностью, хотя.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .