1

У меня есть ситуация, когда у меня есть большой mp3-файл, который является выходом устройства записи журналиста, это устройство работает в течение долгого времени, так как я забываю нажимать кнопки записи всякий раз, когда разговариваю с людьми на сайте, куда я иду, чтобы получить отчеты о инциденты и т.д ..

так что в основном у меня есть 11-часовой mp3-файл, и в настоящее время я анализирую его, чтобы найти записи, которые я сделал. Это занимает несколько часов, 4-5 часов.

Так есть ли способ ..
1. Чтобы получить только записи голоса из этого файла
2. Устраните или уменьшите громкость трафика / или других фоновых шумов, таких как звуки машины и т.д., Чтобы из mp3 извлекались только голосовые звуки.

Не уверен, что это возможно

Спасибо

1 ответ1

2

Чтобы быть понятным с самого начала: это очень сложная задача для автоматического анализа аудиозаписей. Попытка провести различие между речью и шумом теоретически возможна, но я сомневаюсь, что в Интернете есть решение, доступное в один клик. Это больше похоже на исследовательскую работу.

Кроме того, ваша запись, вероятно, не будет иметь места полного молчания. Если бы это было так, можно было бы разбить файл в точках, где нет абсолютно никакого звука - это также включает некоторое программирование, я не могу вспомнить ни одну программу, которая делает это.

Поиск важных частей или частей с голосом

Возможно, вы захотите использовать (бесплатную, кроссплатформенную) программу, такую как Audacity , чтобы увидеть волновую форму MP3. Используя форму волны, вы можете увидеть, где находится "большинство" действия.

Например, я выделил коричневатые участки, которые превышают определенный порог. Скорее всего, это те, с голосовыми данными, которые вы пытаетесь найти.

Другие (синие) части могут не содержать никакой соответствующей информации или речи, так как они не такие громкие, как другие.

Также просмотрите промежутки между ними - они помогут вам определить части, где на самом деле ничего не происходит. Вы можете вырезать файл там и разделить его, чтобы получить разные "интервью" (или что бы вы ни записывали).

Шумоподавление

Чтобы устранить шум, вы можете попробовать использовать эффект эквалайзера и отфильтровать определенные частоты. Вам нужно будет поэкспериментировать с этим, поскольку не все записывающие устройства одинаковы и условия шума меняются.

При этом вы можете попытаться увеличить частоты от 500 Гц до 1 кГц (или даже до 4 кГц) и сократить частоты ниже 500 Гц и выше 8 кГц.

Audacity также имеет определенные фильтры для устранения шума, чтобы удалить статический шум, шипение, шум или другие постоянные фоновые шумы. Эксперимент с теми.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .