Чтобы быть понятным с самого начала: это очень сложная задача для автоматического анализа аудиозаписей. Попытка провести различие между речью и шумом теоретически возможна, но я сомневаюсь, что в Интернете есть решение, доступное в один клик. Это больше похоже на исследовательскую работу.
Кроме того, ваша запись, вероятно, не будет иметь места полного молчания. Если бы это было так, можно было бы разбить файл в точках, где нет абсолютно никакого звука - это также включает некоторое программирование, я не могу вспомнить ни одну программу, которая делает это.
Поиск важных частей или частей с голосом
Возможно, вы захотите использовать (бесплатную, кроссплатформенную) программу, такую как Audacity , чтобы увидеть волновую форму MP3. Используя форму волны, вы можете увидеть, где находится "большинство" действия.
Например, я выделил коричневатые участки, которые превышают определенный порог. Скорее всего, это те, с голосовыми данными, которые вы пытаетесь найти.
Другие (синие) части могут не содержать никакой соответствующей информации или речи, так как они не такие громкие, как другие.
Также просмотрите промежутки между ними - они помогут вам определить части, где на самом деле ничего не происходит. Вы можете вырезать файл там и разделить его, чтобы получить разные "интервью" (или что бы вы ни записывали).
Шумоподавление
Чтобы устранить шум, вы можете попробовать использовать эффект эквалайзера и отфильтровать определенные частоты. Вам нужно будет поэкспериментировать с этим, поскольку не все записывающие устройства одинаковы и условия шума меняются.
При этом вы можете попытаться увеличить частоты от 500 Гц до 1 кГц (или даже до 4 кГц) и сократить частоты ниже 500 Гц и выше 8 кГц.
Audacity также имеет определенные фильтры для устранения шума, чтобы удалить статический шум, шипение, шум или другие постоянные фоновые шумы. Эксперимент с теми.