У меня есть файл movie.mp4, я извлек аудио из видеофайла, используя FFMPEG (ffmpeg -i video.mp4 -c: pcm_s16le audio.wav).

Теперь из аудиофайла я могу получить форму волны, есть ли способ отличить музыку и голос от аудиофайла в форме волны, и это лучший способ дифференцировать? Мне нужно время начала и окончания музыки из извлеченного аудиофайла.

Итак, в конце я могу получить несколько или один музыкальный файл из аудиофайла.

0