Мой вопрос касается огромной разницы в качестве звука между человеческим голосом и музыкальным инструментом - например, пианино - при использовании приложений видеочата в качестве Skype, FaceTime, мессенджера Facebook и т.д. Даже в лучшем случае, когда соединение Приличный, и качество изображения и звука достаточно хорошее, чтобы общаться, музыкальный звук передается с огромным искажением, эффекты варьируются от звучания "под водой" до чрезвычайно ударного, не говоря уже о задержке. Можно ли что-нибудь сделать, чтобы решить эту проблему?
2 ответа
Многие из кодеков (алгоритмы сжатия звука, такие как, например, GSM или G.729), используемые в интернет-коммуникации, предназначены для речи, а не для музыки. Они могут быть основаны на модели голосовых путей человека (полости носа, полости рта, глотки, гортани, трахеи, велюра, языка). Эта специализация обеспечивает высокую степень сжатия (= использование низкой полосы пропускания) и относительно хорошее качество речи, но может дать ужасные эффекты при обработке других звуков.
Другая проблема, которая может внести свой вклад - это разница в громкости голоса и (предположительно) тихой фоновой музыки. Этот фон может рассматриваться как шум и отфильтровываться или искажаться фильтром шумоподавления или частично отключаться алгоритмом обнаружения голосовой активности, который может остановить передачу, если сигнал ниже определенного уровня, или вместо этого отправить так называемый "комфортный шум" - опять же, чтобы минимизировать используемую полосу пропускания ,
Если вы хотите что-то хорошее для голоса и музыки, попробуйте кодек OPUS. Не все клиенты VoIP поддерживают его, но в настоящее время быстро становятся наиболее важным кодеком в VoIP из-за его превосходного качества по сравнению с потребностями в пропускной способности.