2

Есть ли способ объективно измерить разницу в качестве между двумя аудиофайлами - с помощью "научного" измерения, не используя уши или мнение?

У меня есть два файла - один на 768kb/s, а другой на 1536kb/s. Мне интересно, есть ли способ определить, насколько лучше качество одного над другим. Возможно ли открыть их в виде программы анализа звука и проверить на обрезку, разрешение и т.д.?

4 ответа4

9

Можете ли вы объективно сказать качество?

Как правило, нет, нет точного способа объективного измерения качества звука с достаточной точностью. Проще говоря: не спрашивая множество людей об их конкретной оценке, вы никогда не сможете определить, "насколько выше" качество одного аудио по сравнению с другим. Само качество никогда не бывает абсолютным, оно очень субъективно.

Исследователи обычно делают, чтобы облегчить эту проблему, следующим образом: они определяют шкалу, в соответствии с которой ряд людей оценивают качество, например, пять баллов (плохое, плохое, удовлетворительное, хорошее, отличное). Или вы можете просто сравнить определенные кодеки (но это не даст вам очень значимых данных). Затем исследователи используют эти рейтинги для моделирования компьютерной метрики, которая пытается предсказать реакцию человека.

Объективные показатели качества

Довольно старой, но популярной объективной метрикой качества звука является Воспринимаемая оценка качества звука (PEAQ), описанная в МСЭ-R BS.1387 (1998). По сути, он пытается эмулировать человеческое ухо и генерировать оценки от 1 до 5, как это делал бы слушатель. PEMO-Q с 2006 года является более поздней метрикой, которая утверждает, что превосходит PEAQ.

Эти метрики часто проверяются на отдельные звуки или речь, и не обязательно на музыке, так как гораздо сложнее оценить воспринимаемое качество от сложных звуков, где маскирующие эффекты гораздо более распространены. Этот показатель 2008 года больше ориентирован на музыку.

Мне кажется, что исследование метрик качества звука не так активно, как метрики качества видео (тема, над которой я работаю). Вам будет трудно найти автономный инструмент, который вы можете использовать в Windows, где вы можете просто подключить два источника звука и получить результат. Большинство показателей разрабатываются внутри исследовательских институтов и редко видят свет общественности. Или это коммерческие инструменты для вещателей и поставщиков телекоммуникационных услуг.

Вот реализация PEAQ в MATLAB, но это все, что я знаю из головы.

Что вы можете сделать при сравнении файлов

Рассматривая проблему с технической точки зрения, важно отметить, что теоретически вы можете угадать, какой файл обеспечивает лучшее качество, просто взглянув на скорость передачи данных. Это, однако, надежно работает только тогда, когда файлы содержат одинаковый исходный контент, и они были закодированы с помощью одного и того же кодировщика.

В этом вся суть тестов прослушивания кодека: вы берете один и тот же источник, кодируете его для разных скоростей передачи данных (или уровней качества) с разными кодировщиками, а затем предлагаете пользователям сравнить их. Имея эти данные "наземной правды", вы можете, например, сказать, что файл MP3, закодированный с помощью LAME со скоростью 128 кбит / с, звучит так же хорошо, как файл AAC, закодированный с помощью FAAC, со скоростью 64 кбит / с (это цифры, но вы получаете идея).

Еще проще, если вы знаете, что один и тот же кодер использовался для обоих файлов, потому что в этом случае очень высока вероятность того, что скорость передачи данных (размер файла) достаточна для обоснованного предположения о результирующем качестве.

Но опять же, это работает только тогда, когда источники одинаковы. Некоторые кодеки работают лучше для разных видов музыки или речи. Некоторые работают лучше при более низких скоростях и не обязательно обеспечивают лучшее качество при более высоких скоростях. Есть слишком много факторов, чтобы рассмотреть.

1

Лучшие показатели - это формат и частота дискретизации. Хотя размер файла может дать вам некоторое представление.

На самом деле, мы должны признать, что разница в качестве записи может не означать, что она будет звучать лучше всего на слух, она просто будет лучше воспроизводить оригинальную запись.

Формат - MP3 не будет иметь то же качество, что и формат без потерь, такой как FLAC, и в зависимости от других факторов в кодеке два формата с потерями могут иметь разные результаты в зависимости от сжатия и способа сжатия.

Частота дискретизации будет определять, как часто информация берется из записи и затем воспроизводится в секунду, очевидно, что 1 Гц будет ужасным качеством, тогда как 24 кГц будет звучать хорошо. Чем выше, тем лучше.

Битовая глубина Это похоже на процессор, где для каждого семпла вы можете записать х бит на семпл. Больше битов означает больше информации, что означает лучшее качество записи.

Размер файла - это результат качества записи. Где Частота дискретизации, Битовая глубина, Каналы и сжатие являются компонентами для размера файла. Вы можете сами рассчитать примеры, чтобы увидеть это.

Моя оговорка здесь, что это может не иметь значения для некоторых записей. Если вы слушаете запись 40-х годов, она будет плохой, несмотря ни на что. Вы не можете добавить информацию, которую оригинальный формат не содержал, к новой записи, увеличивая любой из вышеперечисленных.

0

Вы можете открыть их в программе редактирования аудио, уменьшить масштаб до отдельных (цифровых) волн и сравнить пиксели с оригиналом.

Используя эту программу, я часто вижу шаги по ступенькам и легко обрезаю, как правило, из-за очень низкой скорости или очень низкого качества кодирования, или обоих.

Чтобы углубиться, когда вы говорите с очень высокими показателями, вам нужно будет сравнить его часть визуально. Имея звуки, которые должны быть похожими, существуют разные способы удаления одного звукового клипа с другим звуковым клипом, и остаются изменения между ними. Там один из шумовых фильтров мог бы сделать это легко, есть и другие методы, я уверен, например, негативное микширование, где идеальный клон звука обнуляет визуальную линию.

Я думаю, что инвертирование "фазы" и создание аддитивного микса также завершают это. Конечным результатом идеального обратного клона, смешанного с оригиналом, должна быть абсолютно ровная линия, без звука при воспроизведении. Достаточно легко проверить теорию и составить план, сначала использовать точно такой же аудиоклип, а затем попробовать то же самое со сжатым клипом.

Подумайте об этом так: в программе для работы с фотографиями вы можете загрузить в сжатом формате Jpeg ту же самую фотографию, над которой вы работаете, сделать разностное наложение. Выровняйте клип по оригиналу, и все артефакты, блоки и изменения цвета мгновенно отобразятся в виде цветов и уровней цвета, все, что на 100% совпадает с оригиналом, чисто черный. С аудио-редактором вы можете сделать то же самое для аудио.

-1

Если у вас нет оригинала без потерь в какой-либо форме, вы можете сравнить качество двух музыкальных фрагментов с потерями в ваших ушах.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .