Аудиокодек Opus выглядит как лучшая вещь для сжатия звука. Недавно он стал поддерживаться в последних плеерах ffmpeg и VLC. Тем не менее, я не могу найти документацию о том, как на самом деле кодировать медиа с его помощью. Может кто-нибудь, пожалуйста, направьте меня к указанным документам, желательно с указанием флагов и использования ffmpeg? У меня много аудиокниг, которые занимают слишком много места, и Opus выглядит как идеальный формат для их хранения.

ffmpeg -i input -acodec libopus -b:a bitrate -vbr on -compression_level 10 output

В документации ffmpeg есть список опций и описаний для libopus.

Убедитесь, что вы скомпилировали ffmpeg с помощью --enable-libopus !

  1. Скачать Opus-инструменты

  2. Encode:
    opusenc --bitrate 64 What_A_Feeling.wav What_A_Feeling_64.opus

  3. Декодировать: (для воспроизведения в любом медиаплеере, полезно, если ваш медиаплеер еще не поддерживает opus):
    opusdec What_A_Feeling_64.opus What_A_Feeling_opus64.wav

(What_A_Feeling - название песни)

Подробные параметры отображаются при запуске opusenc :

Usage: opusenc [options] input_file output_file.opus

Encodes input_file using Opus.
It can read the WAV, AIFF, FLAC, Ogg/FLAC, or raw files.

General options:
 -h, --help         This help
 -V, --version      Version information
 --quiet            Quiet mode

input_file can be:
  filename.wav      file
  -                 stdin

output_file can be:
  filename.opus     compressed file
  -                 stdout

Encoding options:
 --bitrate n.nnn    Target bitrate in kbit/sec (6-256/channel)
 --vbr              Use variable bitrate encoding (default)
 --cvbr             Use constrained variable bitrate encoding
 --hard-cbr         Use hard constant bitrate encoding
 --comp n           Encoding complexity (0-10, default: 10 (slowest))
 --framesize n      Maximum frame size in milliseconds
                      (2.5, 5, 10, 20, 40, 60, default: 20)
 --expect-loss      Percentage packet loss to expect (default: 0)
 --downmix-mono     Downmix to mono
 --downmix-stereo   Downmix to stereo (if >2 channels)
 --max-delay n      Maximum container delay in milliseconds
                      (0-1000, default: 1000)

Diagnostic options:
 --serial n         Forces a specific stream serial number
 --save-range file  Saves check values for every frame to a file
 --set-ctl-int x=y  Pass the encoder control x with value y (advanced)
                      Preface with s: to direct the ctl to multistream s
                      This may be used multiple times

Metadata options:
 --comment          Add the given string as an extra comment
                      This may be used multiple times
 --artist           Author of this track
 --title            Title for this track
 --album            Album or collection this track belongs to
 --date             Date for this track
 --genre            Genre for this track
 --picture          Album art for this track
                      More than one --picture option can be specified.
                      Either a FILENAME for the picture file or a more
                      complete SPECIFICATION form can be used. The
                      SPECIFICATION is a string whose parts are
                      separated by | (pipe) characters. Some parts may
                      be left empty to invoke default values. A
                      FILENAME is just shorthand for "||||FILENAME".
                      The format of SPECIFICATION is


                      TYPE is an optional number from one of:
                      0: Other
                      1: 32x32 pixel 'file icon' (PNG only)
                      2: Other file icon
                      3: Cover (front)
                      4: Cover (back)
                      5: Leaflet page
                      6: Media (e.g., label side of a CD)
                      7: Lead artist/lead performer/soloist
                      8: Artist/performer
                      9: Conductor
                      10: Band/Orchestra
                      11: Composer
                      12: Lyricist/text writer
                      13: Recording location
                      14: During recording
                      15: During performance
                      16: Movie/video screen capture
                      17: A bright colored fish
                      18: Illustration
                      19: Band/artist logotype
                      20: Publisher/studio logotype

                      The default is 3 (front cover). There may only be
                      one picture each of type 1 and 2 in a file.

                      MIME-TYPE is optional. If left blank, it will be
                      detected from the file. For best compatibility
                      with players, use pictures with a MIME-TYPE of
                      image/jpeg or image/png. The MIME-TYPE can also
                      be --> to mean that FILENAME is actually a URL to
                      an image, though this use is discouraged. The
                      file at the URL will not be fetched. The URL
                      itself is stored in the metadata.

                      DESCRIPTION is optional. The default is an empty

                      The next part specifies the resolution and color
                      information. If the MIME-TYPE is image/jpeg,
                      image/png, or image/gif, you can usually leave
                      this empty and they can be detected from the
                      file. Otherwise, you must specify the width in
                      pixels, height in pixels, and color depth in
                      bits-per-pixel. If the image has indexed colors
                      you should also specify the number of colors
                      used. If possible, these are checked against the
                      file for accuracy.

                      FILENAME is the path to the picture file to be
                      imported, or the URL if the MIME-TYPE is -->.
 --padding n        Extra bytes to reserve for metadata (default: 512)
 --discard-comments Don't keep metadata when transcoding
 --discard-pictures Don't keep pictures when transcoding

Input options:
 --raw              Raw input
 --raw-bits n       Set bits/sample for raw input (default: 16)
 --raw-rate n       Set sampling rate for raw input (default: 48000)
 --raw-chan n       Set number of channels for raw input (default: 2)
 --raw-endianness n 1 for bigendian, 0 for little (defaults to 0)
 --ignorelength     Always ignore the datalength in Wave headers

Лучшие команды кодека Opus в DOS/Windows Command:

Для lib 1.3 самый маленький размер файла (качество ленты):

Opusenc a.wav a.opus --bitrate 24 --framesize 40 --discard-comments --discard-pictures

Ты сможешь:

a - на 24 кбитах все еще есть звуковой выход 16 кГц (стерео), очень маленький размер. Любой меньше, и выход Sonic упадет до 11 кГц

b- Увеличить размер кадра (сохранить несколько бит данных (около 6%), без ощутимой потери качества)

c- Удалите ненужную информацию TAG и закройте изображения, которые только увеличат размер файла.

Для lib 1.3 для потоковой передачи (почти с качеством CD) используйте «--bitrate 52» вместо «24».

По умолчанию в 1.2 это 48 кбит, но при использовании 52 в 1.3, когда для 'frameize' установлено значение 40, размер вашего файла равен, но слышно гораздо меньше артефактов.

52 кбит с размером кадра 40, возможно, по качеству равны 160 кбит MP3, что составляет менее 1/3 размера; в то время как 48 кбит на 1,2 равны 128 кбит MP3, или только в 2,5 раза меньше по размеру.

Для почти идентичного качества вам понадобится от 80 до 96 кбит. Я почти никогда не использую это, потому что я хочу, чтобы мой звук был как можно меньше.

Более 96 кбит, подходит только для редактирования, и не слышно разницы между оригиналом и файлом, закодированным Opus.

При этом я пока не знаю, как все это работает в Linux.

