Я пытаюсь уменьшить частоту стереофонического звукового файла PCM с частотой 44,1 кГц до 22050 Гц и моно. Однако размер полученного файла слишком велик.

Пример сеанса (сборка ffmpeg и информация о версии вырезаны для удобства чтения).

> ffprobe input.wav -count_frames
Input #0, wav, from 'input.wav':
  Metadata:
    encoder         : Lavf57.56.101
  Duration: 00:03:23.18, bitrate: 1411 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, 2 channels, s16, 1411 kb/s

Таким образом, количество кадров: 03: 23.18 * 44100 = 8960238

> ffmpeg -i input.wav -ar 22050 -ac 1 -f u8 -acodec pcm_u8 output.u8
Guessed Channel Layout for Input Stream #0.0 : stereo
Input #0, wav, from 'input.wav':
  Metadata:
    encoder         : Lavf57.56.101
  Duration: 00:03:23.18, bitrate: 1411 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, stereo, s16, 1411 kb/s
File 'output.u8' already exists. Overwrite ? [y/N] y
Output #0, u8, to 'output.u8':
  Metadata:
    encoder         : Lavf57.56.101
    Stream #0:0: Audio: pcm_u8, 22050 Hz, mono, u8, 176 kb/s
    Metadata:
      encoder         : Lavc57.64.101 pcm_u8
Stream mapping:
  Stream #0:0 -> #0:0 (pcm_s16le (native) -> pcm_u8 (native))
Press [q] to stop, [?] for help
size=    4375kB time=00:03:23.18 bitrate= 176.4kbits/s speed= 276x    
video:0kB audio:4375kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.000000%

Теперь количество кадров должно быть наполовину от предыдущего, потому что мы сократили частоту дискретизации вдвое, то есть она должна быть 8960238/2 = 4480119. А поскольку формат u8, он должен быть точно таким же, как и байты.

> wc -c output.u8
4480160 output.u8

... но это на 41 байт больше, чем должно быть.

0