Я пытаюсь уменьшить частоту стереофонического звукового файла PCM с частотой 44,1 кГц до 22050 Гц и моно. Однако размер полученного файла слишком велик.
Пример сеанса (сборка ffmpeg и информация о версии вырезаны для удобства чтения).
> ffprobe input.wav -count_frames
Input #0, wav, from 'input.wav':
Metadata:
encoder : Lavf57.56.101
Duration: 00:03:23.18, bitrate: 1411 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, 2 channels, s16, 1411 kb/s
Таким образом, количество кадров: 03: 23.18 * 44100 = 8960238
> ffmpeg -i input.wav -ar 22050 -ac 1 -f u8 -acodec pcm_u8 output.u8
Guessed Channel Layout for Input Stream #0.0 : stereo
Input #0, wav, from 'input.wav':
Metadata:
encoder : Lavf57.56.101
Duration: 00:03:23.18, bitrate: 1411 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, stereo, s16, 1411 kb/s
File 'output.u8' already exists. Overwrite ? [y/N] y
Output #0, u8, to 'output.u8':
Metadata:
encoder : Lavf57.56.101
Stream #0:0: Audio: pcm_u8, 22050 Hz, mono, u8, 176 kb/s
Metadata:
encoder : Lavc57.64.101 pcm_u8
Stream mapping:
Stream #0:0 -> #0:0 (pcm_s16le (native) -> pcm_u8 (native))
Press [q] to stop, [?] for help
size= 4375kB time=00:03:23.18 bitrate= 176.4kbits/s speed= 276x
video:0kB audio:4375kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.000000%
Теперь количество кадров должно быть наполовину от предыдущего, потому что мы сократили частоту дискретизации вдвое, то есть она должна быть 8960238/2 = 4480119. А поскольку формат u8, он должен быть точно таким же, как и байты.
> wc -c output.u8
4480160 output.u8
... но это на 41 байт больше, чем должно быть.