gpt4 book ai didi

audio - AAC 数据包大小

转载 作者:行者123 更新时间:2023-12-02 22:30:50 50 4
gpt4 key购买 nike

我正在处理具有以下元数据的 M4a 文件:

Metadata:
major_brand : M4A
minor_version : 0
compatible_brands: M4A mp42isom
creation_time : 2019-08-14T13:45:39.000000Z
iTunSMPB : 00000000 00000840 00000000 00000000000387C0 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000
Duration: 00:00:05.25, start: 0.047891, bitrate: 69 kb/s
Stream #0:0(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, mono, fltp, 65 kb/s (default)

音频持续时间 = 5246.2585 毫秒

我正在尝试使用以下公式计算帧数:
duration * sampling rate / frame size = 5246.2585 * 44.1/1024 = 225.9375 frames

我尝试了多个文件,它总是给出 xxx.9357 帧。

但是,使用 FFprobe:
ffprobe -i audio.m4a  -show_streams -hide_banner

我正进入(状态:
nb_frames=228

我的计算和 FFprobe 输出之间总是有 2.0625 的差异。
任何想法我在这里做错了什么?如何准确计算帧数?

最佳答案

在AAC中,每1024个样本有一个包,但每个包影响2048个样本,每个样本部分记录在两个包中。因此,如果要正确表示 N 个数据包的音频样本,则需要使用 N+1 个数据包。

如果我们认为这是每个数据包影响相应的 1024 个样本以及下一个样本块,那么这意味着前 1024 个样本无法正确表示,因此通常的做法是在编码器中用零预填充信号.在播放时,这些将被丢弃,这就是为什么信号的持续时间比您通过数据包计数所预期的要短。

由于某些原因,通常的做法实际上是用2112个样本而不是1024个样本填充。 填充的长度实际上并没有记录在AAC文件中,也没有在标准中指定,所以大家只是使用2112与其他人兼容。

2112 个样本正好是 2.0625 个数据包。

如果你想了解更多关于这个,神奇的谷歌词是“AAC priming”

关于audio - AAC 数据包大小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59173435/

50 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com