gpt4 book ai didi

通过频谱分析检测MP3比特率

转载 作者:行者123 更新时间:2023-12-04 03:09:55 29 4
gpt4 key购买 nike

是否有任何程序可以检测MP3的比特率?
我不是在说文件已被编码的有效比特率,而是真正的比特率只能通过频谱分析来计算。

例如,如果我有一个以128 kbps编码的MP3,其大小为1 MB,然后将该MP3转码为320 kpbs,其大小为3 MB,则我将具有相同的音轨,但大小不同。

如果我有一个320 kbps的MP3,然后将其转码为128 kbps,我会失去一些质量,因此会丢失一些文件大小。

但是,我仍然无法验证320 kbps是我的MP3的“真实”比特率。

详细信息在本文中进行了解释:
http://www.fileden.com/files/2009/2/14/2321055/My%20Documents/MP3%20Bit%20Rate%20Quality%20Detection%20through%20Frequency.pdf

最佳答案

首先,https://www.google.com/?q=mp3+cutoff+frequency可能很有启发性。

其次,几乎所有MP3都使用带有标准多相低通滤波器的预设进行编码。由于实际上不可能用MP3进行无损压缩,因此丢失的实际上是基频的高次谐波(请参见FFT,DCT,小波变换等)。应用滤波器,以便以后对频谱进行傅立叶分析的结果与人类的听觉范围更加一致(即,从分析中完全消除了听不到的/掩盖的频率)。实际上,如果不切断/严重扭曲高频,就不可能实现高压缩率,因为实际上它们占据了比特流的大部分空间。

当然,如果没有截止频率,则频域限制的准确性会降低-但仍然会发生。除其他原因外,采用了截止,从而在心理声学听力范围之外产生了压缩伪像。

作为引用-对流进行频谱分析(如果较高的频率范围足够饱和,则具有Winamp克隆的实时SA就足够了,如果您有工具,也可以简单地做一个频谱图),然后找到截止点。在下面的示例中,截断发生在15 kHz处,这告诉我流最初是在128 kbps时压缩的;我什至要说的是,实际上有可能通过多种音乐通过耳朵区分<= 128 kpbs的流(鼓型低音和其他具有很高音质的电子音乐流派)。

最常见的临界值是:(请注意,它们在CBR中是“硬”的,在ABR/VBR中是“软”的)

  • 128 kbps:15-16 kHz(在摇滚音乐或电子音乐上听得见的非常!“空间损失”效果)
  • 192 kbps:〜19 kHz(大多数情况下几乎听不见,大多数情况下认为是透明的)
  • 256-320 kbps:>〜20kHz(听不清)

  • 是的,我知道有些人可以听到20 kHz以上的声音,但是音乐中出现的掩蔽效果以及扬声器的实际响应时间意味着,在实际音乐中,20 kHz的截止频率与音质无关。

    资料来源:拥有reasearch作为音频工程师,再加上
    https://web.archive.org/web/20150313010213/http://www.whatinterviewprep.com/prepare-for-the-interview/spectral-analysis/作为附加引用

    关于通过频谱分析检测MP3比特率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3578615/

    29 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com