gpt4 book ai didi

linux - 如何使用 Sox 检测音频文件中的响亮声音?

转载 作者:太空宇宙 更新时间:2023-11-04 10:45:59 25 4
gpt4 key购买 nike

我有几个小的音频文件,我需要找出哪些包含响亮的声音。使用 Sox 的 stat 命令,我得到最大和最小振幅,它们始终在 -1 和 +1 左右。

比如这个声音比较响亮:

$ sox out6.wav -n stat
Samples read: 220500
Length (seconds): 5.000000
Scaled by: 2147483647.0
Maximum amplitude: 0.999939
Minimum amplitude: -1.000000
Midline amplitude: -0.000031
Mean norm: 0.079951
Mean amplitude: -0.002050
RMS amplitude: 0.244085
Maximum delta: 0.386505
Minimum delta: 0.000000
Mean delta: 0.007803
RMS delta: 0.024331
Rough frequency: 699
Volume adjustment: 1.000

比这个:

$ sox out5.wav -n stat
Samples read: 220500
Length (seconds): 5.000000
Scaled by: 2147483647.0
Maximum amplitude: 0.999939
Minimum amplitude: -1.000000
Midline amplitude: -0.000031
Mean norm: 0.035560
Mean amplitude: -0.000054
RMS amplitude: 0.121909
Maximum delta: 0.085022
Minimum delta: 0.000000
Mean delta: 0.002599
RMS delta: 0.006305
Rough frequency: 363
Volume adjustment: 1.000

但它们都具有相同的最小和最大振幅。

如何确定哪个声音最大?

最佳答案

峰值振幅不是衡量整体响度的好方法。所有这些测量所做的就是找出一段时间内出现的最大或最小样本。这样做的问题是全零和一个零的剪辑将测量与全零的剪辑相同的最大峰值幅度。 RMS(均方根)幅度是响度的更好衡量标准。它是通过对所有样本的平方求和然后取结果的平方来计算的。 https://en.wikipedia.org/wiki/Amplitude

关于linux - 如何使用 Sox 检测音频文件中的响亮声音?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33104765/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com