gpt4 book ai didi

audio - 我们可以从 MFCC 系数中恢复音频吗?

转载 作者:行者123 更新时间:2023-12-01 23:55:42 25 4
gpt4 key购买 nike

能否从其 MFCC 系数中获取音频信号? MFCC 系数是否也有一个取值范围,如果有,它是什么?如果没有,您如何将它归一化在 0 到 1 之间。

我尝试使用以下 MATLAB 代码:

http://labrosa.ee.columbia.edu/matlab/rastamat/

但恢复的音频与原始信号完全不同。

最佳答案

这个问题更适合 dsp stackexchange .

您无法修复来自 MFCC 的确切信号,它会在途中丢失一些信息,因此信号必须相似但不完全相同。通常它的质量较低。您可以在 http://www.research.ibm.com/haifa/projects/multimedia/recovc/demo/index.html 找到示例.

您始终可以将任何实值数据集规范化到 0..1 范围。一种方法是根据实验数据对标准差/变异进行归一化。如果你的数据是x = {x1, x2, x3,....}那么你可以考虑(x_i - mean(x))/std(x)。第二种方法是应用任何映射函数,如 arctan。通常不需要这样的规范化。

关于audio - 我们可以从 MFCC 系数中恢复音频吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23947306/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com