gpt4 book ai didi

python - Librosa Mel 谱图对数形状

转载 作者:行者123 更新时间:2023-12-01 06:57:32 27 4
gpt4 key购买 nike

我正在使用 Python 中的 Librosa 从 GTZAN 数据集中提取对数梅尔频谱图。我的代码 -

data, sampling_rate = librosa.load(os.path.join(dir, folder, file), )
mel = librosa.feature.melspectrogram(y=data, hop_length = 512//2, n_fft = 512, n_mels = 64)
mel = librosa.power_to_db(mel**2)

嗯,效果很好。但是,每个梅尔谱图的大小是不同的。大多数对数梅尔谱图的大小为 2586,其中少数为 2590 到 2620。

我在梅尔频谱图上记录日志时检查了尺寸是否不同。如果所有音频的长度相同,那么在获取日志时它们的大小有何不同...

有什么建议吗,谢谢

最佳答案

音频文件的长度可能略有不同。这在数据集中经常发生。您可能应该将所有频谱图截断为最短公共(public)长度 (2586)。

mel = mel[:,0:2586]

关于python - Librosa Mel 谱图对数形状,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58742096/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com