gpt4 book ai didi

Python scipy.fftpack.rfft 频点映射

转载 作者:太空宇宙 更新时间:2023-11-04 06:06:50 24 4
gpt4 key购买 nike

我正在尝试根据给定频率获取正确的 FFT bin 索引。音频以 44.1k Hz 采样,FFT 大小为 1024。鉴于信号是真实的(从 PyAudio 捕获,通过 numpy.fromstring 解码,通过 scipy.signal.hann 加窗),然后我通过 scipy.fftpack 执行 FFT .rfft,并计算结果的分贝,总的来说,magnitude = 20 * scipy.log10(abs(rfft(audio_sample)))

基于 this , 和 this , 我最初有从 FFT bin 索引 k 到任何频率 F 的映射,如:

F = k*Fs/N for k = 0 ... N/2-1 其中Fs是采样率,N 是 FFT bin 大小,在本例中为 1024。反之则为:

k = F*N/Fs for F = 0Hz ... Fs/2-Fs/N

然而,意识到 rfft 的结果不像 fft 那样对称,并在 N 大小的数组中提供结果。我现在对映射和功能有一些疑问。不幸的是,文档没有提供太多信息,因为我是这方面的新手。

我的问题:

  1. 对我来说,rfft 对音频样本的结果可以直接从第一个 bin 到最后一个 bin 使用,因为输出中没有出现对称性,对吗?

  2. 鉴于上述缺乏对称性,频率分辨率似乎有所增加,这种解释是否正确?

  3. 由于使用了 rfft,我从 bin 索引 k 到频率 F 的映射函数现在是 F = k *Fs/(2N) for k = 0 ... N-1 这是正确的吗?

  4. 相反,从频率 F 到 bin 索引 k 的反向映射函数现在变为 k = 2*F*N/Fs for F = 0Hz ... Fs/2-(Fs/2/N),请问这个正确性如何?

我的一般困惑来自 rfftfft 的关系,以及如何在使用 rfft 时正确完成映射。我相信我的映射有少量偏移,这在我的应用程序中至关重要。如有错误请指出错误或指教,万分感谢。

最佳答案

首先要为你澄清一些事情:

fftpack documentation 的快速引用显示 rfft 只为您提供 0..512 的输出向量(在您的情况下)。这样做的原因正是因为计算实值输入的离散傅里叶变换时存在的对称性:y[k] = y*[N-k](参见 Wikipedia page on DFTs)。因此,rfft 函数仅计算和存储 N/2+1 值,因为您可以通过仅采用复数共轭来计算另一半(如果您真的需要它来绘图(比如说))。 fft 函数不对输入值做出任何假设(它们可以同时具有实部和虚部),因此在输出中不能假设对称性,它会为您提供具有 N 个值的完整输出向量。诚然,大多数应用程序使用真实输入,因此人们倾向于假设对称性始终存在。请注意,快速傅里叶变换 (FFT) 是一种计算离散傅里叶变换 (DFT) 的(高效)算法,rfft 函数也使用 FFT 进行计算。

鉴于上述情况,您访问输出向量的索引超出范围,即 > 512。为什么/如何执行此操作的原因取决于您的代码。您应该清楚地区分“逻辑 N”(用于映射 bin 频率、定义 DFT 等)和“计算 N”(输出向量中值的实际数量),然后所有问题都应该消失.

具体回答您的问题:

  1. 没有。存在对称性,您需要使用它来计算最后的 bin(但它们不会为您提供额外信息)。

  2. 没有。提高 DFT 分辨率的唯一方法是增加样本长度。

  3. 没有,但差不多。 F = k*Fs/N 对于 k = 0..N/2

  4. 对于具有 N 个 bin 的输出向量,您将获得从 0 到 (N-1)/N*Fs 的频率。使用 rfft 你将得到一个带有 N/2+1 个 bins 的输出向量。你做数学,但我得到 0..Fs/2

希望事情现在更清楚了。

关于Python scipy.fftpack.rfft 频点映射,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21517998/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com