- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试根据给定频率获取正确的 FFT bin 索引。音频以 44.1k Hz
采样,FFT 大小为 1024
。鉴于信号是真实的(从 PyAudio 捕获,通过 numpy.fromstring
解码,通过 scipy.signal.hann
加窗),然后我通过 scipy.fftpack 执行 FFT .rfft
,并计算结果的分贝,总的来说,magnitude = 20 * scipy.log10(abs(rfft(audio_sample)))
基于 this , 和 this , 我最初有从 FFT bin 索引 k
到任何频率 F
的映射,如:
F = k*Fs/N for k = 0 ... N/2-1
其中Fs
是采样率,N
是 FFT bin 大小,在本例中为 1024
。反之则为:
k = F*N/Fs for F = 0Hz ... Fs/2-Fs/N
然而,意识到 rfft
的结果不像 fft
那样对称,并在 N
大小的数组中提供结果。我现在对映射和功能有一些疑问。不幸的是,文档没有提供太多信息,因为我是这方面的新手。
我的问题:
对我来说,rfft
对音频样本的结果可以直接从第一个 bin 到最后一个 bin 使用,因为输出中没有出现对称性,对吗?
鉴于上述缺乏对称性,频率分辨率似乎有所增加,这种解释是否正确?
由于使用了 rfft
,我从 bin 索引 k
到频率 F
的映射函数现在是 F = k *Fs/(2N) for k = 0 ... N-1
这是正确的吗?
相反,从频率 F
到 bin 索引 k
的反向映射函数现在变为 k = 2*F*N/Fs for F = 0Hz ... Fs/2-(Fs/2/N)
,请问这个正确性如何?
我的一般困惑来自 rfft
与 fft
的关系,以及如何在使用 rfft
时正确完成映射。我相信我的映射有少量偏移,这在我的应用程序中至关重要。如有错误请指出错误或指教,万分感谢。
最佳答案
首先要为你澄清一些事情:
fftpack documentation 的快速引用显示 rfft 只为您提供 0..512 的输出向量(在您的情况下)。这样做的原因正是因为计算实值输入的离散傅里叶变换时存在的对称性:y[k] = y*[N-k](参见 Wikipedia page on DFTs)。因此,rfft 函数仅计算和存储 N/2+1 值,因为您可以通过仅采用复数共轭来计算另一半(如果您真的需要它来绘图(比如说))。 fft 函数不对输入值做出任何假设(它们可以同时具有实部和虚部),因此在输出中不能假设对称性,它会为您提供具有 N 个值的完整输出向量。诚然,大多数应用程序使用真实输入,因此人们倾向于假设对称性始终存在。请注意,快速傅里叶变换 (FFT) 是一种计算离散傅里叶变换 (DFT) 的(高效)算法,rfft 函数也使用 FFT 进行计算。
鉴于上述情况,您访问输出向量的索引超出范围,即 > 512。为什么/如何执行此操作的原因取决于您的代码。您应该清楚地区分“逻辑 N”(用于映射 bin 频率、定义 DFT 等)和“计算 N”(输出向量中值的实际数量),然后所有问题都应该消失.
具体回答您的问题:
没有。存在对称性,您需要使用它来计算最后的 bin(但它们不会为您提供额外信息)。
没有。提高 DFT 分辨率的唯一方法是增加样本长度。
没有,但差不多。 F = k*Fs/N 对于 k = 0..N/2
对于具有 N 个 bin 的输出向量,您将获得从 0 到 (N-1)/N*Fs 的频率。使用 rfft 你将得到一个带有 N/2+1 个 bins 的输出向量。你做数学,但我得到 0..Fs/2
希望事情现在更清楚了。
关于Python scipy.fftpack.rfft 频点映射,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21517998/
我已经阅读了很多关于这个主题的讨论( comparison between lomb-scargle and fft 、 Plotting power spectrum in python 、 Sci
我正在尝试使用从 Netlib ( http://www.netlib.org/fftpack/ ) 下载的从 Fortran 转换为 C 的 FFTPACK。不幸的是,它似乎没有真正的记录,而且非常
使用 scipy 的 fftpack 执行 fft 时,我遇到内存使用率过高的问题。使用模块 memory_profiler 获得的示例: Line # Mem usage Increme
import scipy from scipy import* from scipy.fftpack import* from scipy.fftpack import fft, ifft, fft2
我想将 scipy.fftpack 中的 dct 功能与 numpy float64 数组一起使用。然而,它似乎只为 np.float32 实现。我可以采取任何快速解决方法来完成这项工作吗?我很快调查
我正在尝试根据给定频率获取正确的 FFT bin 索引。音频以 44.1k Hz 采样,FFT 大小为 1024。鉴于信号是真实的(从 PyAudio 捕获,通过 numpy.fromstring 解
scipy.fftpack.rfft 函数将 DFT 作为浮点向量返回,在实部和复数部分之间交替。这意味着要一起乘以 DFT(用于卷积),我将不得不“手动”进行复数乘法,这看起来非常棘手。这一定是人们
我用 easy_install scipy 安装了 scipy,但是 Python 找不到 scipy.fftpack.dct()功能。我做错了什么? 最佳答案 scipy.fftpack.dct 在
我有 44100Hz 音频,这意味着每秒有 44100 个样本。我想分析它,所以我将数据分成长度为1024的子数组。 对于每个数组,我应用傅立叶变换 (fft),它返回一个复数数组。这些数字应该是位移
正弦信号的解析傅立叶变换为 purely imginary 。然而,当数值计算离散傅立叶变换时,结果却并非如此。 Tldr:找到此问题的所有答案 here . 因此请考虑以下代码 import mat
我需要在 Python 中根据 .tiff 医学图像计算傅立叶系数。代码产生内存错误: for filename in glob.iglob ('*.tif'): imgfourier
我无法理解 scipy 的这种行为。来自scipy.fftpack docs我了解到 fft 的输出显然很复杂,形状如下: [y(0),y(1),..,y(n/2),y(1-n/2),...,y(-1
scipy.fftpack包提供了大量与离散傅里叶变换相关的例程。我需要仅使用 DST (DCT) 计算函数的一阶和二阶导数。然而,该包包含 diff 例程,它使用 FFT 返回第 k 导数 有谁知道
当我使用 scipy.fftpack 对信号计算 FFT 并随后绘制它时,我得到一条恒定的水平线(数据上有一条垂直线)任何人都可以解释为什么会出现这些线,并可能提出一个绘制解决方案没有谱线的光谱? 让
我试图使用以下代码简单地在频域中的灰度输入 Lena 图像上应用高斯滤波器,这是我得到的错误输出: from scipy import signal from skimage.io import im
假设您使用 dct 函数,则不对数据进行任何操作并使用逆变换;反转后的数据不会和转换前的数据一样吗?为什么是 float 问题?这是报告的问题还是正常行为? In [21]: a = [1.2, 3.
后者只是前者的同义词,还是它们是 FFT 的两种不同实现?哪个更好? 最佳答案 SciPy 做得更多: http://docs.scipy.org/doc/numpy/reference/routin
我正在尝试计算一些数据的导数,并且正在尝试比较有限差分的输出和谱方法的输出。但结果却大不相同,我也想不通到底是为什么。 考虑下面的示例代码 import numpy as np from scipy
我曾经在 32 位 Python 2.7 上使用 scipy.fftpack,但现在我升级到 64 位 Python 并从 here 获得了 SciPy , 我注意到它似乎不包括 FFTPack。 在
我正在我的 LFS - Linux 从头开始 - 系统上编译 Octave 。 在配置 Octave 时,我收到一个警告: configure: WARNING: FFTW3F library n
我是一名优秀的程序员,十分优秀!