gpt4 book ai didi

fft - STFT 澄清(实时输入的 FFT)

转载 作者:行者123 更新时间:2023-12-03 03:22:44 25 4
gpt4 key购买 nike

我通过相关了解了 DFT 的工作原理,并将其用作理解 FFT 结果的基础。如果我有一个以 44.1kHz 采样的离散信号,那么这意味着如果我要获取 1 秒的数据,我将有 44,100 个样本。为了对其运行 FFT,我必须有一个 44,100 的数组和一个 N=44,100 的 DFT,以获得检测高达 22kHz 的频率所需的分辨率,对吧? (因为FFT只能将输入与频率最高为N/2的正弦分量相关)

这显然需要大量数据点和计算时间,而且我读到这就是短时 FT (STFT) 的用武之地。如果我随后获取前 1024 个样本(~23ms)并运行 FFT然后取重叠的 1024 个样本,我可以每 23ms 得到信号的连续频域。那么我该如何解释输出呢?如果静态数据的 FFT 输出是 N/2 个数据点,带宽为 fs/(N/2),那么 STFT 频率输出的带宽是多少?

这是我在 Mathematica 中运行的一个示例:

100Hz 正弦波,44.1kHz 采样率: enter image description here

然后我仅对前 1024 个点运行 FFT: enter image description here

感兴趣的频率位于数据点 3,它应该以某种方式对应于 100Hz。我认为 44100/1024 = 43 类似于缩放因子,这意味着这个小窗口中的 1Hz 信号将对应于完整数据数组中的 43Hz 信号。然而,这会给我 43Hz*3 = 129Hz 的输出。我的逻辑是正确的但我的实现不正确吗?

最佳答案

正如我在之前的评论中已经指出的,变量 N 影响输出频谱可实现的分辨率,而不是您可以检测到的频率范围。较大的 N 可以为您提供更高的分辨率,但代价是更长的计算时间较低的 N 可以缩短计算时间,但可能会导致 spectral leakage ,这就是您在上一张图中看到的效果。

至于你的另一个问题,理论上 FFT 的带宽是无限的,但我们将结果限制在 [-fs/2 到 fs/2] 范围内的频段,因为该频段之外的所有频率容易受到aliasing的影响此外,如果输入信号是真实的(在包括我们在内的大多数情况下都是如此),那么从 [-fs/2 到 0] 的频率只是从 [0 到 fs/的频率的反射(reflect)2],因此一些 FFT 程序仅输出从 [0 到 fs/2] 的 FFT 频谱,我认为这适用于您的情况。这意味着您作为输出收到的 N/2 数据点代表范围 [ 0 到 fs/2],这就是您在 FFT 和 STFT 的情况下使用的带宽(STFT 只是一系列 FFT,STFT 中的每个 FFT 都会为您提供一个频谱该带内的数据点)。

我还想指出,如果您的输入是变化的信号(例如音乐),STFT 很可能不会减少您的计算时间,因为在这种情况下,您将需要执行它几次 在歌曲的整个播放过程中,它没有任何用处,但是,与仅执行一次 FFT 相比,它将使您能够更好地理解歌曲的频率特性。

要可视化 FFT 的结果,您可以使用频率(和/或相位)频谱图,但为了可视化 STFT 的结果,您很可能需要创建 spectrogram这基本上是一个图表,可以通过将各个 FFT 频谱并排放置来制作。创建频谱图的过程如下图所示(来源:Dan Ellis - 语音处理简介)。频谱图将向您展示信号的频率特性如何随时间变化以及您如何解释它取决于您希望从音频中提取/检测哪些特定特征。您可能需要查看 spectrogram维基百科页面了解更多信息。

enter image description here

关于fft - STFT 澄清(实时输入的 FFT),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30466418/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com