python - STFT 生成的重叠帧数-6ren

python - STFT 生成的重叠帧数

转载作者：太空宇宙更新时间：2023-11-03 14:13:19

26

4

我使用scipy.signal.stft来获取音频的stft。没问题，我正在得到结果。但我不明白的是，当使用采样率为fs=44100 Hz的169600个样本的音频来计算stft时，我得到 3 个返回，分别为 f、t 和 Zxx。这里Zxx的形状是(2049, 84)。

为了计算 stft，我使用大小为 4096 的窗口，并使用 hanning 窗口 作为窗口类型。默认情况下，scipy.signal.stft 在帧之间使用 window_size//2 重叠。

我的问题:是否有 2049 重叠的框架？如果是或不是，如何计算stft中重叠帧的数量？如果2049不是重叠样本的数量，那么这个数字意味着什么？

最佳答案

实值信号的 FFT 产生具有埃尔米特对称性的频谱。这意味着可以从下半部分获得频谱的上半部分。此外，当 FFT 大小 N 为偶数时，中点是其自身的对称性。因此，频谱完全由 N//2 + 1 个频率点(即 scipy.signal.stft 返回的频谱大小)决定。在您的情况下，N 是 4096，因此您会得到 4096//2 + 1 或 2049 点的频谱沿着频率轴。您应该能够确认 f 确实是一个 2049 频率值数组(从 0 到 44100/2 Hz，以 44100/4096 或 ~10.77Hz 增量)。

就时间值的数量而言，您可以将其计算为

number_of_samples = 169600
number_time_values = (number_of_samples+window_size)//(window_size - window_size//2) 
%  = (169600 + 4096)//(4096 - 2048) 
%  = 84

分子中的 +window_size (在您的情况下为 +4096)项是由于 boundary = 'zeros' 默认选项导致的在实际 169,600 个输入样本之前和之后用零填充输入。

关于python - STFT 生成的重叠帧数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48353671/

26

4

0

文章推荐： python - Aws Glue - S3 - native Python

文章推荐： python - 列表差异

文章推荐： ssl - SSL HTTP 和 HTTPS 之间有什么区别吗？

audio - readAudio-> cropAudio-> STFT == readAudio-> STFT-> cropAudio
以下是否相同？读取音频文件，然后将其裁剪为特定的帧长，并在摘录中执行短时傅立叶变换代码:stft(cropAudio(readAudio(wav))) 读取音频文件，然后对整个音频文件执行短时傅立
python - STFT 生成的重叠帧数
我使用scipy.signal.stft来获取音频的stft。没问题，我正在得到结果。但我不明白的是，当使用采样率为fs=44100 Hz的169600个样本的音频来计算stft时，我得到 3 个返回
Python:从 STFT 重建音频文件
作为一个简单的实验，我想计算 stft音频文件: sample_rate, samples = wav.read(file) f, t, Zxx = stft(samples, sample_rate
python - 如何应用二进制掩码和 STFT 来生成音频文件？
所以这里的想法是:您可以使用短时傅里叶变换 (stft) 从音频文件生成频谱图。然后有些人生成了一种称为“二进制掩码”的东西，以从反向 stft 生成不同的音频(即，去除背景噪声等)。以下是我的理解
python - Matplotlib 频谱图与 STFT
我目前正在使用 matplotlib 计算频谱图。我指定 NFFT=512，但生成的图像高度为 257。然后，我尝试执行 STFT(短时傅里叶变换)，它给出了 512 维向量(如预期)。如果我绘制 S
python - Librosa 音调跟踪 - STFT
我正在使用 this检测音高的算法 this音频文件。正如您所听到的，这是在吉他上弹奏的 E2 音符，背景中有一点噪音。我使用 STFT 生成了这个频谱图: 我正在像这样使用上面链接的算法: y,
signal-processing - STFT/FFT 工作流程顺序
我正在尝试实现 FFT，我对代码等没问题，但事情的一般顺序让我感到困惑。我认为这是正确的事情顺序吗？输入 -> 重叠输入 -> 窗口化 -> FFT -> 相位计算/重叠补偿 -> 输出我得到的
fft - STFT 澄清(实时输入的 FFT)
我通过相关了解了 DFT 的工作原理，并将其用作理解 FFT 结果的基础。如果我有一个以 44.1kHz 采样的离散信号，那么这意味着如果我要获取 1 秒的数据，我将有 44,100 个样本。为了对其
python - 使用 SciPy stft 函数指定短时傅里叶变换段中的样本数
我想对我的数据执行短时傅里叶变换，并为每个段指定特定的样本长度。我想使用信号子模块中的 SciPy 函数 stft。但是，当我通过以下方式创建长度 10e5 的音频数组时: fs = 10e3 # S
c++ - 实时数据的 STFT/滑动 FFT
我最近接手了一个项目，我需要对传入的麦克风数据执行实时滑动 FFT 分析。我选择执行此操作的环境是 OpenGL 和 Cinder，并使用 C++。这是我第一次接触音频编程，我有点困惑。这就是我试
python - 在 Librosa 中获取与 STFT 相关的频率
使用时librosa.stft()要计算频谱图，如何取回相关的频率值？我对生成图像不感兴趣，如 librosa.display.specshow ，而是我想要掌握这些值。 y, sr = libros
python - tf.contrib.signal.stft 返回一个空矩阵
这是我运行的一段代码: import tensorflow as tf sess = tf.InteractiveSession() filename = 'song.mp3' # 30 second
python - 模块 'scipy.signal' 没有属性 'stft'
根据文档，有一个 scipy.signal.stft 但是当尝试访问该函数时，我从标题中收到错误。该函数记录在 here . 此外，scip.signal.istft 也不存在。有什么建议吗？最佳答
fft - 在 Julia 中实现 STFT(短时傅立叶变换)的最佳方法是什么
所以，我想知道如何实现 STFT在 Julia 中，可能使用汉明窗。我在互联网上找不到任何东西。最好的方法是什么？我宁愿不使用 Python 库，但如果可能的话，我宁愿使用纯原生的 Julia。也许
python - scipy.signal.spectrogram 和 scipy.signal.stft 有什么区别？
函数 spicy.signal.spectrogram:https://docs.scipy.org/doc/scipy/reference/generated/scipy.signal.spectr
python - 如何通过 pywt 从 wav 文件中获取 2D 小波(如 stft)？
我正在尝试从声音文件(.wav)中获取特征；我尝试过 stft 来获取 2D 特征(x 是时间，y 是频率) 我尝试过 pywt，但得到的是一维数组。如果我输入一个 1D (1000,) wav 数
python - python librosa.core.stft() 和 matlab spectrogram(x) 的输出之间的区别
我正在将 Python 代码转换为 MATLAB。 Python 代码，使用以下命令: stft_ch = librosa.core.stft(audio_input[:, ch_cnt], n_ff
python - 使用 tensorflow.contrib.signal 重建信号会导致放大或调制(帧、overlap_and_add、stft 等)
更新:我在 librosa 中重新实现了这个来进行比较，结果确实与 tensorflow 的结果有很大不同。 Librosa 给出了我期望的结果(但不是 tensorflow)。我已将其发布为 is
pytorch - 如何在基于 arm 的 CPU 上模拟/运行使用 ATen STFT 实现的 PyTorch 模型？
我正在尝试在没有 gpu 的基于 arm 的设备上为 ASR 运行我的 PyTorch 模型。据我所知，arm 不支持 ATen 使用的 MKL。自然地，当我尝试进行推理时会收到以下错误: Runti

首页

博学

6Ren·AI

商城

python - STFT 生成的重叠帧数