- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我目前正在使用 opencl 为实际输入数据实现二维 FFT(更具体地说是使用 FFT 的快速二维卷积,所以我只需要一些行为足够相似的东西来应用卷积)。二维 FFT 是在行上使用一维 FFT,然后在列上使用一维 FFT 实现的。
为了提高效率,我尝试使用具有真实输入的 FFT 的对称性,以便能够计算更小的 FFT。我发现我可以将两行合并为一行,使用第一行作为实部,第二行作为虚部,对结果行执行第一个 1D FFT,然后使用对称属性来构造单个 1D FFT 的结果从那行。所以我所做的基本上是以下内容:
令 f
和 g
为矩阵中的行。
x = f + i * g
F(x) = F(f) + i * F(g)
F(x)
中提取 F(f)
和 F(g)
但是我不能将结果直接输入到第二个 1D FFT,因为在那种情况下我不会变换整个矩阵,而是变换两个子矩阵。然而,在转换之间提取数据意味着要么存储更多数据(n/2+1
条目需要在实际输入上表达 1D FFT 的结果),要么组合索引 0< 处的元素
并将 n/2
索引到一个元素中(使用相同的技巧组合,因为两个数字都保证是真实的)并使用相同数量的存储但必须为此做一个特殊的案例在我的卷积中。
由于我尝试尽可能多地重复使用缓冲区(由于 gpu 上可用的 RAM 有限),使用更多存储空间并不是一个好的解决方案。此外,我的算法无法处理不是 2 的幂/16 的倍数的矩阵大小(因内核而异)。我也宁愿避免引入特殊情况,因为那些会使我的内核更加复杂,从而影响效率(我已经难以最小化每个内核使用的寄存器数量)。
所以我的问题是,是否有解决此问题的优雅方法,即无需使用更多内存或某些元素的特殊情况即可工作的方法?
理想情况下,我希望能够执行整个 FFT 而无需在 FFT 中间拆分我的组合数据,但我不确定这是否可能。
最佳答案
嗯……我的两个引用是:
http://www.engineeringproductivitytools.com/stuff/T0001/PT10.HTMhttp://images.apple.com/acg/pdf/FFTapps_20090909.pdf
我认为采用“hermitian”数据结构,将 0 和 n/2 值打包到第一个元素中是可行的方法,因为正向/反向和 hermitian 结构会更好。
这样,您就有了 rUnWrap(FFT(n/2, Even(x) + i*Odd(x)))= rFFT(x),并且 riFFT 可以在“hermitian”阵列上运行,产生对偶数和奇数数组,再次给出原始结构。
还可以进行其他采样,将原始数组分解为4 n/2xn/2 数组,以 (0,0),(0,1),(1,0),(1,1) 为根,然后使用最终基数 4 在末尾包裹起来通过...也许这对 GPU 内存更好...我不知道。
艾伦
关于algorithm - 对实际输入数据进行高效二维 FFT?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3959289/
FFT 库(例如 FFTW 或 numpy.fft)通常提供两个函数 fft() 和 ifft()(及其用于实值输入的特殊版本)。这些功能似乎被定义为 ifft(fft(X)) == X 和 fft(
如果我有一个特定大小 M(2 的幂)的 FFT 实现,我如何计算一组大小 P=k*M 的 FFT,其中 k 也是 2 的幂? #define M 256 #define P 1024 comple
下午好! 我正在尝试基于我已有的简单递归 FFT 实现来开发 NTT 算法。 考虑以下代码(coefficients'的长度,让它为m,是2的精确幂): /// /// Calculates the
我正在分析时间序列数据,并希望提取 5 个主要频率分量并将其用作训练机器学习模型的特征。我的数据集是 921 x 10080 。每行是一个时间序列,总共有 921 个。 在探索可能的方法时,我遇到了各
我找不到任何官方文档来证明 scipy.fft 实际上是 numpy.fft.fftpack.fft 的链接。这是显示链接的 iPython session : In [1]: import scip
文档说 np.fft.fft 这样做: Compute the one-dimensional discrete Fourier Transform. 和 np.fft.rfft 这样做: Compu
近一个月来,我一直在与一个非常奇怪的错误作斗争。问你们是我最后的希望。我用 C 编写了一个程序,它集成了 2d Cahn–Hilliard equation在傅里叶(或倒数)空间中使用隐式欧拉 (IE
我一直在制作一个例程,使用 NumPy/Scipy 测量两个光谱之间的相位差。 我已经有了Matlab写的例程,所以我基本上是用NumPy重新实现了函数和相应的单元测试。但是,我发现单元测试失败了,因
我正在研究使用 Renderscript 对大型复杂输入数组执行 FFT。 FFT 是相当标准的,因为它涉及三个循环,但内部循环执行 FFT 中的蝶形运算。因为每个蝴蝶使用数组的不同部分,所以没有明显
我需要通过修改 FFT 结果来均衡音乐样本。 我知道如何获得每个输出虚数的频率,问题是修改这个值以获得“均衡器效果”。 我需要知道如何缩放这个值。 条目大小为 4096 个样本,采样率为 44100
我将在 kiss-fft 之前制定几个计划同时(平行),我可以这样做吗,或者换句话说,kiss-fft 线程安全吗? 谢谢 最佳答案 自述文件: No static data is used. Th
要在频域中插入信号,可以在时域中填充零并执行 FFT。 假设给定向量 X 中的元素数为 N 并且 Y 与 X 相同但在一侧用 N 零填充。然后下面给出相同的结果。 $$\hat{x}(k)=\sum_
我通过相关了解了 DFT 的工作原理,并将其用作理解 FFT 结果的基础。如果我有一个以 44.1kHz 采样的离散信号,那么这意味着如果我要获取 1 秒的数据,我将有 44,100 个样本。为了对其
有人知道 Mayer FFT 的实现吗(我不必花很多时间研究代码)? 我正在尝试执行卷积,ifft 似乎产生了我称之为“镜像”的输出。换句话说,我的内核+信号长度被限制为 N/2 并且占据 n=0..
有人知道 Mayer FFT 的实现吗(我不必花很多时间研究代码)? 我正在尝试执行卷积,ifft 似乎产生了我称之为“镜像”的输出。换句话说,我的内核+信号长度被限制为 N/2 并且占据 n=0..
我有以下代码...请注意#生成正弦曲线下的两行。一个使用比另一个更高的 2pi 精度值,但它们仍然应该给出几乎相同的结果。 import numpy as np import matplotlib.p
我正在努力确保 FFTW 做我认为它应该做的事情,但我遇到了问题。我正在使用 OpenCV 的 cv::Mat。我制作了一个测试程序,给定一个 Mat f,计算 ifft(fft(f)) 并将结果与
我是从事电信项目的计算机程序员。 在我们的项目中,我必须将一系列复数更改为它们的傅立叶变换。因此我需要一个高效的 FFT 代码来满足 C89 标准。 我正在使用以下代码,它运行良好: shor
我目前正在尝试了解 numpy 的 fft 函数。为此,我测试了以下假设: 我有两个函数,f(x) = x^2 和 g(x) = f'(x) = 2*x。根据傅立叶变换定律和 wolfram alph
我一直在使用 FFT,目前正在尝试使用 FFT 从文件中获取声音波形(最终对其进行修改),然后将修改后的波形输出回文件。我得到了声波的 FFT,然后对其使用了反 FFT 函数,但输出文件听起来一点也不
我是一名优秀的程序员,十分优秀!