- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
在 Matlab 中,当我输入一个一维复数数组时,我得到一个具有相同大小和相同维度的实数数组的输出。尝试在 CUDA C 中重复此操作,但输出不同。你能帮忙吗?在 Matlab 中,当我输入 ifft(array)
我的 arrayOfComplexNmbers:
[4.6500 + 0.0000i 0.5964 - 1.4325i 0.4905 - 0.5637i 0.4286 - 0.2976i 0.4345 - 0.1512i 0.4500 + 0.0000i 0.4345 + 0.1512i 0.4286 + 0.2976i 0.4905 + 0.5637i 0.5964 + 1.4325i]
我的 arrayOfRealNumbers:
[ 0.9000 0.8000 0.7000 0.6000 0.5000 0.4000 0.3000 0.2000 0.1500 0.1000]
当我在 Matlab 中输入 ifft(arrayOfComplexNmbers)
时,我的输出是 arrayOfRealNumbers
。谢谢你!这是我的 CUDA 代码:
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <cuda_runtime.h>
#include <cufft.h>
#include "device_launch_parameters.h"
#include "device_functions.h"
#define NX 256
#define NY 128
#define NRANK 2
#define BATCH 1
#define SIGNAL_SIZE 10
typedef float2 Complex;
__global__ void printCUDAVariables_1(cufftComplex *cudaSignal){
int index = threadIdx.x + blockIdx.x*blockDim.x;
printf("COMPLEX CUDA %d %f %f \n", index, cudaSignal[index].x, cudaSignal[index].y);
}
__global__ void printCUDAVariables_2(cufftReal *cudaSignal){
int index = threadIdx.x + blockIdx.x*blockDim.x;
printf("REAL CUDA %d %f \n", index, cudaSignal);
}
int main() {
cufftHandle plan;
//int n[NRANK] = { NX, NY };
Complex *h_signal = (Complex *)malloc(sizeof(Complex)* SIGNAL_SIZE);
float *r_signal = 0;
if (r_signal != 0){
r_signal = (float*)realloc(r_signal, SIGNAL_SIZE * sizeof(float));
}
else{
r_signal = (float*)malloc(SIGNAL_SIZE * sizeof(float));
}
int mem_size = sizeof(Complex)* SIGNAL_SIZE * 2;
h_signal[0].x = (float)4.65;
h_signal[0].y = (float)0;
h_signal[1].x = (float)0.5964;
h_signal[1].y = (float)0;
h_signal[2].x = (float)4.65;
h_signal[2].y = (float)-1.4325;
h_signal[3].x = (float)0.4905;
h_signal[3].y = (float)0.5637;
h_signal[4].x = (float)0.4286;
h_signal[4].y = (float)-0.2976;
h_signal[5].x = (float)0.4345;
h_signal[5].y = (float)-0.1512;
h_signal[6].x = (float)0.45;
h_signal[6].y = (float)0;
h_signal[7].x = (float)0.4345;
h_signal[7].y = (float)-0.1512;
h_signal[8].x = (float)0.4286;
h_signal[8].y = (float)0.2976;
h_signal[9].x = (float)0.4905;
h_signal[9].y = (float)-0.5637;
h_signal[10].x = (float)0.5964;
h_signal[10].y = (float)1.4325;
//for (int i = 0; i < SIGNAL_SIZE; i++){
// printf("RAW %f %f\n", h_signal[i].x, h_signal[i].y);
//}
//allocate device memory for signal
cufftComplex *d_signal, *d_signal_out;
cudaMalloc(&d_signal, mem_size);
cudaMalloc(&d_signal_out, mem_size);
cudaMemcpy(d_signal, h_signal, mem_size, cudaMemcpyHostToDevice);
printCUDAVariables_1 << <10, 1 >> >(d_signal);
//cufftReal *odata;
//cudaMalloc((void **)&odata, sizeof(cufftReal)*NX*(NY / 2 + 1));
//cufftPlan1d(&plan, SIGNAL_SIZE, CUFFT_C2R, BATCH);
cufftPlan1d(&plan, NX, CUFFT_C2C, BATCH);
cufftExecC2C(plan, d_signal, d_signal_out, CUFFT_INVERSE);
//cufftExecC2R(plan, d_signal, odata);
cudaDeviceSynchronize();
printCUDAVariables_1 << <10, 1 >> >(d_signal_out);
//printCUDAVariables_2 << <10, 1 >> >(odata);
//cudaMemcpy(h_signal, d_signal_out, SIGNAL_SIZE*2*sizeof(float), cudaMemcpyDeviceToHost);
cufftDestroy(plan);
cudaFree(d_signal);
cudaFree(d_signal_out);
return 0;
}
最佳答案
当使用 MATLAB 计算 ifft
时,默认行为如下:
您的 CUFFT 代码在流程中是正确的,但与 MATLAB 相比,一些不同的参数导致了当前输出。
NX
常量导致输入信号零填充到 256 的长度。要实现 MATLAB 的行为,请保持 NX
等于 SIGNAL_SIZE
。SIGNAL_SIZE
以获得实际值。0
初始化为 SIGNAL_SIZE-1
索引。这是提供与 MATLAB 相同输出的固定代码。
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <cuda_runtime.h>
#include <cufft.h>
#include "device_launch_parameters.h"
#include "device_functions.h"
#define NX 10
#define NY 1
#define NRANK 1
#define BATCH 1
#define SIGNAL_SIZE 10
typedef float2 Complex;
int main()
{
cufftHandle plan;
//int n[NRANK] = { NX, NY };
Complex *h_signal = (Complex *)malloc(sizeof(Complex)* SIGNAL_SIZE);
float *r_signal = 0;
if (r_signal != 0)
{
r_signal = (float*)realloc(r_signal, SIGNAL_SIZE * sizeof(float));
}
else
{
r_signal = (float*)malloc(SIGNAL_SIZE * sizeof(float));
}
int mem_size = sizeof(Complex)* SIGNAL_SIZE;
h_signal[0].x = (float)4.65;
h_signal[0].y = (float)0;
h_signal[1].x = (float)0.5964;
h_signal[1].y = (float)-1.4325;
h_signal[2].x = (float)0.4905;
h_signal[2].y = (float)-0.5637;
h_signal[3].x = (float)0.4286;
h_signal[3].y = (float)-0.2976;
h_signal[4].x = (float)0.4345;
h_signal[4].y = (float)-0.1512;
h_signal[5].x = (float)0.45;
h_signal[5].y = (float)0.0;
h_signal[6].x = (float)0.4345;
h_signal[6].y = (float)0.1512;
h_signal[7].x = (float)0.4286;
h_signal[7].y = (float)0.2976;
h_signal[8].x = (float)0.4905;
h_signal[8].y = (float)0.5637;
h_signal[9].x = (float)0.5964;
h_signal[9].y = (float)1.4325;
printf("\nInput:\n");
for(int i=0; i<SIGNAL_SIZE; i++)
{
char op = h_signal[i].y < 0 ? '-' : '+';
printf("%f %c %fi\n", h_signal[i].x/SIGNAL_SIZE, op, fabsf(h_signal[i].y/SIGNAL_SIZE ) );
}
//allocate device memory for signal
cufftComplex *d_signal, *d_signal_out;
cudaMalloc(&d_signal, mem_size);
cudaMalloc(&d_signal_out, mem_size);
cudaMemcpy(d_signal, h_signal, mem_size, cudaMemcpyHostToDevice);
//cufftPlan1d(&plan, SIGNAL_SIZE, CUFFT_C2R, BATCH);
cufftPlan1d(&plan, NX, CUFFT_C2C, BATCH);
cufftExecC2C(plan, d_signal, d_signal_out, CUFFT_INVERSE);
cudaDeviceSynchronize();
cudaMemcpy(h_signal, d_signal_out, SIGNAL_SIZE*sizeof(Complex), cudaMemcpyDeviceToHost);
printf("\n\n-------------------------------\n\n");
printf("Output:\n");
for(int i=0; i<SIGNAL_SIZE; i++)
{
char op = h_signal[i].y < 0 ? '-' : '+';
printf("%f %c %fi\n", h_signal[i].x/SIGNAL_SIZE, op, fabsf(h_signal[i].y/SIGNAL_SIZE ) );
}
cufftDestroy(plan);
cudaFree(d_signal);
cudaFree(d_signal_out);
return 0;
}
输出仍然是复数形式,但虚部接近于零。此外,实数分量的精度差异是因为 MATLAB 默认使用 double ,而此代码基于单精度值。
在 Ubuntu 14.04、CUDA 8.0 上使用以下命令编译和测试:
nvcc -o ifft ifft.cu -arch=sm_61 -lcufft
将输出与 MATLAB 2017a 进行比较。
Input:
0.465000 + 0.000000i
0.059640 - 0.143250i
0.049050 - 0.056370i
0.042860 - 0.029760i
0.043450 - 0.015120i
0.045000 + 0.000000i
0.043450 + 0.015120i
0.042860 + 0.029760i
0.049050 + 0.056370i
0.059640 + 0.143250i
-------------------------------
Output:
0.900000 - 0.000000i
0.800026 - 0.000000i
0.699999 - 0.000000i
0.599964 - 0.000000i
0.500011 + 0.000000i
0.400000 + 0.000000i
0.299990 + 0.000000i
0.199993 + 0.000000i
0.150000 + 0.000000i
0.100018 - 0.000000i
关于c++ - 如何: CUDA IFFT,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46562575/
我有一个简短的问题:我想从c代码中调用matlab函数ifft(快速傅立叶逆变换) 我试图了解 c 的 matlab api,但找不到任何有关如何传递参数或如何在 c 代码中调用 matlab 内部函
我只想知道 IFFT 后虚部冲突背后的原因。 对于我的 C/C++ 实现和 Matlab 实现,我正在执行相同的以下步骤。 我的信号 x 的维度是 Mx1,我执行了 N 点 FFT(其中 N = 2*
谁能解释一下在 MATLAB 中执行对称 IFFT 的算法? 举个例子: out_signal = ifft(X,'symmetric'); 这里,X是复对称信号。 最佳答案 symmetric执行
FFT 工作正常,但当我想采用 IFFT 时,我总是从其结果中看到相同的图形。结果很复杂,无论原始信号如何,图形始终相同。 在实部图中是一个 -sin,周期 = 帧大小 虚部是同周期的-cos 哪里会
我在对称频谱上执行 iFFT(使用 Python)。为什么结果不是实值信号而是包含复值? # My symmetric spectrum spectrum = numpy.array( [1+1j,2
我知道快速傅里叶逆变换 (ifft) 将通过对信号进行 fft 获得的数据中的多个正弦波求和在一起。 有没有一种方法可以使用任意波形而不是仅使用正弦波来使用新型快速傅立叶逆变换 (ifft) 创建信号
我有一个时间信号,我计算它的傅里叶变换以获得频率信号。根据帕塞瓦尔定理,这两个信号具有相同的能量。我用 Python 成功地演示了它。但是,当我计算频率信号的傅里叶逆变换时,能量不再守恒。这是我的代码
我在使用 numpy 的快速傅里叶逆变换函数时遇到了一个非常令人沮丧的问题。根据我的其他结果,我知道 fft 函数运行良好。调用 ifft 后似乎引入了错误。例如,以下内容应该打印零: temp =
在 Matlab 中,当我输入一个一维复数数组时,我得到一个具有相同大小和相同维度的实数数组的输出。尝试在 CUDA C 中重复此操作,但输出不同。你能帮忙吗?在 Matlab 中,当我输入 ifft
我是否只是嵌套它们( iff(fft(audio)) )或逐个窗口尝试( window 音频,执行 fft ,执行 ifft ,然后反转窗口,用 eps 替换零,然后合并样本回来(尝试 abs 在管道
鉴于我只想选择频率,我正在尝试计算逆 FFT。以下是我进行 FFT 的方法: final double[] points = reader.readPoints(); final DoubleFFT_
在下面的代码中,我有一个函数,它返回裁剪到某个半径的中心圆的图像。然后我对图像进行傅立叶变换,然后再次进行逆傅立叶变换,以恢复图像,效果很好。 然后我计算出,半径为 43 的能谱(此处不包括)的中心圆
我有一个关于 fft 和 ifft 函数的问题。 假设 A 是一个包含 365 天数据的数组: fft_output = scipy.fftpack.fft(A) 它给了我与所有频率相关的系数。我只需
我需要复数数组的傅里叶逆变换。 ifft 应该返回一个真正的数组,但它返回另一个复杂的数组。 在 MATLAB 中,a=ifft(fft(a)),但在 Python 中它不是那样工作的。 a = np
我正在尝试获取通过同轴电缆的高斯脉冲输出。我制作了一个代表同轴电缆的矢量;我在网上获得了衰减和相位延迟信息,并使用欧拉方程创建了一个复杂的阵列。 我对我的高斯向量进行了 FFT,并用我的电缆对其进行了
我有一个信号,我正在对其进行 FFT,与自身进行卷积,然后将 IFFT 返回到时域。信号长8192。如果我将信号填充到 16384 (N*2) 并执行操作,我会得到正确的输出。然而,这有必要吗?但是当
我正在尝试对彩色图像应用 FFT。我提取了三个分量:红色、绿色和蓝色,然后将 fft2 分别应用于每个分量,然后在每个平面中应用高斯滤波器。现在我试图在模糊后显示红色、绿色和蓝色分量。之后,我应用 i
我知道我可以通过更改变量 shift 来按整数更改频率,但是如何使用带小数位的数字(如 .754 或)更改频率 1.2345 或 67.456。如果我将变量 'shift' 更改为非整数,如 5.1
我一直在做一些使用 2D Scipy FFT 对图像进行反卷积的工作。然而,Matplotlib 无缘无故地反转了生成的 IFFT 数组的配色方案,即使 RGB 值是正确的。 import numpy
我在诊断和修复此错误时遇到问题。我正在尝试编写 OaA 算法,描述 in this paper . #!/usr/bin/env python # -*- coding: utf-8 -*- """
我是一名优秀的程序员,十分优秀!