CUDA fft - Cooley tukey，如何利用并行性？-6ren

CUDA fft - Cooley tukey，如何利用并行性？

转载作者：行者123 更新时间：2023-12-02 19:58:57

64

4

我知道 FFT 实现是如何工作的 ( Cooley-Tuckey algorithm )，并且我知道有一个 CUFFT CUDA 库可以快速计算 1D 或 2D FFT，但我想知道在此过程中如何利用 CUDA 并行性。

与蝴蝶计算有关吗？ (就像每个线程将部分数据加载到共享内存中，然后每个线程计算偶数项或奇数项？)

最佳答案

我认为他们没有使用 Cooley-Tuckey 算法，因为它的索引排列阶段使其对于共享内存架构来说不太方便。此外，该算法适用于两倍的内存步幅，这也不利于内存合并。他们很可能使用 Stockham 自排序 FFT 的某种公式:例如 Bailey's algorithm .

关于实现，你是对的，通常会将一个大的 FFT 分成几个较小的 FFT，这些较小的 FFT 完全适合一个线程 block 。在 my work ，我对每个具有 128 个线程的线程 block 使用了 512 点或 1024 点 FFT(当然是完全展开的)。通常，由于需要大量数据传输，您不会在 GPU 上使用经典的 radix-2 算法。相反，我们选择 radix-8 甚至 radix-16 算法，以便每个线程一次执行一只大“蝴蝶”。如需示例实现，您还可以访问Vasily Volkov页面，或查看this “经典”论文。

关于CUDA fft - Cooley tukey，如何利用并行性？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12339864/

64

4

0

文章推荐： wordpress - 删除 Yoast SEO 插件添加的 rel canonical

文章推荐： datetime - 在 Cassandra 中使用日期

r - 将 Tukey 的重要性字母添加到箱线图中
我正在尝试使用 yaxis 上的计数 (MedMean) 和 xaxis 上的各种独立样本 (Site_Name) 的 ggplot 创建箱线图。 ggplot(medianlist,aes(x=re
java - tukey's ninther 用于相同数据的不同改组
在实现对快速排序分区的改进时，我尝试使用 Tukey 的九分法来找到主元(几乎借用了 sedgewick 在 QuickX.java 中的实现) 每次打乱整数数组时，我的下面代码都会给出不同的结果。
CUDA fft - Cooley tukey，如何利用并行性？
我知道 FFT 实现是如何工作的 ( Cooley-Tuckey algorithm )，并且我知道有一个 CUFFT CUDA 库可以快速计算 1D 或 2D FFT，但我想知道在此过程中如何利用
python - Python 中的 Tukey 五数总结
我一直无法在任何标准包中找到这个函数，所以我写了下面的一个。然而，在将它扔向 Cheeseshop 之前，有人知道已经发布的版本吗？或者，请提出任何改进建议。谢谢。 def fivenum(v):
r - 如何在 R 中编辑 Tukey 测试图
我对方差分析进行了事后 Tukey 检验，然后绘制了结果图。我似乎无法更改 x 轴标题或 y 轴标题。我收到此错误: Error in plot.default(c(xi[, "lwr"], xi[,
r - Tukey HSD 用于混合连续变量和分类变量，错误 : "no factors"
我正在尝试对死亡率数据进行 Tukey 检验，我想测试死亡率是否受铜含量(单向方差分析)以及铜和温度的组合(双向方差分析)的影响.这些是我的公式: lm2<-lm(Mortality~Cu) anov
r - 如何使用显示 CLD 字母的箱线图显示 Tukey 测试的结果
我收集了 216 个人的数据。我测量了每个人体内相同的 7 种物质的浓度，用 Sub1:Sub7 表示。这些物质的浓度在不同地点的个体中可能不同。我对这些个体可以根据这些物质的浓度进行分组的细化程度感
r - 如何更改 R 中 Tukey 测试中的样本顺序？
问题:我想了解如何更改 R 中 Tukey 测试计算平均值并分配相应字母的样本顺序。下面是非常简单的示例。我研究了iris数据，发现不同物种的萼片长度存在差异。这是箱线图: 我进行了方差分析测试，发
anova - 双向混合模型 ANOVA 的事后 tukey 检验
我和我的一些学生已经在许多地方寻找解决这个问题的方法，但没有成功，而且实际上已经花费了几个月的时间。我一直被称为我不想使用的 lme 命令。提供的输出不是我的同事或我自己使用了超过 15 年的输出。此
java - 带有 tukey urlrewritefilter 的动态 URL
我有多个链接，例如 - http://example.com/link1/title-with-detail - http://example.com/link2/title-with-detail
spring - 使用 tukey，当特定参数存在时从 url 中删除所有查询字符串参数
我刚接触到 tucker，正在尝试在 pentaho 服务器(spring)中重写 url 查询参数。我想做的是:重写 http://hostname:8080/pentaho/api/repos/
python - Matplotlib 中的 Tukey Boxplots - 代码中的异常值逻辑？
在阅读a related question in StackOverflow的答案时，我看到matplotlib中使用的代码to compute the wiskers positions and d
python - Cooley-Tukey 算法 python 超出范围
我正在分析用 Python 编写的 Cooley-Tukey 算法实现的复杂性(代码取自 here): def fft(x): N = len(x) print N, N//2 if N 10 的列
c++ - FFT Cooley Tukey 算法 - 不适用于多个数字
我正在尝试为 FFT 编写 Cooley Tukey 算法。现在，该算法运行良好，但仅适用于 2 个数字 - 没有别的。例如，我使用在线 FFT 计算，输入相同的数据并得到相同的结果。这是算法的代码:
python 统计模型 : tukey HSD plot not working
试图找出如何使用 statsmodel 计算 Tukey 的 HSD。我可以使它工作并且结果看起来很棒但是有一个我看不到的均值差异图。一定是我在做的傻事。它是对象 TukeyHSDResults 中
python - python 的哪个统计模块支持单向方差分析和事后测试(Tukey、Scheffe 或其他)？
我已尝试查看 Python 的多个统计模块，但似乎找不到任何支持 one-way ANOVA 事后测试的模块。最佳答案单方面的方差分析可以像这样使用 from scipy import stats
r - 在 R 中的双向方差分析中为 Tukey HSD 选择的输出
我有一个包含多个变量的大型数据集。我需要进行双向方差分析，然后使用 Tukey HSD 进行事后成对多重比较。我的前 25 个条目的数据头部是这样的: > head(my_data2, 25 )
r - 在表格中呈现 Tukey HSD 成对 p 值
我正在对我的数据运行事后 Tukey HSD，该数据有 10 个因子级别。该表很大，我希望在成对的表中向读者展示 p 值，将 45 行表留给附录。这是一个示例数据集: set.seed(42) x
r - 在 R 中可视化来自事后 Tukey 的临界值/成对比较
我正在尝试对从 posthoc Tukey 获得的临界值进行精细可视化。有一些good guidelines out there用于可视化成对比较，但我需要更精致的东西。我的想法是，我会有一个图，其中
r - 在表格中呈现 Tukey HSD 成对 p 值
我正在对我的数据运行事后 Tukey HSD，该数据有 10 个因子级别。该表很大，我希望在成对的表中向读者展示 p 值，将 45 行表留给附录。这是一个示例数据集: set.seed(42) x

首页

博学

6Ren·AI

商城

CUDA fft - Cooley tukey，如何利用并行性？