gpt4 book ai didi

parallel-processing - FPGA 中的 Altera OpenCL 并行执行

转载 作者:行者123 更新时间:2023-12-04 21:14:03 25 4
gpt4 key购买 nike

我研究 Altera OpenCL 已经有一段时间了,通过将计算部分转移到 FPGA 来改进繁重的计算程序。我设法执行了 Altera 提供的矢量加法示例,并且似乎工作正常。我查看了 Altera OpenCL 的文档,了解到 OpenCL 使用流水线并行来提高性能。

我想知道是否有可能在 FPGA 中使用 Altera OpenCL 实现类似于 VHDL 中并行执行的多个进程的并行执行。就像在一个可以并行执行的设备中启动多个内核一样?可能吗?我如何检查它是否受支持?任何帮助将不胜感激。

谢谢!

最佳答案

快速的回答是肯定的。

根据 Altera OpenCL 指南,通常有两种方法可以实现:

1/用于向量化数据加载/存储的 SIMD

2/复制设备上的计算资源

对于 1/,使用 num_simd_work_itemsreqd_work_group_size 内核属性,来自同一工作组的多个工作项将同时运行

对于2/,使用num_compute_units 内核属性,多个工作组将同时运行

请先开发单工作项内核,然后使用1/来提高内核性能,一般最后会考虑2/。

通过执行 1/和 2/,将有多个工作组,每个工作组都有多个工作项同时在 FPGA 设备上运行。

注意:根据您要解决的问题的性质,上述优化可能并不总是适用。

关于parallel-processing - FPGA 中的 Altera OpenCL 并行执行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31276969/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com