gpt4 book ai didi

image-processing - 在 OpenCL 内核中调用 BLAS 例程

转载 作者:行者123 更新时间:2023-12-04 08:29:01 24 4
gpt4 key购买 nike

目前我正在使用 OpenCL 做一些图像处理算法。基本上我的算法需要为每个像素求解线性方程组。每个系统都独立于其他系统,因此采用并行实现是很自然的。

我看过几个 BLAS 包,例如 ViennaCL 和 AMD APPML ,但似乎它们都有相同的使用模式(主机调用要在 CL 设备上执行的 BLAS 子例程)。

我需要的是一个可以在 OpenCL 内核中调用的 BLAS 库,以便我可以并行解决许多线性系统。

我在 AMD 论坛上发现了这个类似的问题。

  • Calling APPML BLAS functions from the kernel

  • 谢谢

    最佳答案

    这是不可能的。 clBLAS 例程进行一系列内核启动,一些“解决”例程内核启动非常复杂。 clBLAS 例程将 cl_mem 和 commandQueues 作为参数。因此,如果您的缓冲区已经在设备上,clBLAS 将直接对其进行操作。它不接受主机缓冲区或管理主机-> 设备传输

    如果您想查看生成和启动的内核,请取消注释此行 https://github.com/clMathLibraries/clBLAS/blob/master/src/library/blas/generic/common.c#L461并构建 clBLAS。它将转储所有被调用的内核

    关于image-processing - 在 OpenCL 内核中调用 BLAS 例程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18709287/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com