python - 使用 pyopencl 进行 GPU 编程-6ren

python - 使用 pyopencl 进行 GPU 编程

转载作者：行者123 更新时间：2023-12-01 04:07:04

27

4

我对 GPU 编程非常陌生，我计划通过 Python 中的 pyopencl 访问 GPU。

不幸的是，这个主题没有太多支持，在深入研究之前，我认为向专家询问他们的经验可能是个好主意。

我计划在 GPU 上求解最大熵方程。我想要的方法是每次采用不同的输入运行代码 1000 次。

如果有人能为我指明这是否可行的正确方向，我将不胜感激。

谢谢

最佳答案

正如其他人已经评论的那样:是的 (py)OpenCl 是这项工作的“完美”工具。

我建议您查看示例以了解一切是如何工作的。 https://github.com/pyopencl/pyopencl/blob/master/examples

还有this pyOpenCL 作者的幻灯片值得一读。

一个简短的示例(没有导入和添加来自 here 的注释)

# Create some random test data
a_np = np.random.rand(50000).astype(np.float32)
b_np = np.random.rand(50000).astype(np.float32)

# Select a device
ctx = cl.create_some_context(interactive=True)
queue = cl.CommandQueue(ctx)

# Allocate memory on the device and copy the content of our numpy array    
mf = cl.mem_flags
a_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=a_np)
b_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=b_np)

# The code running on your device    
prg = cl.Program(ctx, """
__kernel void sum(
    __global const float *a_g, __global const float *b_g, __global float *res_g)
{
  int gid = get_global_id(0);
  res_g[gid] = a_g[gid] + b_g[gid];
}
""").build()

# Allocate the output buffer on the device
res_g = cl.Buffer(ctx, mf.WRITE_ONLY, a_np.nbytes)
# and call the above defined kernel
prg.sum(queue, a_np.shape, None, a_g, b_g, res_g)

# Create a numpy array for the results and copy them from the device
res_np = np.empty_like(a_np)
cl.enqueue_copy(queue, res_np, res_g)

关于python - 使用 pyopencl 进行 GPU 编程，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35421072/

27

4

0

文章推荐： javascript - HTML Canvas 嗅探 Webgl 数据

文章推荐： timer - 在 AT89S52、4Mhz 晶振下以 9600 波特发送数据

文章推荐： python绝对XPath返回空列表，通用查询更好吗？

python - 如何将多维数组传递给 pyopencl.algorithm.copy_if() -- PyOpenCL,
以下代码向我发出警告“警告:将'__global int'传递给'__global int *'类型的参数时不兼容的整数到指针转换；使用&获取地址”并且不会产生所需的结果。 import pyopen
python - 使用 GPU 优化 PyOpenCL 的不同方法 : extern function inside kernel GPU/PyOpenCL
我使用以下命令来分析我的 Python 代码: python2.7 -m cProfile -o X2_non_flat_multiprocessing_dummy.prof X2_non_flat.
python - PyOpenCL 程序未返回预期输出
我刚刚开始通过 PyOpenCL 学习 OpenCL，并且一直在关注一些教程。我正在编写脚本 here 。程序执行时没有任何错误，但数组的求和不正确。这是确切的代码: # Use OpenCL To
python - PyOpenCL 多维数组
我有使用 PyOpenCL 进行多维数组加法的代码。我的问题是，除了第一个维度之外，其他维度的结果都是错误的。我一直在咨询这个Link。 from __future__ import absolute
python - PyOpenCL 索引问题
我正在 python 中尝试 OpenCl，但无法弄清楚这个简单的矩阵复制代码我做错了什么。我的输入矩阵是: [[1 2 3 4], [5 6 7 8]， [9 10 11 12]， [13 14
python - PyOpenCl 基准问题
我对 https://github.com/inducer/pyopencl/blob/master/examples/benchmark-all.py 中的标准代码进行了一些修改用数字代替，变量z
python - 将内核存储在单独的文件中 - PyOpenCL
我试图将代码的内核部分与 3 个“””存储在不同的文件中。我尝试将其另存为文本文件和 bin 文件，然后读入，但我没有用它找不到成功。它开始给我一个错误，说“””丢失，或者)丢失。 “但是，如果我只是
python - pyopencl 示例设备错误
在运行程序时..错误是 Choose platform: [0] [1] Choice [0]:1 设置环境变量 PYOPENCL_CTX='1' to avoid being asked aga
ubuntu - PyOpenCL 找不到设备
问题描述我正在尝试在 Anaconda 中将 pyopencl 与我的 GPU 结合使用。但是没有找到设备。在 Python 中，我得到以下输出: >>> import pyopencl as cl
python - pyopencl 导入错误
我在 Windows 10 上运行 python 3.5.4 通过 Anaconda 和来自 conda-forge 的 pyopencl 2017.2，通过 Anaconda 安装。我的系统是i5
python - PyOpenCL 入门
我最近发现了 GP-GPU(通用图形处理单元)的强大功能，并想利用它在单台机器上执行“繁重”的科学和数学计算(否则需要大型 CPU 集群)。我知道有多种接口(interface)可以在 GPU 上运
python - PyOpenCl:如何调试段错误？
我有 PyOpenCL 代码和 OpenCL C 内核代码。我在运行我的应用程序时捕获了段错误。如何使用某些调试器或其他开发工具来调试此类错误？我不知道到底该怎么做才能找出问题所在。我想到了 prin
opencl - 如何在 pyOpenCL 中传递向量数组
我正在将模拟移动到 pyOpenCL 中，但无法使我的数据访问正常工作。我正在尝试提供一维向量数组(嗯，实际上有几个，但我包含的示例只使用了一个)。目前，几个向量被复制得很好，但是数据根本不是我提供
python - PyOpenCL，无法设置参数。无效值
我已经获得了提供的 OpenCL 内核以在 C 环境中执行，但是当我尝试使用 PyOpenCL 和提供的代码运行它时，出现以下错误: > Traceback (most recent call las
python - pyopenCL，openCL，无法在GPU上构建程序
我有一段内核源代码，可以在我的 PC 上的 G970 上运行，但无法在我的 2015 年初配备 Iris 6100 1536MB 显卡的 MacBook pro 上编译。 platform = cl.
python - 与 PyOpenCL 的结构对齐
更新:我的内核中的 int4 是错误的。我正在使用 pyopencl，但无法使结构对齐正常工作。在下面的代码中，调用内核两次，b 值正确返回(如 1)，但 c 值具有一些“随机”值。换句话说:我正
python - 用 pyopenCL 填充二维数组
我正在尝试使用 pyOpenCL 填充二维数组。计算内核及其调用贴在下面: ctx = cl.Context([cl.get_platforms()[0].get_devices()[0]]) que
python - pyopencl global_work_offset 内核参数
我想使用来自 OpenCL API 函数的 global_work_offset 参数 clEnqueueNDRangeKernel .我不知道如何在 pyopencl 中做到这一点应用程序接口(in
python - 如何在 PyOpenCL 中覆盖数组元素
我想用另一个数组覆盖 PyOpenCL 数组的一部分。这么说吧 import numpy as np, pyopencl.array as cla a = cla.zeros(queue,(3,3),
python - 安装 PyOpenCL 时出现问题
我正在尝试安装 PyOpenCL在 Ubuntu 16.04 上，但出现以下错误: /usr/bin/ld: cannot find -lOpenCL collect2: error: ld retu

首页

博学

6Ren·AI

商城

python - 使用 pyopencl 进行 GPU 编程