- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我刚刚开始通过 PyOpenCL 学习 OpenCL,并且一直在关注一些教程。我正在编写脚本 here 。程序执行时没有任何错误,但数组的求和不正确。这是确切的代码:
# Use OpenCL To Add Two Random Arrays (This Way Shows Details)
import pyopencl as cl # Import the OpenCL GPU computing API
import numpy as np # Import Np number tools
platform = cl.get_platforms()[0] # Select the first platform [0]
for device in platform.get_devices():
print device
device = platform.get_devices()[2] # Select the first device on this platform [0]
context = cl.Context([device]) # Create a context with your device
queue = cl.CommandQueue(context) # Create a command queue with your context
np_a = np.random.rand(5).astype(np.float32) # Create a random np array
np_b = np.random.rand(5).astype(np.float32) # Create a random np array
np_c = np.empty_like(np_a) # Create an empty destination array
cl_a = cl.Buffer(context, cl.mem_flags.COPY_HOST_PTR, hostbuf=np_a)
cl_b = cl.Buffer(context, cl.mem_flags.COPY_HOST_PTR, hostbuf=np_b)
cl_c = cl.Buffer(context, cl.mem_flags.WRITE_ONLY, np_c.nbytes)
# Create three buffers (plans for areas of memory on the device)
kernel = \
"""
__kernel void sum(__global float* a, __global float* b, __global float* c)
{
int i = get_global_id(0);
c[i] = a[i] + b[i];
}
""" # Create a kernel (a string containing C-like OpenCL device code)
program = cl.Program(context, kernel).build()
# Compile the kernel code into an executable OpenCL program
program.sum(queue, np_a.shape, None, cl_a, cl_b, cl_c)
# Enqueue the program for execution, causing data to be copied to the device
# - queue: the command queue the program will be sent to
# - np_a.shape: a tuple of the arrays' dimensions
# - cl_a, cl_b, cl_c: the memory spaces this program deals with
queue.finish()
np_arrays = [np_a, np_b, np_c]
cl_arrays = [cl_a, cl_b, cl_c]
for x in range(3):
cl.enqueue_copy(queue, cl_arrays[x], np_arrays[x])
# Copy the data for array c back to the host
arrd = {"a":np_a, "b":np_b, "c":np_c}
for k in arrd:
print k + ": ", arrd[k]
# Print all three host arrays, to show sum() worked
输出:
<pyopencl.Device 'Intel(R) Core(TM) i7-4870HQ CPU @ 2.50GHz' on 'Apple' at 0xffffffff>
<pyopencl.Device 'Iris Pro' on 'Apple' at 0x1024500>
<pyopencl.Device 'AMD Radeon R9 M370X Compute Engine' on 'Apple' at 0x1021c00>
a: [ 0.44930401 0.77514887 0.28574091 0.24021916 0.3193087 ]
c: [ 0.0583559 0.85157514 0.80443901 0.09400933 0.87276274]
b: [ 0.81869799 0.49566364 0.85423696 0.68896079 0.95608395]
我对这里发生的情况的猜测是数据正在主机和设备之间正确复制,但内核没有被执行。据我从本教程和其他教程中了解到,代码应该足以执行内核。启动内核是否需要其他调用?我不确定此示例使用的是哪个版本的 PyOpenCL,但我正在 Mac OS X 上从 conda-forge
运行 2016.2
。非常感谢任何帮助。
最佳答案
您使用错误的参数顺序调用了 enqueue_copy。你应该这样调用它:
cl.enqueue_copy(queue, np_arrays[x], cl_arrays[x])
另一方面,您不需要复制回输入数组,因为您已经在主机上创建了它们。
关于python - PyOpenCL 程序未返回预期输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40276228/
以下代码向我发出警告“警告:将'__global int'传递给'__global int *'类型的参数时不兼容的整数到指针转换;使用&获取地址”并且不会产生所需的结果。 import pyopen
我使用以下命令来分析我的 Python 代码: python2.7 -m cProfile -o X2_non_flat_multiprocessing_dummy.prof X2_non_flat.
我刚刚开始通过 PyOpenCL 学习 OpenCL,并且一直在关注一些教程。我正在编写脚本 here 。程序执行时没有任何错误,但数组的求和不正确。这是确切的代码: # Use OpenCL To
我有使用 PyOpenCL 进行多维数组加法的代码。我的问题是,除了第一个维度之外,其他维度的结果都是错误的。我一直在咨询这个Link。 from __future__ import absolute
我正在 python 中尝试 OpenCl,但无法弄清楚这个简单的矩阵复制代码我做错了什么。 我的输入矩阵是: [[1 2 3 4], [5 6 7 8], [9 10 11 12], [13 14
我对 https://github.com/inducer/pyopencl/blob/master/examples/benchmark-all.py 中的标准代码进行了一些修改 用数字代替,变量z
我试图将代码的内核部分与 3 个“””存储在不同的文件中。我尝试将其另存为文本文件和 bin 文件,然后读入,但我没有用它找不到成功。它开始给我一个错误,说“””丢失,或者)丢失。 “但是,如果我只是
在运行程序时..错误是 Choose platform: [0] [1] Choice [0]:1 设置环境变量 PYOPENCL_CTX='1' to avoid being asked aga
问题描述 我正在尝试在 Anaconda 中将 pyopencl 与我的 GPU 结合使用。但是没有找到设备。在 Python 中,我得到以下输出: >>> import pyopencl as cl
我在 Windows 10 上运行 python 3.5.4 通过 Anaconda 和来自 conda-forge 的 pyopencl 2017.2,通过 Anaconda 安装。我的系统是i5
我最近发现了 GP-GPU(通用图形处理单元)的强大功能,并想利用它在单台机器上执行“繁重”的科学和数学计算(否则需要大型 CPU 集群)。 我知道有多种接口(interface)可以在 GPU 上运
我有 PyOpenCL 代码和 OpenCL C 内核代码。我在运行我的应用程序时捕获了段错误。如何使用某些调试器或其他开发工具来调试此类错误?我不知道到底该怎么做才能找出问题所在。我想到了 prin
我正在将模拟移动到 pyOpenCL 中,但无法使我的数据访问正常工作。我正在尝试提供一维向量数组(嗯,实际上有几个,但我包含的示例只使用了一个)。 目前,几个向量被复制得很好,但是数据根本不是我提供
我已经获得了提供的 OpenCL 内核以在 C 环境中执行,但是当我尝试使用 PyOpenCL 和提供的代码运行它时,出现以下错误: > Traceback (most recent call las
我有一段内核源代码,可以在我的 PC 上的 G970 上运行,但无法在我的 2015 年初配备 Iris 6100 1536MB 显卡的 MacBook pro 上编译。 platform = cl.
更新:我的内核中的 int4 是错误的。 我正在使用 pyopencl,但无法使结构对齐正常工作。在下面的代码中,调用内核两次,b 值正确返回(如 1),但 c 值具有一些“随机”值。 换句话说:我正
我正在尝试使用 pyOpenCL 填充二维数组。计算内核及其调用贴在下面: ctx = cl.Context([cl.get_platforms()[0].get_devices()[0]]) que
我想使用来自 OpenCL API 函数的 global_work_offset 参数 clEnqueueNDRangeKernel .我不知道如何在 pyopencl 中做到这一点应用程序接口(in
我想用另一个数组覆盖 PyOpenCL 数组的一部分。这么说吧 import numpy as np, pyopencl.array as cla a = cla.zeros(queue,(3,3),
我正在尝试安装 PyOpenCL在 Ubuntu 16.04 上,但出现以下错误: /usr/bin/ld: cannot find -lOpenCL collect2: error: ld retu
我是一名优秀的程序员,十分优秀!