- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
让
import pyopencl as cl
import pyopencl.array as cl_array
import numpy
a = numpy.random.rand(50000).astype(numpy.float32)
mf = cl.mem_flags
有什么区别
a_gpu = cl.Buffer(self.ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=a)
和
a_gpu = cl_array.to_device(self.ctx, self.queue, a)
?
和
有什么区别result = numpy.empty_like(a)
cl.enqueue_copy(self.queue, result, result_gpu)
和
result = result_gpu.get()
?
最佳答案
缓冲区是 CL 版本的 malloc
,而 pyopencl.array.Array
是计算设备上的 numpy 数组的类似工作。
因此对于问题第一部分的第二个版本,您可以编写 a_gpu + 2
来获得一个新数组,该数组中的每个数字都添加了 2,而在这种情况下Buffer
,PyOpenCL 只能看到一袋字节,不能执行任何此类操作。
你的问题的第二部分是相反的:如果你有一个 PyOpenCL 数组,.get()
将数据复制回来并将其转换为(基于主机的)numpy大批。由于 numpy 数组是在 Python 中获取连续内存的更方便的方法之一,带有 enqueue_copy
的第二个变体也以 numpy 数组结束——但请注意,您可以将此数据复制到一个任何大小(只要足够大)和任何类型的数组——复制是作为字节包执行的,而 .get()
确保你在主持人。
额外的事实:每个 PyOpenCL 数组下当然都有一个缓冲区。您可以从 .data
属性中获取它。
关于python - Pyopencl:to_device 和 Buffer 的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13396443/
让 import pyopencl as cl import pyopencl.array as cl_array import numpy a = numpy.random.rand(50000).
cuda.local.array()在 How is performance affected by using numba.cuda.local.array() compared with numb
我是一名优秀的程序员,十分优秀!