作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在设备上有一大块生成的数据 (A[i,j,k]),但我只需要 A[i,:,:] 的一个“切片”,并且在常规 CUDA 中是这样的可以通过一些指针算术轻松完成。
同样的事情可以在 pycuda 中完成吗?即
cuda.memcpy_dtoh(h_iA,d_A+(i*stride))
显然这是完全错误的,因为没有尺寸信息(除非从目标形状推断),但希望您明白了?
最佳答案
pyCUDA gpuArray 类支持一维数组的切片,但不支持需要跨步的更高维度(尽管它即将到来)。但是,您可以从 gpuarray 成员(它是 pycuda.driver.DeviceAllocation 类型)访问多维 gpuArray 中的底层指针,并从 gpuArray.dtype.itemsize 成员访问大小信息。然后,您可以执行与您想要的相同类型的指针算术,以获得驱动程序 memcpy 函数将接受的内容。
它不是很 Pythonic,但它确实有效(或者至少当我去年进行大量 pyCUDA + MPI 黑客攻击时它有效)。
关于python - PyCUDA内存寻址: Memory offset?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5720376/
我是一名优秀的程序员,十分优秀!