作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
为什么转置矩阵在转换为 pycuda.gpuarray
时看起来不同?
你能重现这个吗?什么可能导致这种情况?我使用了错误的方法吗?
示例代码
from pycuda import gpuarray
import pycuda.autoinit
import numpy
data = numpy.random.randn(2,4).astype(numpy.float32)
data_gpu = gpuarray.to_gpu(data.T)
print "data\n",data
print "data_gpu.get()\n",data_gpu.get()
print "data.T\n",data.T
data
[[ 0.70442784 0.08845157 -0.84840715 -1.81618035]
[ 0.55292499 0.54911566 0.54672164 0.05098847]]
data_gpu.get()
[[ 0.70442784 0.08845157]
[-0.84840715 -1.81618035]
[ 0.55292499 0.54911566]
[ 0.54672164 0.05098847]]
data.T
[[ 0.70442784 0.55292499]
[ 0.08845157 0.54911566]
[-0.84840715 0.54672164]
[-1.81618035 0.05098847]]
最佳答案
在 numpy 中,data.T
对底层一维数组没有任何作用。它只是操纵步幅来获得转置。这使其成为恒定时间和恒定内存操作。
看起来pycuda.to_gpu()
不尊重步幅,只是复制底层的一维数组。这将产生您正在观察的确切行为。
在我看来,您的代码没有任何问题。相反,我认为这是 pycuda
中的一个错误。 .
我用谷歌搜索,发现 a thread that discusses this issue in detail .
作为解决方法,您可以尝试通过 numpy.ascontiguousarray(data.T)
至 gpuarray.to_gpu()
.当然,这将在主机 RAM 中创建数据的第二个副本。
关于numpy - Pycuda弄乱了numpy矩阵转置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6901025/
我是一名优秀的程序员,十分优秀!