gpt4 book ai didi

python - 在 PyCUDA 中 int 变量可以从主机传输到设备吗?

转载 作者:行者123 更新时间:2023-12-01 06:32:19 24 4
gpt4 key购买 nike

    import pycuda.driver as cuda
import pycuda.autoinit
from pycuda.compiler import SourceModule
import numpy as np
dims=img_in.shape
rows=dims[0]
columns=dims[1]
channels=dims[2]
#To be used in CUDA Device
N=columns
#create output image matrix
img_out=np.zeros([rows,cols,channels])

#Convert img_in pixels to 8-bit int
img_in=img_in.astype(np.int8)
img_out=img_out.astype(np.int8)

#Allocate memory for input image,output image and N
img_in_gpu = cuda.mem_alloc(img_in.size * img_in.dtype.itemsize)
img_out_gpu= cuda.mem_alloc(img_out.size * img_out.dtype.itemsize)
N=cuda.mem_alloc(N.size*N.dtype.itemsize)

#Transfer both input and now empty(output) image matrices from host to device
cuda.memcpy_htod(img_in_gpu, img_in)
cuda.memcpy_htod(img_out_gpu, img_out)
cuda.memcpy_htod(N_out_gpu, N)
#CUDA Device
mod=SourceModule("""
__global__ void ArCatMap(int *img_in,int *img_out,int *N)
{
int col = threadIdx.x + blockIdx.x * blockDim.x;
int row = threadIdx.y + blockIdx.y * blockDim.y;

int img_out_index=col + row * N;
int i=(row+col)%N;
int j=(row+2*col)%N;
img_out[img_out_index]=img_in[]

}""")

func = mod.get_function("ArCatMap")

#for i in range(1,385):
func(out_gpu, block=(4,4,1))

cuda_memcpy_dtoh(img_out,img_in)
cv2_imshow(img_out)

我这里有一张 512 X 512 的图像。我正在尝试使用 numpy.astype 将输入图像 img_in 的所有元素转换为 8 位 int。对于输出图像矩阵 img_out 也进行同样的操作。当我尝试使用 cuda.mem_alloc() 时,收到一条错误消息,指出“int 类型没有名为 size 的属性”和“int 类型没有名为 dtype 的属性”。另外,我收到一个名为“int 没有名为 astype 的属性”的错误。您能说出任何可能的原因吗?

最佳答案

您收到 python 错误。您定义了NN=dims[1]所以它只是一个单值整数。您不能对整数调用 size 函数,因为它们的大小为 1。同样,您不能检查 int 是哪种类型,因为它是 int。您在调用 cuda.mem_alloc 时执行此操作。

您不需要为单个 int 分配内存,只需按值传递即可。将内核定义为__global__ void ArCatMap(int *img_in,int *img_out,int N)而不是传递指针。

关于python - 在 PyCUDA 中 int 变量可以从主机传输到设备吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59839185/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com