gpt4 book ai didi

c++ - 如何二维访问 CUDA 内核中的内存?例如d_A[i][j]

转载 作者:行者123 更新时间:2023-11-27 23:09:35 25 4
gpt4 key购买 nike

<分区>

我有一个 2d 类型的问题,我在实现内核时解决了这个问题。由于问题是二维的,如果我可以用 d_A[i][j] 而不是 d_A[i + m*j] 的话,内核中的可读性会更好使用列主矩阵排序。如果我只使用 cudaMalloc,访问 d_A[i][j] 将不起作用。我必须为此使用什么功能?我将不胜感激一个例子。在 C++ 中,这是通过分配 2d 内存来实现的,例如double** A = new double[10][10];

cudaMallocPitch有关系吗?或者音高版本仅用于最大化 2d 对齐和合并内存访问?

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com