gpt4 book ai didi

c++ - bool 乘法

转载 作者:行者123 更新时间:2023-11-30 17:39:11 28 4
gpt4 key购买 nike

我想使用 cuda 6 进行 bool 乘法,但我无法以正确的方式做到这一点。B 是一个 bool 对称矩阵,我必须进行 B^n bool 乘法。

我的 C++ 代码是:

for (m=0; m<dimension; m++) {
for (n=0; n<dimension; n++) {
for (k=0; k<dimension; k++) {
temp=mat[m*dimension+k] && mat[k*dimension+n];
B[m*dimension+n]= B[m*dimension+n] || temp;
}
}
}

我找到了一段代码,但无法适应我的情况。

__global__ void gpuMM(float *A, float *B, float *C, int N)
{
int row = blockIdx.y*blockDim.y + threadIdx.y;
int col = blockIdx.x*blockDim.x + threadIdx.x;

float sum = 0.f;
for (int n = 0; n < N; ++n)
sum += A[row*N+n]*B[n*N+col];

C[row*N+col] = sum;
}

最佳答案

使用内核的符号作为代码的第一部分,你会得到这个。

for (row=0; row<N; row++) {
for (col=0; col<N; col++) {
for (n=0; n<N; n++) {
temp=mat[row*N+n] && mat[n*N+col];
B[row*N+col] = B[row*N+col] || temp;
}
}
}

所以你的内核应该是这样的:

__global__ void gpu_booleanMM(char *mat, char *B, int N)
{
int row = blockIdx.y*blockDim.y + threadIdx.y;
int col = blockIdx.x*blockDim.x + threadIdx.x;

for (int n=0; n<N; n++) {
temp=mat[row*N+n] && mat[n*N+col];
B[row*N+col] = B[row*N+col] || temp;
}
}

我怀疑这是否非常有效,但这样的事情仍然应该给出正确的结果。

关于c++ - bool 乘法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21923261/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com