gpt4 book ai didi

Cuda 阶乘值无效

转载 作者:太空宇宙 更新时间:2023-11-04 01:04:44 25 4
gpt4 key购买 nike

我开始学习 CUDA。我写了程序来计算阶乘。代码正在运行,但是当我计算更多的阶乘 12 时,我得到了错误的值。为什么 CUDA 得到无效值?如何解决这个问题?这是我的代码。

#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include <conio.h>
#define CUPRINTF cuPrintf

__device__ int silnia(int n)
{
if (n<2)
return 1; //silnia z 0 i 1 wynosi 1
return n*silnia(n - 1);
}
__global__ void kernel(int *a)
{
*a = silnia(15);
}

int main()
{
cudaEvent_t start, stop;
float elapsedTime;
cudaEventCreate(&start);
cudaEventRecord(start, 0);
int *dev_a,a;
cudaEventRecord(start);
cudaMalloc((void**)&dev_a, sizeof(int));
kernel << <1, 1 >> >(dev_a);
cudaMemcpy(&a, dev_a, sizeof(int), cudaMemcpyDeviceToHost);
cudaEventCreate(&stop);
cudaEventRecord(stop, 0);
cudaEventSynchronize(stop);
cudaEventElapsedTime(&elapsedTime, start, stop);
printf("Elapsed time : %f ms\n", elapsedTime);
printf("%d", a);
getch();
return 0;
}

感谢帮助。

最佳答案

12 阶乘是 479001600,适合 int 变量。

13 阶乘是 6227020800,不适合 int 变量。

如果您将 int 更改为 unsigned long long(所有地方,包括您的 printf 格式说明符),您将获得更多范围,但是最终你会超出范围。

关于Cuda 阶乘值无效,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26225863/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com