Cuda阶乘值无效

set*_*eti 1 c cuda

我开始学习CUDA。我编写了计算阶乘的程序。代码正在运行,但是当我计算阶乘更多 12 时,我得到了错误的值。为什么 CUDA 获得无效值?如何解决这个问题?这是我的代码。

#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include <conio.h>
#define CUPRINTF cuPrintf

__device__ int silnia(int n)
{
    if (n<2)
        return 1; //silnia z 0 i 1 wynosi 1
    return n*silnia(n - 1);
}
__global__ void kernel(int *a)
{
    *a = silnia(15);
}

int main()
{
    cudaEvent_t start, stop;
    float elapsedTime;
    cudaEventCreate(&start);
    cudaEventRecord(start, 0);
    int *dev_a,a;
    cudaEventRecord(start);
    cudaMalloc((void**)&dev_a, sizeof(int));
    kernel << <1, 1 >> >(dev_a);
    cudaMemcpy(&a, dev_a, sizeof(int), cudaMemcpyDeviceToHost);
    cudaEventCreate(&stop);
    cudaEventRecord(stop, 0);
    cudaEventSynchronize(stop);
    cudaEventElapsedTime(&elapsedTime, start, stop);
    printf("Elapsed time : %f ms\n", elapsedTime);
    printf("%d", a);
    getch();
    return 0;
}
Run Code Online (Sandbox Code Playgroud)

谢谢你的帮助。

Rob*_*lla 5

12 阶乘是 479001600,它适合一个int变量。

13 阶乘是 6227020800,它不适合int变量。

如果您更改intunsigned long long(任何地方,包括您的printf格式说明符),您将获得更多范围,但最终您将超出范围。

  • 老实说,在我看来,对这样的代码进行性能测量是不明智的。您正在启动一个线程并做一些微不足道的工作。关于如何测量代码的经过时间,甚至一些特定于 CUDA 的问题,SO 上有很多问题。如果您还没有找到答案,请提出一个新问题。不可能在评论中详细介绍计时测量的细节。 (3认同)