我正在尝试将 nvcc 与最简单的示例一起使用,但它无法正常工作。我正在编译并执行来自https://devblogs.nvidia.com/easy-introduction-cuda-c-and-c/的示例,但是我的服务器无法执行全局函数。我重写了代码以获取一些错误消息,并收到以下消息:“没有可在设备上执行的内核映像”
我的 GPU 是 Quadro 6000,cuda 版本是 9.0。
#include <stdio.h>
#include <cuda_runtime.h>
__global__ void saxpy(int n, float a, float *x, float *y)
{
int i = blockIdx.x*blockDim.x + threadIdx.x;
y[i] = 10.0; //a*x[i] + y[i];
}
int main(int argc, char *argv[])
{
int N = 120;
int nDevices;
float *x, *y, *d_x, *d_y;
cudaError_t err = cudaGetDeviceCount(&nDevices);
if (err != cudaSuccess)
printf("%s\n", cudaGetErrorString(err));
else
printf("Number of devices %d\n", nDevices);
x = (float*)malloc(N*sizeof(float));
y = …
Run Code Online (Sandbox Code Playgroud)