小编Gra*_*ada的帖子

如何在内核中动态分配数组?

我需要在内核函数中动态分配一些数组.我怎么能这样做?

我的代码是这样的:

__global__ func(float *grid_d,int n, int nn){  
    int i,j;  
    float x[n],y[nn];  
    //Do some really cool and heavy computations here that takes hours.  
}
Run Code Online (Sandbox Code Playgroud)

但那不行.如果这是在主机代码中我可以使用malloc.cudaMalloc需要主机上的指针,以及设备上的其他指针.在内核函数内部,我没有主机指针.

所以我该怎么做?

如果花费太长时间(几秒钟)来分配所有数组(我需要大约4的大小为n和5大小为nn),这不会是一个问题.因为内核可能至少运行20分钟.

c cuda gpgpu

20
推荐指数
2
解决办法
2万
查看次数

如何模拟更精确的浮点?

可能重复:
扩展精度浮点库C/C++

我在大学工作分形,现在双精度是不够的.我使用的是长双,但我需要更高的精度.

有没有实现更高精度的lib?像512位,1024位还是2048位?

越多越好!

我真的不关心速度.

感谢您的关注.

c precision

2
推荐指数
1
解决办法
142
查看次数

标签 统计

c ×2

cuda ×1

gpgpu ×1

precision ×1