小编Gra*_*ada的帖子

如何在内核中动态分配数组？

我需要在内核函数中动态分配一些数组.我怎么能这样做？

我的代码是这样的:

__global__ func(float *grid_d,int n, int nn){  
    int i,j;  
    float x[n],y[nn];  
    //Do some really cool and heavy computations here that takes hours.  
}

Run Code Online (Sandbox Code Playgroud)

但那不行.如果这是在主机代码中我可以使用malloc.cudaMalloc需要主机上的指针,以及设备上的其他指针.在内核函数内部,我没有主机指针.

所以我该怎么做？

如果花费太长时间(几秒钟)来分配所有数组(我需要大约4的大小为n和5大小为nn),这不会是一个问题.因为内核可能至少运行20分钟.

c cuda gpgpu

Gra*_*ada

2018 01-02

20
推荐指数

2
解决办法

2万
查看次数

如何模拟更精确的浮点？

可能重复:
扩展精度浮点库C/C++

我在大学工作分形,现在双精度是不够的.我使用的是长双,但我需要更高的精度.

有没有实现更高精度的lib？像512位,1024位还是2048位？

越多越好!

我真的不关心速度.

感谢您的关注.

c precision

Gra*_*ada

2017 05-23

2
推荐指数

1
解决办法

142
查看次数

标签统计

c ×2

cuda ×1

gpgpu ×1

precision ×1

如何在内核中动态分配数组？

如何模拟更精确的浮点？

标签 统计

小编Gra_ada的帖子

标签统计