cha*_*255 1 cuda
我想知道是否有一个相当于alloca函数的CUDA .
我需要创建浮点数组,作为我试图优化的数学函数的参数.问题是我真的不想在编译时知道参数的数量,这就是我现在用模板做的事情.我可以在CUDA中使用new运算符,但我觉得它很慢(也许我可以预先分配它或者其他东西).我会使用共享内存,但它不够大.
tal*_*ies 5
我不知道哪个像allocaCUDA那样有效.CUDA ABI中的堆栈帧在编译时由汇编器静态分配,所以我怀疑在堆栈帧上有动态分配内存的任何范围
alloca
归档时间:
9 年,9 月 前
查看次数:
111 次
最近记录: