关于何时使用内联函数以及何时在常规C编码中避免它,有很多建议.__forceinline__对CUDA C __device__功能有什么影响?他们应该在哪里使用,哪里可以避免?
__forceinline__
__device__
c cuda gpgpu nvidia
c ×1
cuda ×1
gpgpu ×1
nvidia ×1