use*_*128 0 c++ cuda nvidia reinterpret-cast
考虑以下主机功能:
uint64_t * SomeDevPtr =...
/* Where SomeDevPtr is a pointer pointed to some device memory address allocated by cudaMalloc(); */
uint32_t * SomeDevIntPtr = reintepret_cast<uint32_t *>(SomeDevPtr);
Run Code Online (Sandbox Code Playgroud)
由于该功能,cudaMalloc将automatcially fullfill一些aligment要求(我认为它对准一些128字节存储器边界),因此,我认为无论是SomeDevIntPtr和SomeDevPtr应在GPU的全局内存确切相同的物理内存地址开始,我是正确的这一?
我只是想确定一下,因为我编写的一些函数依赖于它.
| 归档时间: |
|
| 查看次数: |
610 次 |
| 最近记录: |