use*_*929 8 architecture gpu gpgpu opencl amd-processor
我正在OpenCL中编写一个算法,我需要每个工作单元记住一部分数据,比如每个内核的a long[70]和a long[200]左右.
最近的AMD设备具有32 KiB __local内存,这是(对于每个内核的给定数据量)足以存储20-58个工作单元的信息.但是,根据我从架构中理解的内容(特别是从该图中),每个着色器核心还具有专用的私有内存量.然而,我找不到它的大小.
任何人都可以告诉我如何找出每个内核有多少私有内存?
我对HD7970特别好奇,因为我打算很快购买其中的一些.
编辑:问题解决了,答案是这里的附录D.
答案是由用户talonmies在评论中给出的,所以我将在这里写一个新答案来结束问题。
这些值可以在 AMD APP OpenCL 编程指南http://developer.amd.com/sdks/amdappsdk/assets/amd_accelerated_pa rallel_processing_opencl_programming_guide.pdf 的附录 D 中找到(nVidia 也有类似的文档)。显然,AMD 设备的寄存器为 128 位 (4x32),所有现代高端设备有 16384 个寄存器,因此每个计算单元有 256KB 的内存。
| 归档时间: |
|
| 查看次数: |
3175 次 |
| 最近记录: |