任何人都可以给出一个示例或链接到一个__builtin_prefetch在GCC 中使用的示例(或者通常只是asm指令prefetcht0)以获得实质性的性能优势吗?特别是,我希望这个例子符合以下标准:
__builtin_prefetch
也就是说,我想要最简短的示例,显示__builtin_prefetch执行无需管理就无法管理的优化.
optimization assembly gcc prefetch
assembly ×1
gcc ×1
optimization ×1
prefetch ×1