Dev*_*ark 5 c++ caching built-in
通过 gcc 文档,我偶然发现了内置函数__builtin___clear_cache。
— 内置函数:void __builtin___clear_cache (char *begin, char *end) 该函数用于为begin inclusive 和end exclusive 之间的内存区域刷新处理器的指令缓存。某些目标要求在修改包含代码的内存后刷新指令缓存,以获得确定性行为。
如果目标不需要指令缓存刷新,则 __builtin___clear_cache 无效。否则,要么内联发出指令以清除指令缓存,要么调用 libgcc 中的 __clear_cache 函数。
我觉得这很有趣,但令人惊讶。在很多情况下,当前堆栈的大量指令存储在 L1 缓存(指令缓存)中。因此,乍一看,这个内置函数可能会显着破坏我们程序的流程,因为它会清除堆栈中的下一条指令。
此指令是否还会重新填充 L1 缓存中的堆栈部分?
这似乎不太可能。如果没有,那么我想用户有责任使用权利begin和end参数,以免破坏我们的过程。在实践中,如何找到正确begin和end使用的东西?
它只是在需要它们的目标处理器上发出一些奇怪的机器指令(x86 不需要)。
可以将其视为刷新指令缓存(例如在某些JIT__builtin___clear_cache库中)的“可移植”(对于 GCC 和兼容编译器)方式。
在实践中,如何才能找到正确的开始和结束的用法呢?
为了安全起见,我会在某些页面范围上使用它(例如使用sysconf(_SC_PAGESIZE)...获得),因此通常是 4Kbyte 对齐的内存范围(4Kbyte 的倍数)。否则,您需要一些特定于目标的技巧来查找缓存行宽度......
在 Linux 上,您可以读取/proc/cpuinfo并使用cache_alignment&cache_size行来获取更精确的缓存行大小和对齐方式。
顺便说一句,使用的代码__builtin__clear_cache很可能(由于其他原因)特定于目标机器,因此它具有或知道一些机器参数(并且应该包括缓存大小和对齐方式)。