是否有可能在用户空间中在Linux上分配不可缓存的内存块?

dic*_*oce 7 linux memory caching

我的应用程序中有一堆缓冲区(其中25到30个)相当大(.5mb)并且访问了simulataneousley.更糟糕的是,它们中的数据通常只读取一次,并且经常更新(例如每秒30次).排序非完美缓存使用的完美风暴.

无论如何,我想到如果我可以将一块内存标记为不可缓存,那将会很酷......从理论上讲,这将为缓存中的其他所有内容留出更多空间.

那么,他们是否有办法在Linux中标记为不可缓存的内存块?

Tom*_*eys 9

如何避免使用这样的数据来污染缓存每个程序员应该了解的内容(PDF) - 这是从红帽开发的角度编写的,非常适合您.但是,大部分都是跨平台的.

您想要的是"非时间访问",并告诉处理器期望您现在正在阅读的值暂时不再需要.然后处理器避免缓存该值.

请参阅上面链接的PDF的第49页.它使用intel内在函数在缓存周围进行流式处理.

在读取方面,直到最近,处理器除了使用非时间访问(NTA)预取指令的弱提示之外缺乏支持.对于读取没有等效的写入组合,这对于诸如存储器映射的I/O之类的不可缓存的存储器尤其不利.具有SSE4.1扩展的英特尔引入了NTA负载.它们使用少量流加载缓冲区实现; 每个缓冲区包含一个缓存行.给定高速缓存行的第一个movntdqa指令将高速缓存行加载到缓冲区中,可能替换另一个高速缓存行.对加载缓冲区的后续16字节对齐访问将以很小的代价从加载缓冲区进行服务.除非有其他原因,否则缓存行不会加载到缓存中,因此可以加载大量内存而不会污染缓存.编译器为此指令提供了内在函数:

#include <smmintrin.h>
__m128i _mm_stream_load_si128 (__m128i *p); 
Run Code Online (Sandbox Code Playgroud)

应该多次使用此内在函数,并将16字节块的地址作为参数传递,直到读取每个高速缓存行.只有这样才能启动下一个缓存行.由于存在一些流式读取缓冲区,因此可以一次从两个存储器位置读取

如果在读取时,缓冲区通过内存以线性顺序读取,那将非常适合您.您使用流式读取来执行此操作.当您想要修改它们时,缓冲区将按线性顺序进行修改,如果您不希望在同一个线程中很快再次读取它们,则可以使用流式写入来执行此操作.