C++对齐(何时使用alignas)

smu*_*joe 5 c++ struct alignment

我最近了解了结构的尺寸和对齐方式.我非常熟悉如何使用以及alignas()说明符的工作原理.我已经看到了正确使用的例子(关于语义,而不是现实用例)以及它改变类型/变量大小的方式.

但是,我不知道它在我的代码中何时有用.当开发人员手动指定数据对齐时,您能列出一些用例吗?

小智 10

有很多用例,其中alignas在多线程应用程序中很方便,这些应用程序对延迟敏感.例如.高频交易应用程序.

Alignas可以更加严格地控制CPU缓存上对象布局的方式,从而更快地访问对象.最佳使用的目标如下,这是使用alignas的用例

  1. 您希望避免从缓存行中不必要的数据失效
  2. 您希望优化CPU读取,以便节省CPU周期的浪费.

如何对齐使用alignas高速缓存行帮助
使用1 -避免因缓存线的不必要的数据失效 您可以使用alignas保持在各个独立的缓存线运行单独的线程所使用的地址或对象,让一个线程不会无意无效缓存行另一个核心.

如何发生这种情况: 考虑当您的进程中的线程在核心0上运行并写入地址xxxx时的情况.此地址现在加载到核心0的L1缓存中.2访问地址xxxx + n个字节.现在,如果这两个地址碰巧都在同一个高速缓存行上,那么线程2的任何写入都将不必要使核心0的高速缓存行无效.因此,线程0被延迟,直到高速缓存行无效并再次加载.这妨碍了多线程环境中的性能.

使用2 将对象对齐以分隔缓存行,以使对象不会分布在多个缓存行中.这节省了CPU周期.例如.如果您的对象大小是例如.118字节,最好将其与64字节对齐,因为在大多数处理器上,缓存行大小现在是64字节.

如果不这样做,则可以在64字节高速缓存行上按如下方式布置对象.(例如,对象具有118字节的实际大小并且具有自然对齐,大小变为4的倍数,因此120字节)

高速缓存行1 <-----对象1 60Bytes - > <---你的对象4>字节---------->
高速缓存行2 <---------你的对象64字节--------------------------------->
缓存行3 <-----您的对象52字节 - ----> <---其他一些对象12字节 - >

由于CPU读取多个缓存行,因此您的对象将在3个CPU周期中读取.如果要优化它,请考虑使用alignas(64).这样,您的对象将始终分布在2个缓存行上.

注意事项 请注意,在考虑对齐之前,您需要仔细检查对象.原因是错误的方法会导致更多的填充,从而更多地浪费L2缓存.有一些简单的技术可以按顺序排列数据成员,从而避免浪费.

希望这有帮助,祝你好运!