我想知道Ulrich Drepper 从2007年开始对每个程序员应该知道的内容有多少仍然有效.另外,我找不到比1.0更新的版本或勘误表.
optimization x86 memory-management cpu-architecture micro-optimization
我遇到的问题是内存带宽有限——我需要从 RAM 中顺序读取大量(许多 GB)数据,进行一些快速处理,然后将其顺序写入 RAM 中的不同位置。内存延迟不是问题。
将工作分配给不同 NUMA 区域中的两个或多个核心是否有任何好处?同样,跨区域工作是否会减少可用带宽?
numa memory-bandwidth
cpu-architecture ×1
memory-bandwidth ×1
memory-management ×1
micro-optimization ×1
numa ×1
optimization ×1
x86 ×1