我在非常特定的情况下遇到服务器速度下降的问题。事实是:
- 1) 我使用计算应用程序 WRF (Weather Research and Forecast)
- 2) 我使用 Dual Xeon E5-2620 v3 和 128GB RAM(NUMA 架构 - 可能与问题有关!)
- 3)我使用 mpirun -n 22 wrf.exe 运行 WRF(我有 24 个可用的逻辑内核)
- 4) 我使用 Centos 7 和 3.10.0-514.26.2.el7.x86_64 内核
- 5) Everthing 在计算性能方面工作正常,直到发生以下一件事:
- 5a) linux 文件缓存获取一些数据,或
- 5b) 我使用 tmpfs 并用一些数据填充它
在 5a 或 5b 场景中,我的 WRF 开始突然变慢,有时甚至比正常情况慢约 5 倍。
- 6) RAM 没有被交换,它甚至不会发生,在最坏的情况下,我有大约 80% 的 RAM 可用!
- 7) /etc/sysctl.conf 中的 vm.zone_reclaim_mode = 1 似乎有助于延迟 5a 场景中的问题
- 8) echo 1 > /proc/sys/vm/drop_caches 完全解决了 5a 场景中的问题,将 WRF …