SQL Server 2012 页面预期寿命在大约 50 天后重置为 0

CRC*_*r0r 12 sql-server sql-server-2012 page-life-expectancy

我注意到 2 台服务器 HA 集群上的奇怪行为,我希望有人能证实我的怀疑,或者提供一些其他解释......这是我的设置:

  • 2 台服务器 SQL 2012 SP1 安装
  • 已为一些数据库启用 SQL AlwaysOn HA
  • CPU 为 2.4GHz,4 核
  • RAM 为 34 GB(它是一个 AWS 实例,因此是奇数)
  • 资源利用率比较低——每台服务器有14+GB的空闲内存,SQL没有限制使用多少内存
  • 磁盘访问时间很好 - 很少超过 15 毫秒/读或写
  • 数据库不大 - 1 GB、1.5 GB、7.5 GB
  • SQL 服务器进程使用 16 GB 专用字节,15 GB 工作集

总体而言,没有注意到资源问题。现在是奇怪的部分。SQL 没有重新启动(进程已经运行了将近 6 个月),但似乎每大约 50 天,页面预期寿命计数器就会下降到(几乎)0。直到那时它稳步攀升,没有下降。这是一个性能图:

在此处输入图片说明

当我查看计数器数据时(我没有确切的数字,只是每小时汇总),似乎 PLE 计数器值每次都达到了大约 4,295,000 秒(大约 50 天)(至少每次我有数据时)。

我疯狂的理论是,PLE 数以毫秒为单位作为无符号长整型(其限制为 4,294,967,295)并在 49.71 天时重置,无论是设计还是错误。这将解释两台服务器的行为以及它们具有的相同模式。或者它可能是完全不同的东西,我只是没有任何意义。:)

有没有人见过这样的事情,或者可以解释这种行为?

PS我看到了这篇文章,但我的情况似乎略有不同。

PPS 这是一个转贴 - 我最初把它贴在这里,但被告知这里的观众更合适。

谢谢!

小智 3

我在运行 SQL2012 SP1 的客户端站点上看到过这种行为。这里的具体情况是 NUMA 和 PLE 展示了“锯齿”模式,但以小时为周期。

SQLServerCentral 上的几个线程围绕此进行了讨论:

http://www.sqlservercentral.com/Forums/Topic1415833-2799-1.aspx http://www.sqlservercentral.com/Forums/Topic1424826-2799-1.aspx

最终结果是应用SP1 CU4似乎解决了问题。

CU4 包含看似无辜的修复SQL Server 2012 内存管理 KB2845380 提供了更新

值得一试?