标签: utilization

vCenter 集群 CPU 利用率数据不准确

我们拥有相当合理规模的 vSphere“资产”,我们 80% 的 Windows/Linux 服务器已虚拟化,运行在六个数据中心。我面临的挑战之一是中长期容量规划,确保我在年度资本支出预测中获得足够的资金,以确保为主机升级(通常是内存)、更多主机(硬件和 ESX 许可证)或最坏情况下的 SAN 扩展提供资金。

不管怎样,直到最近,我还是很乐意接受 vCenter 的性能统计数据作为真正代表正在发生的事情。在查看统计信息时,我通常在集群级别工作,因为每个集群中的主机都具有相同的规格、升级等。

然而,我最近注意到一些让我感到不安的事情。我的一个集群有 200GHz 的 CPU“带宽”可用,其组成如下:

5 hosts x 2 sockets-per-host x 6 cores-per-socket x 3.33GHz per-core = 199.8GHz
Run Code Online (Sandbox Code Playgroud)

这很好,vCenter 正确报告了这个值。但是,当您在 vCenter 中查看集群的 CPU 利用率或使用 PowerCLI 的Get-Stat cmdlet提取统计信息时,CPU 利用率有时会超过 300GHz。这会打乱我的计算,因为利用率达到 150% (!)。现在,我已经很长时间没有做 A-level 数学了,但我看不到 CPU 是如何被 150% 使用的...

因此,我记录了与 VMware 支持的电话。而且,可笑的是,他们说我需要购买 vCenter Operations Manager (vCOPS) 才能完成我想做的事情。好吧,不,谢谢,如果我有一些准确的统计数据,我可以做我自己的决策支持(对不起,咆哮了)。

所以,我提出了一个解释,支持人员说 vCenter 中的数据基于使用平均值总和的“通用”计算。嗯,平均数据样本是很正常的,也可以接受,但我仍然无法理解你怎么能超过 100%。

所以,我一直在尝试自己解决这个问题,我想知道 Xeon 的超线程或“turbo”功能是否会影响结果。然而,“turbo”提升仅从 3.33GHz 到 3.6GHz,即:8%。

有什么线索吗?

performance central-processing-unit vmware-esx utilization vmware-vcenter

5
推荐指数
1
解决办法
1988
查看次数

服务器利用率以及如何处理数据中心故障

Docker、Mesos、Kubernetes 等新技术可以在组织中更好地利用服务器。但是,考虑到整个数据中心的故障,我想知道如何最大限度地提高两个数据中心的利用率。

鉴于这种情况:

两个数据中心(DC-A 和 DC-B)具有等量的计算资源。两个数据中心都以负载平衡/循环方式运行和处理请求。两个数据中心的服务器利用率均为 80%。

假设 DC-B 出现故障(物理或网络)并且无法访问。DC-A 将无法再增加 80% 的利用率,因为它本身已经达到了 80%。使组织处于 DC-A 可能无法处理额外需求并导致中断的状态……

这是否意味着两个数据中心(DC-A 和 DC-B)的组织每个数据中心的最大利用率只能达到 50%?即任何一个 DC 失败,另一个 DC 将能够弥补另一个 DC 的松弛(50% + 50%)。

这种想法正确吗?其他人如何处理这个问题或者我错过了什么?

datacenter utilization distributed-computing kubernetes apache-mesos

1
推荐指数
1
解决办法
94
查看次数