Ker*_*rns 12 performance vmware-esxi
这是一个困扰我一段时间的问题,我似乎无法在网上找到任何谈论它的内容。我有一台运行 VMware Hypervisor ESXi 的服务器。当我在上面启动虚拟机时,它们通常需要 2-3 分钟才能启动;不是很长的时间,但不是瞬间的。但是,当我查看服务器上的性能日志时,处理器、RAM 或磁盘使用率都不是 100% 左右;通常他们平均在 60%-80% 左右 所以如果服务器有工作要做,为什么它不以 100% 的速度做呢?
在我看来,在任何给定时刻,限制性能的组件都应该以 100% 的速度运行。例如,如果我有一个非常慢的硬盘驱动器,那么它应该几乎总是以 100% 的速度运行。因此,至少有一个区域(处理器、RAM、磁盘和网络)应始终为 100%,除非服务器处于完全空闲状态。
为什么不是这种情况?
Tim*_*Tim 18
延迟将是原因之一。“在我可以做任何其他事情之前,磁盘为我提供了我需要的数据”与数据返回之间的延迟将使 CPU 在这段时间内处于空闲状态。
资源可能确实以 100% 运行,但运行时间很短。操作系统启动将遵循“处理或决定某事、从磁盘获取某事、在内存中执行某事、对设备执行某事”的一般模式,每秒重复多次。因此,当您看到磁盘在 2 秒内以 25% 的速度运行时,这可能意味着它以 100% 的速度运行了 0.5 秒,然后在其余时间处于空闲状态。
正如 EEAA 指出的那样,多核系统使这变得更加复杂。CPU 上可以执行四个线程的单线程软件只能达到 25% 的全速运行。即使是多线程软件也很少能达到 100%,因为数据必须(通常)从硬盘驱动器、RAM、缓存、CPU 流动。保持管道满是困难的,并且往往发生在可预测的工作负载(如视频编码)中。在这种情况下,操作系统可以在需要之前观察读取模式并检索数据,将其放入适当的缓存中,例如 RAM 中的磁盘缓存。
EEA*_*EAA 16
你在以一种非常简单的方式思考这个问题,这导致你做出了一些不正确的假设,我会试着澄清。
首先,也可能是最简单的,在多核系统上,为了了解 CPU 使用率,您必须考虑进程负载是否是多线程的,并设计为利用多核。如果不是这种情况,根据运行的进程组合,您可能永远不会看到 100% 的使用率。曾经。
其次,需要考虑IO设备性能。例如,您的系统如何知道您的设备有多少 IOps?它没有。一个更有意义的指标是iowait
引导期间的值(在引导过程中可能难以获得)或引导期间的磁盘队列/延迟(应该更容易从虚拟机管理程序中获得)。如果您看到队列或延迟高峰,则您的 IO 设备很可能是导致性能问题的一个因素。
Ant*_*ito 11
我已经使用服务器大约 20 年了,当一个组件一直以 100% 运行时,这通常不是一件好事。
例如,假设您有一个 SQL 数据库,您不想将其交换到磁盘,而是想完全耗尽内存。
如果您的数据库是 24GB 并且操作系统需要 8GB,您不会只想为机器分配 32GB 的 RAM,有很多“事情”可能会出错,错误的代码、DDOS、大量的应用程序使用,谁知道呢,没有任何空间,你怎么知道服务器有问题?
我们的数据中心有大约 2000 台服务器,我们希望看到它们都以大约 75% 的 CPU 和 RAM 运行,硬盘空间在我们的 SAN 上,所以这是一个完全不同的问题。当 CPU 或 RAM 达到 85% 时,我们还会发出警报告诉我们,并在达到 90% 时发出警报告诉我们。
归档时间: |
|
查看次数: |
283 次 |
最近记录: |