如何最小化 Linux 服务器重启

Bee*_*rey 7 linux kernel patch-management

上周，关于 Unix（或 Linux）机器是否需要重新启动的slashdot 文章有相当多的评论。不止一些评论者提到拥有运行时间长达数年的机器。

据我了解，Linux 机器需要经常重启才能应用内核补丁，尤其是与安全相关的补丁（例如ac1db1tch3z 漏洞利用）。在“yum update kernel”之后运行 uname -r 似乎表明旧内核在重新启动之前不会加载。

我的问题是，鉴于此，这些盒子如何实现多年的正常运行时间？我想到的一些可能的解决方案

这些机器不是生产和/或向用户公开的，因此安全补丁不是那么重要。
所有的海报都使用实时修补服务，例如Ksplice
内核安全补丁可以通过重新加载模块而不是整个内核来应用。
uname -r 在内核补丁后反映了不正确的信息，毕竟加载了更新的内核。

这些解释中的任何一个是否合理，还是我的理解中缺少某些东西？有没有另一种方法可以最大限度地减少过去两年所需的两打左右的重新启动？

一种解决方案是使用 ksplice。

如果您使用 Ubuntu 或 CentOS 内核，您可以订阅 ksplice.com 服务，只需支付少量费用，他们就会为您提供可用于修补正在运行的内核的特殊内核映像。大多数更新不需要重新启动。非常易于使用和设置。

如果您特别熟练，您可以使用 ksplice 补丁构建您自己的启用内核，而无需订阅该服务，或用于非标准内核。

我有超过 1 年正常运行时间的服务器。不是最佳实践，因为从安全角度来看，服务器……其中一些服务器是数据库主服务器，我们无法承受停机时间。

我认为安全应该是首要问题，但现实世界也存在一些限制。如果你有豪华补丁，并在需要时重新启动它。不要担心正常运行时间，安全总比后悔好。

我建议在重大升级后始终重新启动服务器以确保它恢复正常，您不希望在意外重新启动后陷入困境。

我认为唯一需要重新启动 Linux 机器的时候就是更换内核。我有几台机器运行了两年多，但我根据“如果没有坏，就不要修理它”的原则来维护它们，这就是我实现正常运行时间的方法。当然，如果您的服务器面临外部威胁，您将需要定期应用安全修复程序，其中一些将需要新的内核。我不知道有什么方法可以在不重新启动机器的情况下可靠地完成此操作。这里可能有一些技巧，但很有可能会损害过程中的稳定性，并且您需要将计算机置于单用户模式。从技术上讲，您将实现正常运行时间，但在此期间机器将无法供最终用户使用，那么这有什么意义呢？

如果正常运行时间对您来说确实很重要，那么您可能会对某种形式的 HA/集群解决方案感兴趣，因为您可以重新启动集群的一个节点而不影响整个系统的可用性。否则只需重新启动即可。

归档时间：	14 年，11 月前
查看次数：	1417 次
最近记录：	9 年，3 月前

我可以调用 pushd/popd 并阻止它打印堆栈吗？ 23

双栈操作系统中 :: 和 0.0.0.0 的语义 11

不允许 EC2 实例之间的 SSH 9

“sudo su -”和“sudo -i”有什么区别？ 6

为什么我的 Systemd 服务不从我的环境文件传递参数？ 5

ext4 对数据库足够稳定吗？ 3

如何在linux机器中浏览名为'-'的文件夹 2

什么在使用我所有的 RAM？理解top的输出 2

Postfix 从 HOLD 队列转发特定邮件 2

du，查找和平均负载 0

如何 cd 进入具有此名称“-2”（以连字符开头）的目录？ 190

Linux 命令行最佳实践和技巧？ 112

主管未加载新的配置文件 86

为什么我会收到 sqlite 错误，“无法打开数据库文件”？ 72

nginx 的“主线”和“稳定”分支有什么区别？ 68

当我通过 SSH 连接到服务器时更改默认目录 66

Denyhosts vs fail2ban vs iptables-防止暴力登录的最佳方法？ 65

如何检查/dev/xvda1？ 62

我应该多久更新一次 Linux 服务器？ 61

如何设置一个假的 SMTP 服务器来捕获所有邮件？ 55