如何为 BIOS Watch Dog 正确配置 Debian watchdog 守护进程?

Pro*_*kup 6 debian bios watchdog

Supermicro 主板包含一个名为“看门狗功能”的 BIOS 功能。使用内核“Linux debian 2.6.32-5-amd64 #1 SMP”的 Debian 6.0.6 我们做了:

  1. 将 BIOS 的“看门狗功能”从禁用更改为启用。
  2. 安装包看门狗 ( # apt-get install watchdog)

预期:这就是正确安装看门狗功能的全部内容。

结果:系统每(大约)5 分钟重新启动一次。

BIOS 的看门狗功能”从启用更改为禁用修复了不需要的重启。

引导过程似乎正确启用了看门狗守护程序。至少控制台显示(禁用 BIOS Watch Dog 时):

Starting watchdog keepalive daemon: wd_keepalive.
Stopping watchdog keepalive daemon....
Starting watchdog daemon....
Run Code Online (Sandbox Code Playgroud)

并在重新启动时生成此输出:

INIT: SUsing makefile-style concurrent boot in runlevel 6.
Stopping watchdog daemon....
Starting watchdog keepalive daemon....
Run Code Online (Sandbox Code Playgroud)

还需要做些什么来配置 BIOS 看门狗功能和 Linux OS 看门狗守护进程才能正常工作?

小智 8

1. 加载硬件模块

首先,为了真正“喂养”看门狗,您需要加载看门狗硬件模块。这可能不会自动发生,因为如果没有看门狗守护程序(例如在/etc/modprobe.d/blacklist-watchdog.confUbuntu/Debian 系统中),大多数看门狗驱动程序都被列入黑名单。检查/dev/watchdog是否出现了(或类似的),因为这意味着模块已被加载。

我不知道 Supermicro 主板使用什么,但它可能是 Intel TCO 驱动程序 ( iTCO_wdt)。请注意,iTCO_wdt可能需要一些其他模块,例如i2c-i801,i2c-smbus才能发挥其魔力。尝试使用modprobe iTCO_wdt加载该模块,看看它是否被接受。

成功看起来像:

iTCO_wdt: Found a Intel PCH TCO device (Version=4, TCOBASE=0x0400)
iTCO_wdt: initialized. heartbeat=120 sec (nowayout=0)
Run Code Online (Sandbox Code Playgroud)

失败后什么都不显示:

iTCO_wdt: Intel TCO WatchDog Timer Driver v1.11 
Run Code Online (Sandbox Code Playgroud)

还要检查系统日志。否则请查看 IPMI 工具,因为它们包含看门狗驱动程序。

2. 编辑 /etc/watchdog.conf

其次,您需要编辑看门狗配置文件,例如# nano /etc/watchdog.conf.

3.取消评论 watchdog-device = ...

所以实际使用/dev/watchdog设备访问模块。否则看门狗将不会使用硬件而仅依靠其内部代码来软重启损坏的机器(这不是很有用)。

同样,在启动看门狗守护进程时,在 syslog 中查找有关它启动的消息以及它找到的硬件模块。