rub*_*cks 7 linux kernel-panic init-script qemu linux-kernel
我正在尝试将 Qemu 添加到我的持续集成管道中以测试各种initrd工件。我已经发现我可以像这样运行 Qemu:
qemu-system-x86_64 \
-machine q35 \
-drive if=pflash,format=raw,file=OVMF_CODE.fd,readonly \
-drive if=pflash,format=raw,file=OVMF_VARS.fd \
-kernel vmlinuz-4.4.0-121-generic \
-initrd my-initramfs.cpio.xz \
-nographic
Run Code Online (Sandbox Code Playgroud)
...如果我在脚本中执行此操作,则会导致qemu-system-x86_64退出状态:0init
# poweroff -f
Run Code Online (Sandbox Code Playgroud)
这是有效的,因为 init 脚本不会退出——它会poweroff -f“永远”调用和休眠,或者直到 Qemu 执行“断电”:
ACPI: Preparing to enter system sleep state S5
reboot: Power down
Run Code Online (Sandbox Code Playgroud)
我希望能够init通过强制执行exit错误来检测脚本中的问题set -eu。退出init脚本(正确)会导致内核崩溃,但qemu-system-x86_64进程永远挂起。
我怎样才能让它永远挂起来?如何让 Qemu 主机检测 Qemu 来宾中的内核崩溃?
进一步澄清:
我的应用程序的性质是安全敏感的;即,“允许”配置/编译 linux 内核,但不允许传递内核参数。把它放在一个很好的点上,CMDLINE_OVERRIDE启用。
QEMU -no-reboot+ 内核 CLIkernel.panic=-1
qemu-system-X -no-reboot QEMU CLI 选项:当来宾尝试重新启动时使 QEMU 退出kernel.panic=-1内核启动参数:使 Linux 在发生恐慌后立即尝试重新启动:https : //github.com/torvalds/linux/blob/v4.17/Documentation/admin-guide/kernel-parameters.txt#L2931它也返回0like pvpanic,但具有以下优点:
-M virt以及 x86,而 pvpanic 似乎是特定于 x86 的,因为它在arch/x86使用此设置进行测试。
panic使用 GDB跟踪符号
解决此问题的另一种方法可能是检测何时panic到达函数地址,然后尝试让 QEMU 退出。
您绝对可以panic按照以下说明打开 GDB :https : //stackoverflow.com/questions/11408041/how-to-debug-the-linux-kernel-with-gdb-and-qemu/33203642#33203642
但是 TODO:如何让 QEMU 以状态 1 退出?monitor quit从 GDB 内部使用, 从 GDB 转发quit到 QEMU 监视器,非常接近,但不是很接近,因为它没有以 status 退出0。
gem5本身默认执行此跟踪,这非常棒。
这发生在:https : //github.com/gem5/gem5/blob/1da285dfcc31b904afc27e440544d006aae25b38/src/arch/arm/linux/system.cc#L73
也许 QEMU 开发人员可以从这种技术中获得一些灵感并实现类似的东西。
我有一些有效的东西:
CONFIG_PVPANIC=y;这会生成一个具有对该设备的编译支持的内核pvpanic。qemu-system-x86_64使用选项调用-device pvpanic;这指示 Qemu 捕获(并退出)内核恐慌。内核恐慌导致qemu-system-x86_64成功退出(返回 status 0),但至少它不再挂起。
非常感谢@dsstorefile1 为我指明了正确的方向。
参考: