标签: crash

故障记录内核恐慌以进行调试

我在 AWS/EC2 上运行 Ubuntu 12.04 并且有大量主机正在运行。我正在尝试启用内核转储，但是当我模拟内核崩溃时，文件系统上的任何地方都没有写入 .crash 文件。

我按照这里的说明操作：https : //wiki.ubuntu.com/Kernel/CrashdumpRecipe

事情似乎设置正确：

# cat /proc/cmdline 
root=LABEL=cloudimg-rootfs ro console=hvc0  crashkernel=384M-2G:64M,2G-:128M

# dmesg |grep crash
[    0.000000] Command line: root=LABEL=cloudimg-rootfs ro console=hvc0  crashkernel=384M-2G:64M,2G-:128M
[    0.000000] Reserving 64MB of memory at 832MB for crashkernel (System RAM: 1708MB)
[    0.000000] Kernel command line: root=LABEL=cloudimg-rootfs ro console=hvc0  crashkernel=384M-2G:64M,2G-:128M

# cat /sys/kernel/kexec_crash_loaded
1

Run Code Online (Sandbox Code Playgroud)

但是当我执行时：

# echo c | sudo tee /proc/sysrq-trigger

Run Code Online (Sandbox Code Playgroud)

系统按预期重新启动，但不会生成任何类型的“崩溃”文件。我可能做错了什么？

kernel-panic crash

Ste*_*han

lucky-day

8
推荐指数

1
解决办法

2004
查看次数

执行 SysRq + REISUB 时，我应该在两次击键之间等待多长时间？

我从这里读到这个：

最有用的组合是Alt+ SysRq/Prnt Scrn+ REISUB。

以上基本上意味着当您按住Alt+SysRq/Prnt Scrn并按 R、E、I、S、U、B 时，在每个键之间留出足够的时间以确保它们执行所需的工作。

我的问题是：我应该等待多长时间才能确保每个键之间的“足够的时间”？

linux magic-sysrq crash

Buf*_*lls

2013 12-21

8
推荐指数

1
解决办法

2504
查看次数

Bad RIP 值是什么意思？

在常见的调用跟踪中，我们可以检查 RIP 以了解哪些代码崩溃了。

但在某些调用跟踪中，它显示 Bad RIP 值：

[ 86.414392] RIP: 0010: (null)
[ 86.415351] Code: Bad RIP value.

Run Code Online (Sandbox Code Playgroud)

前任：

https://bugzilla.kernel.org/show_bug.cgi?id=202827

是什么Bad RIP value意思？

crash

Mar*_*k K

lucky-day

8
推荐指数

1
解决办法

2万
查看次数

将 Firefox 配置文件迁移到新配置文件

我重新安装了 Firefox，因为我的个人资料崩溃了。我将文件夹备份~/.mozilla到其他位置，卸载 Firefox 并重新安装。新的 Firefox 没有崩溃。因此，我将旧配置文件的一个备份复制到新的 Firefox，该配置文件再次崩溃。

现在，我想使用全新的配置文件，并仅从崩溃的旧配置文件中复制我需要的内容。我需要替换哪些文件？我需要书签（带有书签的快速访问栏对我来说足够了，我需要带有扩展数据的所有扩展）。我可能还需要但忘记了什么？我想尝试一下，我至少会找出是否是某些扩展导致了崩溃。但是，我认为并非如此。它通常在我打开新选项卡并且页面无法加载时启动。

我的操作系统是Lubuntu 18.04.6 LTS. 火狐版本是112.0.2 32 bit

firefox crash

xra*_*alf

2023 05-13

8
推荐指数

1
解决办法

1298
查看次数

系统冻结。在日志中找不到任何内容

我的 linux 桌面系统有时会冻结（aptosid/debian sid），并且在重新启动后我无法在 messages/dmesg/syslog/Xorg.*.log 中找到有关冻结原因的任何信息。

当它“冻结”时，我仍然可以在 X 中移动鼠标，有时甚至在系统停止响应之前移动窗口一小段时间。上次我什至可以切换到文本终端并输入我的登录名，但是此后每个文本控制台都停止了并且不显示密码提示。

冻结后 SSH 登录也不起作用。

我认为问题开始于几周（可能是 1-1.5 个月）前。

我在主要用于游戏的同一台机器上有一个 Windows 分区（win7 64 位）（上次主要用于星际争霸2）。在玩了几个小时后，我无法记住任何崩溃。

我还没有找到强制冻结的方法，这使得调试并不容易。

linux freeze crash

rmw*_*iss

2012 09-10

6
推荐指数

1
解决办法

8523
查看次数

为什么在 /usr/bin 中更改权限时某些应用程序停止工作？

在 OS X 上，我的一个朋友/usr/bin使用 Finder 递归地更改了权限，以便对所有人进行大写访问。

这是它的完成方式：

转到/usr/binFinder，然后在信息窗口底部设置权限：

Finder 更改权限

之后，您就不能再运行Terminal.app了。但是您仍然可以运行磁盘工具，这是在没有终端的情况下从中恢复所必需的。

这是您在这种情况下遇到的错误：

Last login: Fri Jul  4 15:39:24 on ttys001
login(27006,0x7fff78115310) malloc: *** error for object 0x7fceb3412cc0: pointer being freed was not allocated
*** set a breakpoint in malloc_error_break to debug

Run Code Online (Sandbox Code Playgroud)

幸运的是，我很快就在这里找到了一个提到这个问题的问题。

我的第一个想法是这是一个硬件问题（可能是硬盘驱动器/RAM/等中的一些随机损坏......）。

此错误与中的错误权限/usr/bin有何关系？

在尝试处理损坏的系统以获得清晰的差异列表时，我得到了这个：

$ sudo -s
sudo: effective uid is not 0, is sudo installed setuid root?

Run Code Online (Sandbox Code Playgroud)

这是diskutil verifyPermissions（解决问题顺便说一句）的结果：

（太大了，这里就不贴了）

每行的格式如下：

Permissions differ on "usr/bin/sudo"; should be …

Run Code Online (Sandbox Code Playgroud)

osx permissions crash

ale*_*ail

2017 05-23

6
推荐指数

1
解决办法

1639
查看次数

bash 因 for 循环而崩溃

这个问题可能是微不足道的，但有了这个简单的for循环

for i in {1..10000000}; do echo "$i" line >> file
done

Run Code Online (Sandbox Code Playgroud)

我的外壳在经过一些精化时间后崩溃了（终端模拟器中的选项卡被自动关闭）并且file没有被创建。

它是GNU bash, version 4.1.11(2)-release。

这是由于内存限制还是其他原因？如果是，这应该是这个限制吗？

随着{1..1000000}它工作正常。

shell bash shell-script crash

Bow*_*ark

lucky-day

6
推荐指数

1
解决办法

1599
查看次数

Chrome 打开的文件太多/崩溃/抱歉吉姆

使用 Google Chrome 时，我经常看到“Sorry Jim”标签。浏览器也经常死机和崩溃。

从终端模拟器运行它会显示一长串Too many open files：

[...:ERROR:shared_memory_posix.cc(231)] Creating shared memory in /dev/shm/.com.google.Chrome.0A3O7D failed: Too many open files
[...:ERROR:shared_memory_posix.cc(231)] Creating shared memory in /dev/shm/.com.google.Chrome.gr0r3Q failed: Too many open files

Run Code Online (Sandbox Code Playgroud)

谷歌浏览器（32 位，不确定是否影响 64 位）。

chrome limit files crash

use*_*890

2015 01-21

6
推荐指数

1
解决办法

2153
查看次数

系统日志中的 NUL 条目？

我的服务器在 30 号宕机了。今天刚上线。一开始我以为是路由器，因为服务器连接的路由器有点奇怪，但是当我检查系统日志时，我有NUL停机时间的条目。日志显示 30 日一切正常，然后NUL在今天的条目之前突然输入了大约 2 行，显示正常启动。无论如何我可以进一步诊断问题吗？当我说我有NUL条目时，我的意思是我有 ascii 代码 0NUL字符。

linux syslog crash

Sco*_*pta

lucky-day

6
推荐指数

0
解决办法

1181
查看次数

rcu_sched 检测到 CPU 停顿

在客户设备中看到多个 rcu_sched 停顿消息，并且它崩溃/挂起。在这种情况下，无法通过 SSH 或 3G 访问设备。内核版本为 3.2.54。“rcu_sched 检测到 CPU 0 上的停顿”重复多次，这表明什么？该设备在电源循环测试期间表现出这种崩溃。acpower_isr()/poe_isr() 用于在每次切换期间更新交流电源状态/PoE 状态。这会导致问题吗？（无法解除锁定？）

    Backtrace: 
[<c4011504>] (dump_backtrace+0x0/0x110) from [<c43924bc>] (dump_stack+0x18/0x1c)
 r6:c962e080 r5:c96462e0 r4:c9ec4674 r3:c96429bc
[<c43924a4>] (dump_stack+0x0/0x1c) from [<c4082188>] (__rcu_pending+0x88/0x38c)
[<c4082100>] (__rcu_pending+0x0/0x38c) from [<c4083218>] (rcu_check_callbacks+0xe8/0x17c)
[<c4083130>] (rcu_check_callbacks+0x0/0x17c) from [<c4043ac4>] (update_process_times+0x40/0x64)
 r8:23339c9a r7:00000000 r6:c6f06ae0 r5:00000000 r4:c8ac8000
r3:00010000
[<c4043a84>] (update_process_times+0x0/0x64) from [<c406513c>] (tick_sched_timer+0x9c/0xdc)
 r7:c9ec44a0 r6:c8ac9dd8 r5:c8ac8000 r4:c9ec4598
[<c40650a0>] (tick_sched_timer+0x0/0xdc) from [<c405805c>] (__run_hrtimer+0xf4/0x1c8)
 r9:c8ac9d20 r8:23339580 r6:c9ec44d8 r5:c9ec44a0 r4:c9ec4598
[<c4057f68>] (__run_hrtimer+0x0/0x1c8) from [<c4058db4>] (hrtimer_interrupt+0x124/0x288)
[<c4058c90>] (hrtimer_interrupt+0x0/0x288) from [<c40139e0>] (twd_handler+0x28/0x30)
[<c40139b8>] (twd_handler+0x0/0x30) from [<c407f880>] (handle_percpu_devid_irq+0xd0/0x150)
 r4:0000001d …

Run Code Online (Sandbox Code Playgroud)

process kernel-panic kernel-modules linux-kernel crash

Rav*_*avi

2017 12-07

6
推荐指数

1
解决办法

3万
查看次数