标签: crash

故障记录内核恐慌以进行调试

我在 AWS/EC2 上运行 Ubuntu 12.04 并且有大量主机正在运行。我正在尝试启用内核转储,但是当我模拟内核崩溃时,文件系统上的任何地方都没有写入 .crash 文件。

我按照这里的说明操作:https : //wiki.ubuntu.com/Kernel/CrashdumpRecipe

事情似乎设置正确:

# cat /proc/cmdline 
root=LABEL=cloudimg-rootfs ro console=hvc0  crashkernel=384M-2G:64M,2G-:128M

# dmesg |grep crash
[    0.000000] Command line: root=LABEL=cloudimg-rootfs ro console=hvc0  crashkernel=384M-2G:64M,2G-:128M
[    0.000000] Reserving 64MB of memory at 832MB for crashkernel (System RAM: 1708MB)
[    0.000000] Kernel command line: root=LABEL=cloudimg-rootfs ro console=hvc0  crashkernel=384M-2G:64M,2G-:128M

# cat /sys/kernel/kexec_crash_loaded
1
Run Code Online (Sandbox Code Playgroud)

但是当我执行时:

# echo c | sudo tee /proc/sysrq-trigger
Run Code Online (Sandbox Code Playgroud)

系统按预期重新启动,但不会生成任何类型的“崩溃”文件。我可能做错了什么?

kernel-panic crash

8
推荐指数
1
解决办法
2004
查看次数

执行 SysRq + REISUB 时,我应该在两次击键之间等待多长时间?

我从这里读到这个:

最有用的组合是Alt+ SysRq/Prnt Scrn+ REISUB。

以上基本上意味着当您按住Alt+SysRq/Prnt Scrn并按 R、E、I、S、U、B 时,在每个键之间留出足够的时间以确保它们执行所需的工作。

我的问题是:我应该等待多长时间才能确保每个键之间的“足够的时间”?

linux magic-sysrq crash

8
推荐指数
1
解决办法
2504
查看次数

Bad RIP 值是什么意思?

在常见的调用跟踪中,我们可以检查 RIP 以了解哪些代码崩溃了。

但在某些调用跟踪中,它显示 Bad RIP 值:

[ 86.414392] RIP: 0010: (null)
[ 86.415351] Code: Bad RIP value.
Run Code Online (Sandbox Code Playgroud)

前任:

https://bugzilla.kernel.org/show_bug.cgi?id=202827

是什么Bad RIP value意思?

crash

8
推荐指数
1
解决办法
2万
查看次数

将 Firefox 配置文件迁移到新配置文件

我重新安装了 Firefox,因为我的个人资料崩溃了。我将文件夹备份~/.mozilla到其他位置,卸载 Firefox 并重新安装。新的 Firefox 没有崩溃。因此,我将旧配置文件的一个备份复制到新的 Firefox,该配置文件再次崩溃。

现在,我想使用全新的配置文件,并仅从崩溃的旧配置文件中复制我需要的内容。我需要替换哪些文件?我需要书签(带有书签的快速访问栏对我来说足够了,我需要带有扩展数据的所有扩展)。我可能还需要但忘记了什么?我想尝试一下,我至少会找出是否是某些扩展导致了崩溃。但是,我认为并非如此。它通常在我打开新选项卡并且页面无法加载时启动。

我的操作系统是Lubuntu 18.04.6 LTS. 火狐版本是112.0.2 32 bit

firefox crash

8
推荐指数
1
解决办法
1298
查看次数

系统冻结。在日志中找不到任何内容

我的 linux 桌面系统有时会冻结(aptosid/debian sid),并且在重新启动后我无法在 messages/dmesg/syslog/Xorg.*.log 中找到有关冻结原因的任何信息。

当它“冻结”时,我仍然可以在 X 中移动鼠标,有时甚至在系统停止响应之前移动窗口一小段时间。上次我什至可以切换到文本终端并输入我的登录名,但是此后每个文本控制台都停止了并且不显示密码提示。

冻结后 SSH 登录也不起作用。

我认为问题开始于几周(可能是 1-1.5 个月)前。

我在主要用于游戏的同一台机器上有一个 Windows 分区(win7 64 位)(上次主要用于星际争霸2)。在玩了几个小时后,我无法记住任何崩溃。

我还没有找到强制冻结的方法,这使得调试并不容易。

linux freeze crash

6
推荐指数
1
解决办法
8523
查看次数

为什么在 /usr/bin 中更改权限时某些应用程序停止工作?

在 OS X 上,我的一个朋友/usr/bin使用 Finder 递归地更改了权限,以便对所有人进行大写访问。

这是它的完成方式:

转到/usr/binFinder,然后在信息窗口底部设置权限:

Finder 更改权限

之后,您就不能再运行Terminal.app了。但是您仍然可以运行磁盘工具,这是在没有终端的情况下从中恢复所必需的。

这是您在这种情况下遇到的错误:

Last login: Fri Jul  4 15:39:24 on ttys001
login(27006,0x7fff78115310) malloc: *** error for object 0x7fceb3412cc0: pointer being freed was not allocated
*** set a breakpoint in malloc_error_break to debug
Run Code Online (Sandbox Code Playgroud)

幸运的是,我很快就在这里找到了一个提到这个问题的问题。

我的第一个想法是这是一个硬件问题(可能是硬盘驱动器/RAM/等中的一些随机损坏......)。

此错误与 中的错误权限/usr/bin有何关系?

在尝试处理损坏的系统以获得清晰的差异列表时,我得到了这个:

$ sudo -s
sudo: effective uid is not 0, is sudo installed setuid root?
Run Code Online (Sandbox Code Playgroud)

这是diskutil verifyPermissions(解决问题顺便说一句)的结果:

(太大了,这里就不贴了)

每行的格式如下:

Permissions differ on "usr/bin/sudo"; should be …
Run Code Online (Sandbox Code Playgroud)

osx permissions crash

6
推荐指数
1
解决办法
1639
查看次数

bash 因 for 循环而崩溃

这个问题可能是微不足道的,但有了这个简单的for循环

for i in {1..10000000}; do echo "$i" line >> file
done
Run Code Online (Sandbox Code Playgroud)

我的外壳在经过一些精化时间后崩溃了(终端模拟器中的选项卡被自动关闭)并且file没有被创建。

它是GNU bash, version 4.1.11(2)-release

这是由于内存限制还是其他原因?如果是,这应该是这个限制吗?

随着{1..1000000}它工作正常。

shell bash shell-script crash

6
推荐指数
1
解决办法
1599
查看次数

Chrome 打开的文件太多/崩溃/抱歉吉姆

使用 Google Chrome 时,我经常看到“Sorry Jim”标签。浏览器也经常死机和崩溃。

从终端模拟器运行它会显示一长串Too many open files

[...:ERROR:shared_memory_posix.cc(231)] Creating shared memory in /dev/shm/.com.google.Chrome.0A3O7D failed: Too many open files
[...:ERROR:shared_memory_posix.cc(231)] Creating shared memory in /dev/shm/.com.google.Chrome.gr0r3Q failed: Too many open files 
Run Code Online (Sandbox Code Playgroud)

谷歌浏览器(32 位,不确定是否影响 64 位)。

chrome limit files crash

6
推荐指数
1
解决办法
2153
查看次数

系统日志中的 NUL 条目?

我的服务器在 30 号宕机了。今天刚上线。一开始我以为是路由器,因为服务器连接的路由器有点奇怪,但是当我检查系统日志时,我有NUL停机时间的条目。日志显示 30 日一切正常,然后NUL在今天的条目之前突然输入了大约 2 行,显示正常启动。无论如何我可以进一步诊断问题吗?当我说我有NUL条目时,我的意思是我有 ascii 代码 0NUL字符。

linux syslog crash

6
推荐指数
0
解决办法
1181
查看次数

rcu_sched 检测到 CPU 停顿

在客户设备中看到多个 rcu_sched 停顿消息,并且它崩溃/挂起。在这种情况下,无法通过 SSH 或 3G 访问设备。内核版本为 3.2.54。“rcu_sched 检测到 CPU 0 上的停顿”重复多次,这表明什么?该设备在电源循环测试期间表现出这种崩溃。acpower_isr()/poe_isr() 用于在每次切换期间更新交流电源状态/PoE 状态。这会导致问题吗?(无法解除锁定?)

    Backtrace: 
[<c4011504>] (dump_backtrace+0x0/0x110) from [<c43924bc>] (dump_stack+0x18/0x1c)
 r6:c962e080 r5:c96462e0 r4:c9ec4674 r3:c96429bc
[<c43924a4>] (dump_stack+0x0/0x1c) from [<c4082188>] (__rcu_pending+0x88/0x38c)
[<c4082100>] (__rcu_pending+0x0/0x38c) from [<c4083218>] (rcu_check_callbacks+0xe8/0x17c)
[<c4083130>] (rcu_check_callbacks+0x0/0x17c) from [<c4043ac4>] (update_process_times+0x40/0x64)
 r8:23339c9a r7:00000000 r6:c6f06ae0 r5:00000000 r4:c8ac8000
r3:00010000
[<c4043a84>] (update_process_times+0x0/0x64) from [<c406513c>] (tick_sched_timer+0x9c/0xdc)
 r7:c9ec44a0 r6:c8ac9dd8 r5:c8ac8000 r4:c9ec4598
[<c40650a0>] (tick_sched_timer+0x0/0xdc) from [<c405805c>] (__run_hrtimer+0xf4/0x1c8)
 r9:c8ac9d20 r8:23339580 r6:c9ec44d8 r5:c9ec44a0 r4:c9ec4598
[<c4057f68>] (__run_hrtimer+0x0/0x1c8) from [<c4058db4>] (hrtimer_interrupt+0x124/0x288)
[<c4058c90>] (hrtimer_interrupt+0x0/0x288) from [<c40139e0>] (twd_handler+0x28/0x30)
[<c40139b8>] (twd_handler+0x0/0x30) from [<c407f880>] (handle_percpu_devid_irq+0xd0/0x150)
 r4:0000001d …
Run Code Online (Sandbox Code Playgroud)

process kernel-panic kernel-modules linux-kernel crash

6
推荐指数
1
解决办法
3万
查看次数