经过最近的一些更新,我的电脑不再启动!这是我可以确定的:
apt-clone
),它工作得很好。它有不同的硬件(也是 amd64,但不同的 CPU、不同的 GPU 等)。splash
从linux
Grub的命令行中删除),我会看到许多服务正在启动,然后它会锁定。我可以通过添加init=/bin/sh
到linux
Grub的命令行来获得 root shell 。我什至可以通过添加进一步
systemd.unit=basic.target systemd.shell
Run Code Online (Sandbox Code Playgroud)
这将启动许多服务并在 tty9 上运行一个 root shell。
systemctl start multi-user.target
从那个 root shell运行,计算机就会锁定。所以大概问题是由这些服务之一触发的。systemctl list-dependencies multi-user.target
看看有哪些服务开始了。我手动一一启动了列出的依赖项,一切都开始了。因此,这看起来像是由某些软件触发的硬件错误(因为它发生在一台计算机上而不是另一台计算机上)。但是什么软件?由于电脑死机很厉害,我无法获得任何日志。我什至无法获得任何有用的控制台输出。
有用的调试技术:
昨天,我运行了bash
大约 10 个小时的脚本。当我去使用计算机时,它锁定了。
我如何确定出了什么问题?我可以查看哪些日志?
我的系统突然崩溃了,我已经重新启动它,我在哪里可以找到最后/上一个崩溃日志,因为/var/log/syslog*
不再有..
我正在运行 Ubuntu 12.04 衍生版 (amd64),最近我遇到了非常奇怪的问题。出乎意料的是,X 似乎会完全冻结一段时间(1-3 分钟?),然后系统将重新启动。该系统已超频,但在 Windows 中经过验证非常稳定,这让我相信我遇到了内核恐慌或我的模块之一出现问题。即使在 Linux 中,我也可以运行 LINPACK 并且不会看到崩溃,尽管在 CPU 上施加了可笑的负载。崩溃似乎是随机发生的,即使机器闲置时也是如此。
如何调试导致系统崩溃的原因?
我预感它可能是专有的 NVIDIA 驱动程序,我一直还原到驱动程序的稳定版本 304 版本,但我仍然遇到崩溃。
任何人都可以引导我完成崩溃后的良好调试过程吗?我很乐意启动拇指驱动器并发布我所有的崩溃后配置文件,我只是不确定它们会是什么。我怎样才能找出是什么导致了我的系统崩溃?
这是一堆日志,通常是罪魁祸首。
.xsession 错误:http : //pastebin.com/EEDtVkVm
/var/log/Xorg.0.log:http://pastebin.com/ftsG5VAn
/var/log/kern.log:http://pastebin.com/Hsy7jcHZ
在/ var / log / syslog的:http://pastebin.com/9Fkp3FMz
我什至似乎根本找不到坠机记录。
触发崩溃并不是那么简单,当 GPU 试图一次绘制多个东西时,它似乎会发生。如果我全屏播放 YouTube 视频并让它重复一段时间或滚动浏览大量 GIF 并弹出 Skype 通知,有时它会崩溃。在这个问题上完全摸不着头脑。
CPU 超频到 4.8GHz,但它完全稳定,并且在昨天的 LINPACK 运行和 9 小时的 Prime95 中幸存下来,没有发生一次崩溃。
我已经为我的内核版本 3.2.0-35安装了kdump
、crash
和linux-crashdump
,以及内核调试符号。当我apport-unpack
在崩溃的内核文件上运行,然后crash
在VmCore
故障转储上运行时,我看到的是:
KERNEL: /usr/lib/debug/boot/vmlinux-3.2.0-35-generic
DUMPFILE: …
Run Code Online (Sandbox Code Playgroud) 我知道当程序崩溃时,一些文件会在/var/crash/
. 但我不知道这些文件是什么!
那是错误日志吗?
当我使用名为 subprocess 的 Python 模块打开 Chrome 时,它崩溃并给出以下错误:
[1103/163807.480539:ERROR:file_io_posix.cc(144)] open /sys/devices/system/cpu/cpu0/cpufreq/scaling_cur_freq: No such file or directory (2)
[1103/163807.480673:ERROR:file_io_posix.cc(144)] open /sys/devices/system/cpu/cpu0/cpufreq/scaling_max_freq: No such file or directory (2)
Run Code Online (Sandbox Code Playgroud)
这是我的论点
[1103/163807.480539:ERROR:file_io_posix.cc(144)] open /sys/devices/system/cpu/cpu0/cpufreq/scaling_cur_freq: No such file or directory (2)
[1103/163807.480673:ERROR:file_io_posix.cc(144)] open /sys/devices/system/cpu/cpu0/cpufreq/scaling_max_freq: No such file or directory (2)
Run Code Online (Sandbox Code Playgroud)
操作系统:Ubuntu 21.10 x86_64 用户:root Chrome 版本:打开 Chrome 时崩溃
我使用 Kate 进行编码和记笔记。有时它会崩溃——通常是当我有很多空的时候。未保存的“真实”文档(例如,由文件支持的文档,在某些时候已保存)通常有一个备份/自动保存类型的恢复文件,或多或少是有效的。不幸的是,我已经习惯于使用未命名的缓冲区(例如,按下CtrlnKate)来存储临时笔记。
凯特刚刚坠毁,我失去了其中的六个。Kate 是否在任何地方存储“新”文件的备份?我查了一下,~/.kde/share/apps/kate/
没有看到明显的东西...
kate-editor 3.8.5
KDE 4.8.5
Ubuntu 12.04 (Don't remember if Kubuntu or Ubuntu + KDE, in case that makes a difference)
Run Code Online (Sandbox Code Playgroud) 我在同一个分区 (EXT2) 上有两个文件夹 如果我mv folder1/file folder2
和某些中断发生(例如电源故障),文件系统最终会不一致吗?
mv
操作不是原子的吗?
更新: 到目前为止,在 IRC 上我得到了以下观点:
有人可以澄清吗?
我收到来自服务器的磁盘使用警告
“安装在“/ ”的文件系统“/”达到了“关键”状态,因为您当前使用了其可用块的 92.77%。”
经过深入调查,我发现 /var/crash 使用的是 56G。在不影响服务器性能或启动的情况下从那里删除 vmcore 文件是否安全?
某些命令行界面工具在取消时返回损坏的控制台CTRL+C
。有时文本是不可见的,或者在我运行命令之前存在图形问题reset
。
(我使用 bash,但希望它独立于 shell。)
这个效果有名字吗?是什么导致了这种情况,程序员如何在工具中防止这种情况发生?在主要的编程语言中是否有解决这个问题的策略?
crash ×10
logs ×2
arch-linux ×1
centos ×1
chrome ×1
command-line ×1
console ×1
debian ×1
disk-usage ×1
ext2 ×1
filesystems ×1
intel ×1
kate ×1
kernel ×1
kernel-panic ×1
kill ×1
linux ×1
move ×1
startup ×1
systemd ×1