查看 MySQL 错误文件后,我发现了有关磁盘空间的错误。现在我认为这是 MySQL 崩溃的原因:
[root@xxxx ~]# cat /var/lib/mysql/xxxx.com.err
120528 17:45:05 [Note] Crash recovery finished.
/usr/sbin/mysqld: Disk is full writing './mysql-bin.~rec~' (Errcode: 28). Waiting for someone to free space... (Expect up to 60 secs delay for server to continue after freeing disk space)
Run Code Online (Sandbox Code Playgroud)
这可能是崩溃背后的原因吗?
CentOS 6、Parallels PLESK 10.4、Apache
我的一台服务器在周末宕机了,这让我很沮丧。在它发生的日期和时间,我的日志错误/消息以这个结尾 -
/var/日志/安全:
Jul 29 03:53:15 u######## su: PAM adding faulty module:
/lib64/security/pam_fprintd.so
Jul 29 03:53:15 u######## su: pam_unix(su-l:session):
session opened for user popuser by (uid=0)
Jul 29 03:53:16 u######## su: pam_unix(su-l:session):
session closed for user popuser
Jul 29 03:53:16 u######## su: PAM unable to dlopen(/lib64/security/pam_fprintd.so):
/lib64/security/pam_fprintd.so: cannot open shared object file: No such file or
directory
Jul 29 03:53:16 u######## su: PAM adding faulty module:
/lib64/security/pam_fprintd.so
Jul 29 03:53:16 u######## su: pam_unix(su-l:session):
session opened for …Run Code Online (Sandbox Code Playgroud) 我有一对服务器,它们都记录一个事件“cpuz135 服务已成功发送启动控制”。但两台机器上都没有安装 cpu-z。我无法在 Windows 服务管理器控制台或命令行中使用“sc query type= service”找到列出的服务。
两台服务器都是 Win 2003,并且在记录此事件后都可能崩溃。这还能从哪里来呢?
我在 ESXi 6.5 上托管的虚拟机中安装了 Debian 9(“Stretch”)操作系统是最新的,除了 VMware 工具之外没有安装其他任何东西。
有时,当我执行命令时,服务器会死机,除了重置 VM 之外什么也做不了(SSH 服务器变得无响应,所有终端都被冻结,不显示 KP 或其他任何内容)
我可以很容易地重现这个问题:我只需要执行 wget 几次,操作系统就会挂起。
起初,我认为这可能是内存问题。我在主机上使用了memtest86+,没有发现问题。我还尝试了 debian 软件包“memtester”,它在 VM 中运行良好,并且不会使操作系统冻结。
/var/log/messages 没有显示什么特别的,但有一行我不明白:
Jul 3 13:05:57 myhost kernel: [ 58.966715] TCP: ens192: Driver has suspect GRO implementation, TCP performance may be compromised.
Run Code Online (Sandbox Code Playgroud)
可能是什么问题,我该如何调试整个过程?
配置:1 CPU / 4 核 - 32GB 内存 - 64GB 硬盘
我在 VMware 下运行 Windows Server 2008。
最近,它几乎每天都开始崩溃,CPU 利用率持续 100%,GUI 中没有响应。
是否有循序渐进的技术来追踪此问题的根源?
我会查看哪些日志?
ps 问题出现在我尝试卸载 Acronis 的时候,并且蓝屏了。但是,我不确定当前的故障是否与 Acronis 有关。
windows-server-2008 server-crashes logging windows-event-log
今天早上我有一个服务器锁定。这是控制台的屏幕截图:

屏幕截图中的任何消息对我来说都没有任何意义。我有一种感觉,重要的东西可能从控制台上滚下来了。我无法在系统日志、消息、dmesg、调试日志或崩溃时记录的任何内容中找到来自上述屏幕截图的任何消息。这东西不应该被记录吗?
这是一个运行 Proxmox 的 Debian 机器。uname 输出:
2.6.32-4-pve #1 SMP Mon May 9 12:59:57 CEST 2011 x86_64 GNU/Linux
服务器已经在线大约一年,没有其他崩溃,它再次启动就好了。
我很想弄清楚问题可能是什么,以便我们可以防止将来再次发生。但是,根据我目前掌握的证据,我什至不知道这是硬件问题还是软件问题。想法?
我在这里一团糟。几年来,我们一直在办公室的本地服务器上运行我们自己定制的应用程序。服务器时不时地有糟糕的日子和美好的日子 - 但是服务器几天前确实死了 - 在日常维护期间,我们聘请了一名自由职业者来安装打印机 - 白痴最终摧毁了服务器 [我仍然推测他试图把它搞砸一点,这样他就可以收取费用来修复一个自己造成的错误,只是这次它超出了他自己的能力]。
我们的系统已关闭,我们非常期待在在线主机上托管我们的 Web 应用程序。我对这里的建议持开放态度。让我解释一下我们在这里运行的系统的性质。
我们的系统是基于 PHP MySQL 的——它是一个以关键数据时间为中心的协作系统。基本上,我们有一个公司电子邮件地址,用于接收客户请求。我们的应用程序用于协作这些请求。我们有一个在后台定期运行的 cron 作业或实际运行的计划任务,它实际上从电子邮件帐户中实际下载电子邮件并将其转换为可以输入到数据库中进行查询的格式,然后从实际帐户中删除电子邮件,因此它在我们的数据库中,因此我们的系统可以使用它进行协作,而不必每次需要电子邮件时都建立 IMAP 连接。考虑到我们收到的大量请求,此 cron 作业设置为每 3 分钟运行一次 - 因此我们的应用程序非常以时间为中心。
计划任务还会从邮件服务器下载附件,并将它们作为平面文件存储在我们的 Web 应用程序中。平均而言,电子邮件请求没有附件,但在常规情况下,平均附件在 200K 到 10MB 之间变化,尽管超过 5MB 的附件很少见。大多数下载是在邮件服务器到 Web 应用程序之间进行的。
我需要一个可靠的主机,停机时间几乎为零,因为我们不会运行一个网站,我们将运行一个非常关键的应用程序 - 我的意思是我们的业务依赖于它,而我的老板实际上离它只有几英寸远在这一刻崩溃并失去理智:。
有人建议使用 rackspace 的云服务器——我正在研究那些,但基本上因为我是一名程序员——我对网络和托管方面的接触并没有超出对 Web 应用程序的故障排除和调试。所以我需要一些针对我们所处情况的建议 - 在线主机是个好主意还是我们需要投资更好的网络硬件[现在我们已经解雇了一名自由职业者] - 考虑在线主机的选择是什么选择我们应该注意哪些提供物有所值。便宜是好的,但如果质量上有很大的妥协,那就不是了……请帮助:(这是紧急的
编辑 ====
虽然这个建议很好,但现在我正在考虑这种情况。让我们假设我选择云托管或专用服务器之类的在线服务 - 在这种情况下我是否仍然需要设置故障转移系统,如果是这样 - 如何设置故障转移系统或最好的方法是什么处理它。我们是一家小公司,另一个 IT 人员在另一台主机的托管服务方面有一些不太好的经验 - 就像您需要有人经常在管理服务上与主机协调,如果我们必须做一半的工作那么我们几乎可以投入一些时间来管理我们自己的服务器,无论是本地服务器还是云服务器。
在上面定义的情况下 - 如果我们考虑一个在线专用主机......我们将如何设置故障转移系统?
server-crashes web-hosting web-applications dedicated-server
我的托管服务提供商告诉我,我目前使用的服务器硬盘已崩溃,他们无法恢复大部分数据,他们只能通过使用取证从崩溃的硬盘中恢复一些文件或文件夹(少于 1%)恢复工具包。
他们声称他们已经尝试了多种方法,例如 ext3grep、linux 救援、fsck 和多种恢复工具,但都没有成功。
我在这 6 年中的所有数据都消失了,他们只会将托管过期日期再延长 90 天。
有没有其他方法可以从崩溃的硬盘中检索数据?
我是一名网络开发人员,对 IT 方面的知识有限。基本上,我使用 slax live CD 将所有重要文件从崩溃窗口复制到拇指驱动器或通过网络的另一台 PC。
据我所知,mysql 存储在“/var/lib/mysql”下,如果我们设法复制所有“table.frm”并粘贴到另一台服务器中,这会解决吗?
需要你的帮助。谢谢你。
问候, cw
我们在 Windows 7 计算机上的 VirtualBox 中运行 CentOS 版本 6.3 时遇到问题。症状如下:
几个小时甚至几天内一切正常。然后发生了一些破坏系统的事情。
发生这种情况后我们还能做什么:
什么不起作用:
当发生这种情况时,我们在服务器上看到的内容如下:
在 /var/log/messages 中我们得到以下内容:
Jun 14 01:10:48 devvm kernel: e1000 0000:00:03.0: eth0: Detected Tx Unit Hang
Jun 14 01:10:48 devvm kernel: Tx Queue <0>
Jun 14 01:10:48 devvm kernel: TDH <2e>
Jun 14 01:10:48 …Run Code Online (Sandbox Code Playgroud) 昨晚 7 点 57 分 18 分,Apache2 7 月 17 日关闭并停止工作。直到今天(18日)早些时候我才注意到
发生的更新:/var/log/apt/history.log 显示执行了 3 次更新:
Start-Date: 2018-07-17 19:57:18
Commandline: apt-get -y install apache2 Install: libjansson4:amd64
(2.7-3, automatic) Upgrade: apache2-data:amd64 (2.4.33-
3.0+ubuntu16.04.1+deb.sury.org+1, 2.4.34-
1+ubuntu16.04.1+deb.sury.org+5), apache2-bin:amd64 (2.4.33-
3.0+ubuntu16.04.1+deb.sury.org+1, 2.4.34
1+ubuntu16.04.1+deb.sury.org+5), apache2:amd64 (2.4.33
3.0+ubuntu16.04.1+deb.sury.org$ End-Date: 2018-07-17 19:57:23
Start-Date: 2018-07-17 19:57:37
Commandline: apt-get -y install apache2-doc
Upgrade: apache2-doc:amd64 (2.4.33-3.0+ubuntu16.04.1+deb.sury.org+1,
2.4.34-1+ubuntu16.04.1+deb.sury.org+5)
End-Date: 2018-07-17 19:57:39
Start-Date: 2018-07-17 19:57:43
Commandline: apt-get -y install apache2-suexec-custom
Upgrade: apache2-suexec-custom:amd64 (2.4.33-
3.0+ubuntu16.04.1+deb.sury.org+1, 2.4.34-
1+ubuntu16.04.1+deb.sury.org+5)
End-Date: 2018-07-17 19:57:44
Run Code Online (Sandbox Code Playgroud)
进入后:/etc/init.d/apache2 start …
server-crashes ×10
centos ×2
debian ×2
apache-2.4 ×1
centos6 ×1
hard-drive ×1
kernel ×1
linux ×1
logging ×1
mysql ×1
pam ×1
proxmox ×1
service ×1
virtualbox ×1
web-hosting ×1