标签: troubleshooting

Unix 上正在运行的进程的环境变量？

我需要解决一些与 Unix 系统上的环境变量相关的问题。

在 Windows 上，我可以使用 ProcessExplorer 之类的工具来选择特定的进程并查看每个环境变量的值。

我怎样才能在 Unix 上完成同样的事情？echoing和envcmd 只显示当前的值，但我想查看正在运行的进程当前使用的值。

linux unix troubleshooting environment-variables process

m3r*_*nEz

2016 02-23

241
推荐指数

9
解决办法

15万
查看次数

我的 /var/lib/mysql 目录中的 ibdata1 文件是什么？

登录到我的 Webmin 控制面板，我注意到几乎所有的磁盘空间都已满。我在我的系统上搜索了十个最大的文件/目录，发现一个名为 ibdata1 的文件占用了大约 94GB 的空间。它驻留在我的 /var/lib/mysql 目录中。

ibdata1 有什么作用？我可以安全地删除它吗？我的假设是它是某种垃圾，但这只是一个疯狂的猜测。

mysql maintenance troubleshooting ubuntu-12.04

Jam*_*mes

2013 03-15

40
推荐指数

2
解决办法

9万
查看次数

CPU 利用率高但平均负载低

我们遇到了一个奇怪的行为，我们看到 CPU 利用率很高，但平均负载很低。

我们监控系统的以下图表可以最好地说明这种行为。

CPU使用率和负载

在大约 11:57，CPU 利用率从 25% 上升到 75%。平均负载没有显着变化。

我们运行的服务器有 12 个内核，每个内核有 2 个超线程。操作系统将其视为 24 个 CPU。

CPU 利用率数据是通过/usr/bin/mpstat 60 1每分钟运行一次来收集的。all行和%usr列的数据显示在上面的图表中。我确信这确实显示了每个 CPU 数据的平均值，而不是“堆叠”利用率。虽然我们在图表中看到 75% 的利用率，但我们看到一个进程显示在top.

平均负载数字取自/proc/loadavg每分钟。

uname -a 给出：

Linux ab04 2.6.32-279.el6.x86_64 #1 SMP Wed Jun 13 18:24:36 EDT 2012 x86_64 x86_64 x86_64 GNU/Linux

Run Code Online (Sandbox Code Playgroud)

Linux 发行版是 Red Hat Enterprise Linux Server release 6.3 (Santiago)

我们在机器上以相当高的负载运行几个 Java Web 应用程序，每台机器每秒 100 个请求。

如果我正确解释了 CPU 利用率数据，当我们有 75% 的 CPU 利用率时，这意味着我们的 …

linux troubleshooting cpu-usage load-average

K E*_*son

2015 02-12

38
推荐指数

4
解决办法

8万
查看次数

页面分配失败 - 我是否内存不足？

最近，我在kern.log我的一台服务器中注意到了这样的条目：

Feb 16 00:24:05 aramis kernel: swapper: page allocation failure. order:0, mode:0x20

Run Code Online (Sandbox Code Playgroud)

我想知道：

该消息究竟是什么意思？
我的服务器内存不足吗？

交换使用率非常低（小于 10%），到目前为止我还没有注意到任何进程因为内存不足而被杀死。

附加信息：

服务器是运行 Debian 6.0 的 Xen 实例 (DomU)
它有 512 MB 的 RAM 和一个 512 MB 的交换分区
虚拟机内的 CPU 负载平均为 0.25

linux troubleshooting memory

mfr*_*man

2017 07-25

28
推荐指数

1
解决办法

7万
查看次数

您的故障排除规则、故障排除方法？

当您解决困难的网络/硬件/软件问题时，您是否有任何可以依靠的一般规则？

例如：“我通过用第二台计算机测试外围设备来隔离问题的根源”或“我移除尽可能多的硬件来启动设备，然后一个一个地添加组件，直到我可以重现问题” ，等等。

troubleshooting

use*_*ame

2010 10-02

22
推荐指数

6
解决办法

2万
查看次数

对“慢”网络进行故障排除

我们都曾抱怨“网络”在某些时候“慢”：可能被本地化到一个房间（交换机）或一台计算机，可能只是互联网（DNS？浏览器问题？），可能只是一个应用程序（长时间运行的 SQL 查询？正在运行 AV 扫描？）。

当您排除了明显的系统和/或应用程序问题后，您将如何测试网络的缓慢或不稳定行为？你在 OSI 层上工作吗？如果是这样，如何检查每一层？您如何确保物理网络在未知环境中正常运行？广播过多或广播风暴怎么办？第 3 层及以上？跟踪路由？任何其他提示，方法，想法？适用于各种规模网络的必备功能和工具（端口镜像、SNMP、监控等）？

networking troubleshooting performance

Wuc*_*cka

lucky-day

21
推荐指数

3
解决办法

4万
查看次数