小编eww*_*ite的帖子

我正在向该站点添加新的 HP ProLiant 设备，并且很好奇串行控制台与现代服务器上可用的 ILO/ILOM/DRAC 技术相比的优势。这是一个 Linux 环境，将增长以包含更多的 Windows 系统。我将混合使用刀片和 DL380。假设将来的任何设备上都有 ILO/DRAC 的完全许可/启用版本。

我过去配置过串行控制台，发现它们对网络设备特别有用。我对它们在服务器具有板载熄灯管理的环境中的优势或有用性感到困惑。

console serial ilo hp-proliant

eww*_*ite

2012 01-09

13
推荐指数

1
解决办法

2489
查看次数

SSD 驱动器的 ext3 分区上的突然断电后文件系统损坏是“预期行为”吗？

我的公司制造了一个嵌入式 Debian Linux 设备，它从内部 SSD 驱动器上的 ext3 分区启动。由于该设备是一个嵌入式“黑匣子”，它通常以粗鲁的方式关闭，只需通过外部开关切断设备的电源即可。

这通常是没问题的，因为 ext3 的日志记录使事情井然有序，所以除了偶尔丢失部分日志文件之外，事情一直在顺利进行。

但是，我们最近看到许多单元在经过多次硬电源循环后，ext3 分区开始出现结构性问题——特别是，我们在 ext3 分区上运行 e2fsck，它发现了许多类似的问题显示在此问题底部的输出列表中。运行 e2fsck 直到它停止报告错误（或重新格式化分区）会清除问题。

我的问题是……在遭受大量突然/意外关闭的 ext3/SSD 系统上看到这样的问题有什么含义？

我的感觉是这可能是我们系统中软件或硬件问题的迹象，因为我的理解是（除非出现错误或硬件问题）ext3 的日志记录功能应该可以防止此类文件系统完整性错误。（注意：我知道用户数据没有被记录在日志中，因此可能会发生被删除/丢失/截断的用户文件；我在这里专门讨论文件系统元数据错误，如下所示）

另一方面，我的同事说这是已知/预期的行为，因为 SSD 控制器有时会重新排序写入命令，这可能会导致 ext3 日志混淆。特别是，他认为，即使在正常运行的硬件和没有错误的软件的情况下，ext3 日志也只会降低文件系统损坏的可能性，并非不可能，因此我们不应该对时不时地看到这样的问题感到惊讶。

我们谁是对的？

Embedded-PC-failsafe:~# ls
Embedded-PC-failsafe:~# umount /mnt/unionfs
Embedded-PC-failsafe:~# e2fsck /dev/sda3
e2fsck 1.41.3 (12-Oct-2008)
embeddedrootwrite contains a file system with errors, check forced.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Invalid inode number for '.' in directory inode 46948.
Fix<y>? yes

Directory inode 46948, block 0, offset 12: …

Run Code Online (Sandbox Code Playgroud)

hardware filesystems ext3 ssd

Jer*_*ner

2012 12-06

13
推荐指数

1
解决办法

2537
查看次数

在单个 Linux 服务器上运行不同文件系统的性能影响

这本书“的HBase权威指南”指出，

不建议在单个服务器上安装不同的文件系统。这可能会对性能产生不利影响，因为内核可能必须拆分缓冲区缓存以支持不同的文件系统。据报道，对于某些操作系统，这可能会对性能产生破坏性影响。

这真的适用于Linux吗？我从未见过超过 300 MB 的缓冲区缓存，而且大多数现代服务器都有千兆字节的 RAM，因此在不同文件系统之间拆分缓冲区缓存应该不是问题。我还缺少其他东西吗？

linux performance xfs filesystems ext4

Ale*_*lex

2019 04-08

13
推荐指数

2
解决办法

965
查看次数

如何设置monit来监控磁盘空间

我在我的服务器上使用 monit 来监控 apache 和 mysql 的运行。

现在我想在磁盘太满时添加警报。我添加了这个用于测试/etc/monit/monitrc：

check device rootfs with path /dev/md0
    if space usage > 10% then alert

Run Code Online (Sandbox Code Playgroud)

我有两个要检查的分区：/和/var：

mount
/dev/md0 on / type ext3 (rw)
/dev/md2 on /var type ext3 (rw)

Run Code Online (Sandbox Code Playgroud)

除了磁盘空间之外，此配置中还有哪些有用的检查？

monitoring debian disk-space-utilization monit

rub*_*o77

2015 09-02

13
推荐指数

1
解决办法

2万
查看次数

管理 LSI 和类似 RAID 控制器上的电池重新学习周期

工程师如何处理 RAID 控制器电池“重新学习”周期？

如中所述：LSI MegaRaid 上的“电池重新学习”是什么？, 重新学习周期会使 RAID 控制器电池（BBWC 或 BBU）放电，从而取消写入缓存加速。检查电池寿命，充电后，重新启用写入缓存。在重新学习周期的持续时间内，这对服务器 I/O 性能有明显的影响。我认为这每月发生一次。

已经注意到性能下降，尤其是在数据库系统上：

数据库慢？检查 RAID 电池！

重新了解您的电池

我的背景是 HP ProLiant 服务器，它的Smart Array控制器没有经过这个练习（或者至少有更主动的电池寿命监控）。这似乎是一个可怕的功能（最大的不便，收益很小），但我在一个有许多 LSI 控制器（在Supermicro硬件上）的环境中，想看看是否可以将一揽子策略应用于相关系统。