相关疑难解决方法(0)

小家伙们如何有效地学习和使用Puppet呢?

六个月前,在我们的非营利项目中,我们决定开始将系统管理迁移到 Puppet 控制的环境,因为我们预计从现在到一年后我们的服务器数量将大幅增长。

自从做出决定后,我们的 IT 人员就变得有点过于恼火了。他们最大的反对意见是:

  • “我们不是程序员,我们是系统管理员”;
  • 模块可在线获取,但许多模块彼此不同;轮子经常被重新发明,你如何决定哪一个合适;
  • 我们的 repo 中的代码不够透明,要找到某些东西是如何工作的,他们必须通过清单和模块进行递归,他们甚至可能在不久前自己编写;
  • 一个新的守护进程需要编写一个新的模块,约定必须与其他模块相似,这是一个困难的过程;
  • “让我们运行它,看看它是如何工作的”
  • 社区模块中有大量鲜为人知的“扩展”:“trocla”、“augeas”、“hiera”……我们的系统管理员如何跟踪?

我可以理解为什么大型组织会派遣他们的系统管理员参加 Puppet 课程以成为 Puppet 大师。但是,如果小玩家不参加课程并且基本上通过浏览器和编辑器学习它,他们如何将 Puppet 学习到专业水平?

configuration-management puppet

110
推荐指数
6
解决办法
3万
查看次数

CentOS 与 Ubuntu

I had a web server that ran Ubuntu, but the hard drive failed recently and everything was erased. I decided to try CentOS on the machine instead of Ubuntu, since it's based on Red Hat. That association meant a lot to me because Red Hat is a commercial server product and is officially supported by my server's manufacturer. However, after a few days I'm starting to miss Ubuntu. I have trouble finding some of the packages I want in the …

ubuntu centos

104
推荐指数
8
解决办法
17万
查看次数

为什么在 Red Hat 和 CentOS 的主要版本之间升级如此困难?

“我们可以将现有的生产 EL5 服务器升级到 EL6 吗?”

来自环境完全不同的两个客户的一个听起来简单的请求促使我通常的最佳实践回答“是的,但它需要协调重建您的所有系统”......

两位客户都认为,出于停机时间和资源原因,完全重建他们的系统是不可接受的选择... ……”

我不是要引出关于配置管理的回应(“Puppetize一切并不总是适用)或客户应该如何更好地计划。这是环境在生产能力中不断发展壮大的一个真实示例,但没有看到迁移到其操作系统下一个版本的干净路径。

环境 A:
非营利组织,拥有40 个 Red Hat Enterprise Linux 5.4 和 5.5 Web、数据库服务器和邮件服务器,运行 Java Web 应用程序堆栈、软件负载平衡器和 Postgres 数据库。所有系统都在不同位置的两个 VMWare vSphere 集群上进行虚拟化,每个集群都具有 HA、DRS 等。

环境 B:
高频金融交易公司,在多个托管设施中配备200 x CentOS 5.x系统,运行生产交易业务,支持内部开发和后台功能。交易服务器在裸机商品服务器硬件上运行。他们有许多sysctl.confrtctl,中断到位约束力和驱动程序的调整,以降低消息传送等待时间。有些具有自定义和/或实时内核。开发人员工作站也运行类似版本的 CentOS。


在这两种情况下,环境都按原样运行良好。升级的愿望来自对 EL6 中可用的更新应用程序或功能的需求。

  • 对于非盈利公司来说,它与 Apache、内核和一些会让开发人员感到高兴的东西有关。
  • 在贸易公司,它是关于内核、网络堆栈和 GLIBC 的一些增强,这将使开发人员感到高兴。

两者都不能在不彻底改变操作系统的情况下轻松打包或更新。

作为系统工程师,我很欣赏红帽建议在主要版本之间移动时进行完全重建。一个干净的开始迫使你重构并在此过程中注意配置。

对客户的业务需求很敏感,我想知道为什么这需要如此繁重的任务。RPM 打包系统不仅能够处理就地升级,但它是让您/boot受益的小细节:需要更多空间、新的默认文件系统、RPM 可能会在升级过程中中断、已弃用和已失效的软件包......

这里的答案是什么?其他发行版(基于 .deb、Arch 和 Gentoo)似乎具有这种能力或更好的途径。假设我们找到了以正确方式完成此任务的停机时间:

  • EL7 发布稳定后,这些客户端应该怎么做才能避免同样的问题呢? …

linux redhat centos configuration-management puppet

72
推荐指数
2
解决办法
3万
查看次数

XFS 文件系统在 RHEL/CentOS 6.x 中损坏 - 我该怎么办?

最新版本的 RHEL/CentOS (EL6) 给我十多年来严重依赖的XFS 文件系统带来了一些有趣的变化。去年夏天,我花了一部分时间来追查由文档记录不足的内核向后移植导致的XFS 稀疏文件情况。其他人在迁移到 EL6 后遇到了不幸的性能问题不一致的行为

XFS 是我用于数据和增长分区的默认文件系统,因为它比默认的 ext3 文件系统提供稳定性、可扩展性和良好的性能提升。

2012 年 11 月出现的 EL6 系统上的 XFS 问题。我注意到我的服务器显示异常高的系统负载,即使在空闲时也是如此。在一种情况下,卸载的系统将显示 3+ 的恒定负载平均值。在其他情况下,负载增加了 1+。挂载的 XFS 文件系统的数量似乎会影响负载增加的严重程度。

系统有两个活动的 XFS 文件系统。升级到受影响的内核后,负载为 +2。 在此处输入图片说明

深入挖掘,我在XFS 邮件列表上发现了一些线程,这些线程指向xfsaild处于STAT D状态的进程频率增加。相应的CentOS Bug TrackerRed Hat Bugzilla条目概述了问题的细节,并得出结论,这不是性能问题;只有在比2.6.32-279.14.1.el6更新的内核中报告系统负载时出错。

卧槽?!?

在一次性情况下,我知道负载报告可能没什么大不了的。尝试使用您的 NMS 和数百或数千台服务器来管理它!这是在201211 月在EL6.3 下的内核2.6.32-279.14.1.el6 中发现的。内核2.6.32-279.19.1.el62.6.32-279.22.1.el6在随后几个月(2012 年 12 月和 2013 年 …

linux xfs filesystems redhat centos

30
推荐指数
2
解决办法
2万
查看次数

通过 USB 连接的 APC UPS 触发 VMware ESXi 关机

我将一堆 ESXi 5.1 服务器运送到远程办公室,在那里它们将通过 APC UPS 供电。

我想让 UPS 触发已连接服务器的关闭 - 然后我将依靠 ESXi 配置来处理托管在其上的 VM 的关闭/暂停。

我可以看到 APC使用他们的 PowerChute Network Shutdown 记录了一个解决方案,但这涉及为每个办公室设置一个额外的服务器,并且每个 UPS 上都需要网卡。我们通常使用不带网卡的 UPS(例如 Back-UPS Pro)——它们带有 USB 连接器,并且在我们办公室所在的位置随时可用。

如何通过 USB 将 UPS 连接到 ESXi 主机,然后让 ESXi 检测到断电并采取相应措施?有没有人设法做到这一点。

electrical-power vmware-esxi apc-smart-ups

20
推荐指数
3
解决办法
9万
查看次数

平衡(当前与稳定性)Linux 服务器分布

我是 Gentoo 的长期用户,无论是在桌面还是服务器上。作为一名软件工程师,我喜欢它的灵活性和可定制性(以及它的前沿和滚动发布的事实)。但是对于我的新服务器,我想使用不同的发行版。主要是因为编译所有内容会阻碍虚拟服务器,但也因为 Gentoo 过于前沿,有时更新应该(更多)正确测试和延迟。

(附带说明:这些年来,我已经成功部署/维护了几个 Gentoo 机器,而且大多数时候,事情进展得非常顺利,而且这些机器都很棒。)

因此,我想根据经验(而非意见)向社区寻求建议,哪些发行版最适合以下标准:

一般的

  1. 滚动发布或非常好的(可靠的)就地升级路径
  2. 既不完全过时也不绝对前沿的软件包存储库
    • Python 2.7 / 3.3(系统将主要部署python/django应用)
    • 最近的 gcc (>= 4.7)
  3. 维护良好,良好的社区
  4. 灵活和可定制
    • 应该可以并排安装不同的 gcc 或 python 版本

安全

  1. 签名(或以其他方式保护)包存储库
  2. 理智/安全的编译器标志(针对安全性而不是性能而定制)
  3. 及时的安全更新和专门的安全团队/公告列表

立即想到的是CentOSDebian,但不幸的是,它们在软件包方面都已经过时了。

我正在关注Ubuntu,但与 Universe 或其他发行版相比,他们正式支持的软件(主要/受限存储库)相当小。我也不太确定他们对官方软件包的维护情况(关于安全修复),而且我真的不喜欢他们在做出影响用户的决定时的企业(= 封闭)心态。附带说明:我最近为朋友安装了 12.10 桌面,并没有留下深刻印象。

ArchLinux接近Gentoo,减去包编译,恕我直言。我自己还没有尝试过,但立即脱颖而出(消极地恕我直言)的是相当小的核心团队和缺少的安全团队。似乎没有专门的安全列表,他们最近才集成了包签名(我不知道这是否是强制性的)。还有相当多的软件包仅通过 AUR 或其他方式支持。关于这一点,我无话可说。

OpenSuSE也是我关注的东西,但我最后一次尝试 SuSE 是在内核 1.x 时代,老实说(当时我是一个非常年轻的极客:P)。所以我对它的现状几乎一无所知。

老实说,Fedora也是我考虑过的。它通常维护得很好,并且(如果它没有延迟几个月)有一个很好的发布时间表。另一方面,我读过很多关于 Fedora 18 的坏消息,尤其是关于升级路径。此外,它绝对是非常前沿的。

除了感谢您阅读本文并抽出宝贵时间之外,我无法在这篇相当长的帖子中添加太多内容。:-)

更新 @ 2024UTC

我觉得我需要更新我的问题。尽管我完全同意给出的答案,但它们并不是我真正想要的。所以这里有几点希望能澄清我的情况:

  • 我已经维护服务器 10 多年了,所以(至少目前)我不考虑雇用某人来帮助我或减轻负载。

  • 我知道我的 Linux 方法。它一直是我的主要系统超过 15 年左右。作为一名软件工程师和极客,我不会用它换取全世界。:)

  • 我正在根据我提到的不同发行版的经验寻求建议。我知道我可以在虚拟机中安装所有这些(我最终会安装在候选名单上的那些),但即使我认为发行版 xy 很棒,但它绝对没有说明它的维护情况如何。或者一旦有新版本发布,这条路有多坎坷。只有时间可以证明。诸如此类的东西,我一直在寻找。一个星期的简单试运行无法显示的体验。基于仅长期使用发行版的经验的建议。

我还必须强调,我在上面原始帖子中的列表几乎总结了对我来说很重要的内容。

linux ubuntu fedora opensuse arch-linux

5
推荐指数
1
解决办法
349
查看次数

如何通过 PXE 将内核参数传递给类似 Ubuntu 的操作系统安装程序 ISO?

我的处境很艰难,我需要在带外访问功能有限的硬件上远程安装QuantaStor(基于 Ubuntu- hiss)的设备。

目标系统是HP ProLiant DL180 G6 服务器,它具有完全许可的Lights-Out LO100i远程 KVM。这是与 ILO3 或 ILO4 管理处理器相比的一大步。该硬件的挑战在于LO100i 的虚拟媒体功能不可靠。随着 Java 版本的发展,该 ILO 变得越来越不实用。现在,我无法通过远程媒体启动系统,即使此功能过去运行良好

因此,我的下一步是尝试使用 QuantaStor ISO 映像 PXE 引导此服务器。奇怪的是,关于如何在不链接引导加载程序等的情况下直接 PXE 引导 ISO 映像有许多相互矛盾的说明。经过一些实验,我发现我可以memdisk通过 PXE 服务器使用引导 ISO 。我在这个环境中控制了DNS和DHCP,所以我走了修改/etc/dhcpd.conf配置文件的标准路线来反映:

# Begin temporary PXE boot
allow booting;
allow bootp;
option option-128 code 128 = string;
option option-129 code 129 = text;
next-server 172.30.27.5;
filename "/pxelinux.0";
# End temporary …
Run Code Online (Sandbox Code Playgroud)

ubuntu ipmi hp pxe-boot quantastor

5
推荐指数
1
解决办法
6933
查看次数

为什么 Centos 6 的内核比 Ubuntu 12.04 旧

嗨,有人可以帮助我理解这一点。

在 Centos 6.2 上,它的内核显示为 2.6.32-220.el6.x86_64

而在 Ubuntu 12.04 上它显示为3.2.0-23-generic.

3.0 内核是最新的内核之一,Ubuntu 正在使用它,而 Centos 使用的是旧内核。为什么会这样?

旧内核能否提供新内核所能提供的所有新功能?他们为什么不升级到3.0?

linux ubuntu redhat centos kernel

0
推荐指数
1
解决办法
1535
查看次数