小编eww*_*ite的帖子

惠普计划限制对 ProLiant 服务器固件的访问 - 后果?

长期以来,我一直倡导在我的系统环境中使用 HP ProLiant 服务器。在过去的 12 年中,该平台一直是我在多个行业进行基础设施设计的基础。

ProLiant 硬件的主要卖点是持久的产品线,具有可预测的组件选项、易于浏览的产品规格 (Quickspecs)、强大的支持渠道以及在产品生命周期内积极的固件发布/更新计划。

这有利于在一级二级市场使用 HP 齿轮。随着组件成本的下降,旧设备和最新型号的设备可以通过额外的部件或通过交换/升级获得新的生命。

HP 固件的独特属性之一是倾向于在固件版本中引入新功能以及错误修正。我已经看到 Smart Array RAID 控制器获得新功能,服务器平台获得对更新操作系统的支持,严重的性能问题得到解决;全部通过固件发布。通读典型的变更日志历史可以揭示创建一个稳定的硬件平台需要多少测试和努力。我很感激,并相应地购买了。

其他制造商似乎按原样交付产品,只专注于纠正后续固件版本中的错误。我很少在 Supermicro 和 Dell 设备上运行固件更新。但我认为在没有初始固件维护通行证的情况下部署 HP 服务器是不负责任的。


鉴于此,早期报告的的政策修订通过关于HP服务器固件访问是惊人的...

官方解析:

在此处输入图片说明

访问适用于 HP ProLiant 服务器的特定服务器固件更新和 SPP 需要获得授权,并且仅适用于拥有有效合同支持协议、HP Care Pack 服务或与其 HP 支持中心用户 ID 相关联的保修的 HP 客户。与往常一样,客户必须为正在更新的特定产品签订合同或保修。

本质上,您的服务器必须有有效的保修和支持才能访问固件下载(可能还有HP Service Pack for ProLiant DVD)。

这将影响使用旧设备最多的独立 IT 技术人员、内部 IT 和客户,其次是寻求二手惠普设备交易的人。我提供了许多服务器故障答案,归结为“更新此组件的固件将解决您的问题”。该建议的接收者可能不会获得积极的支持,并且没有资格根据此政策下载固件。

  • 这是供应商锁定趋势的一部分吗?HP ProLiant Gen8 磁盘兼容性是一个先驱。
  • 惠普是否通过限制访问某些人所依赖的更新而越界?
  • 结果会像 Cisco …

hardware hp firmware update hp-proliant

35
推荐指数
2
解决办法
7340
查看次数

从 Linux 中禁用超线程(无法访问 BIOS)

我有一个在远程设施上运行金融交易应用程序的系统。我无权访问 ILO/DRAC,但需要禁用超线程。该系统运行 Intel Westmere 3.33GHz X5680 六核 CPU。我可以重新启动,但要确保系统由于性能问题而未启用超线程。有没有一种干净的方法可以从 Linux 中做到这一点?

编辑:noht添加到内核引导命令行的指令不起作用。RHEL 也一样。

参见:https : //bugzilla.redhat.com/show_bug.cgi?id=440321#c9

hp-proliant hyperthreading dell-poweredge

34
推荐指数
7
解决办法
6万
查看次数

服务器级硬件有必要烧内存吗?

考虑到许多服务器级系统都配备了ECC RAM部署之前入内存 DIMM是否必要或有用?

我遇到过这样一种环境,其中所有服务器 RAM 都经过漫长的老化/压力测试过程。这有时会延迟系统部署并影响硬件交付时间。

服务器硬件主要是Supermicro,因此 RAM 来自各种供应商;不是直接来自制造商,如Dell PoweredgeHP ProLiant

这是一个有用的练习吗?在我过去的经验中,我只是直接使用供应商 RAM。POST内存测试不应该捕获 DOA 内存吗?我早在 DIMM 实际发生故障之前就对 ECC 错误做出了响应,因为 ECC 阈值通常是保修安置的触发因素。

  • 你烧入你的RAM吗?
  • 如果是这样,您使用什么方法来执行测试?
  • 它是否在部署之前发现了任何问题?
  • 与不执行该步骤相比,老化过程是否导致任何额外的平台稳定性?
  • RAM添加到现有正在运行的服务器时,您会怎么做?

hardware memory hp supermicro stress-testing

33
推荐指数
6
解决办法
5976
查看次数

是否有可能影响 Linux 下 CPU 的枚举方式?

我有一个 HP DL380 G7,里面有 2 个不匹配的 CPU。一种是具有更快内核的四核 CPU,一种是具有较慢内核的 6 核 CPU。

在这个盒子上,我运行一个应用程序,由于许可原因,它只使用 CPU0-CPU3。

对我来说,希望四核 CPU 上更快的内核在操作系统中枚举到 CPU0-CPU3,从而为我带来性能奖励 a) 使用更快的时钟内核,以及 b) 将所有线程保持在同一个物理 CPU 上.

有没有办法在 BIOS 中、在 Linux 中的配置文件或引导选项中实现这一点?

具体的CPU型号有:

Intel(R) Xeon(R) CPU E5649 @ 2.53GHz(六核)

Intel(R) Xeon(R) CPU E5640 @ 2.67GHz(四核)

linux central-processing-unit hp hp-proliant

33
推荐指数
1
解决办法
2369
查看次数

有关 Linux 服务器的 Active Directory 身份验证的常识?

2014 年关于 Linux 服务器和现代Windows Server 操作系统(以 CentOS/RHEL 为重点)的Active Directory 身份验证/集成的共同智慧是什么?

自从我 2004 年第一次尝试集成以来,多年来,围绕这方面的最佳实践似乎已经发生了变化。我不太确定哪种方法目前具有最大的动力。

在现场,我见过:

Winbind/Samba
直接LDAP
有时 LDAP + Kerberos
Microsoft Windows Services for Unix (SFU)
Microsoft Identity Management for Unix
NSLCD
SSSD
FreeIPA
Centrify
Powerbroker(同样 née

Winbind 总是看起来很糟糕而且不可靠。Centrify 和 Likely 等商业解决方案总是有效,但似乎没有必要,因为此功能已融入操作系统。

我完成的最后几次安装将Microsoft Identity Management for Unix角色功能添加到 Windows 2008 R2 服务器和 Linux 端的 NSLCD(对于 RHEL5)。这在 RHEL6 之前一直有效,在那里缺乏对 NSLCD 的维护和内存资源管理问题迫使对 SSSD 进行更改。Red Hat 似乎也支持 SSSD 方法,所以这对我来说很好用。

我正在使用新安装,其中域控制器是 Windows 2008 R2核心系统,并且无法添加 Unix 角色功能的身份管理功能。而且我被告知 …

linux active-directory redhat ldap

32
推荐指数
5
解决办法
3万
查看次数

Linux 服务器空间不足

我在连续两次采访中被问到这个问题,但经过一些研究和与各种系统管理员的核实后,我没有得到好的答案。我想知道是否有人可以帮助我。

服务器磁盘空间不足。您注意到一个非常大的日志文件,并确定可以安全地删除它。您删除了文件,但磁盘仍然显示它已满。什么会导致这种情况,您将如何补救?您如何找到哪个进程正在写入这个巨大的日志文件?

linux shell log-files disk-space-utilization

31
推荐指数
4
解决办法
3862
查看次数

XFS 文件系统在 RHEL/CentOS 6.x 中损坏 - 我该怎么办?

最新版本的 RHEL/CentOS (EL6) 给我十多年来严重依赖的XFS 文件系统带来了一些有趣的变化。去年夏天,我花了一部分时间来追查由文档记录不足的内核向后移植导致的XFS 稀疏文件情况。其他人在迁移到 EL6 后遇到了不幸的性能问题不一致的行为

XFS 是我用于数据和增长分区的默认文件系统,因为它比默认的 ext3 文件系统提供稳定性、可扩展性和良好的性能提升。

2012 年 11 月出现的 EL6 系统上的 XFS 问题。我注意到我的服务器显示异常高的系统负载,即使在空闲时也是如此。在一种情况下,卸载的系统将显示 3+ 的恒定负载平均值。在其他情况下,负载增加了 1+。挂载的 XFS 文件系统的数量似乎会影响负载增加的严重程度。

系统有两个活动的 XFS 文件系统。升级到受影响的内核后,负载为 +2。 在此处输入图片说明

深入挖掘,我在XFS 邮件列表上发现了一些线程,这些线程指向xfsaild处于STAT D状态的进程频率增加。相应的CentOS Bug TrackerRed Hat Bugzilla条目概述了问题的细节,并得出结论,这不是性能问题;只有在比2.6.32-279.14.1.el6更新的内核中报告系统负载时出错。

卧槽?!?

在一次性情况下,我知道负载报告可能没什么大不了的。尝试使用您的 NMS 和数百或数千台服务器来管理它!这是在201211 月在EL6.3 下的内核2.6.32-279.14.1.el6 中发现的。内核2.6.32-279.19.1.el62.6.32-279.22.1.el6在随后几个月(2012 年 12 月和 2013 年 …

linux xfs filesystems redhat centos

30
推荐指数
2
解决办法
2万
查看次数

Linux 管理员如何提高他们的 shell 脚本和自动化技能?

在我的组织中,我与一群 NOC 员工、初出茅庐的初级工程师和少数高级工程师一起工作;所有这些都专注于 Linux。公司培养人才的一个有趣步骤是,有一条从 NOC 到高级工程队伍的途径。将人才库视为一个相对较新的人,我发现随着时间的推移,技能组合存在分歧……

  • 有些工程师非常了解一种或几种特定技术并不断沉浸其中……例如 MySQL、防火墙、SAN 存储、负载平衡器……
  • 还有其他人是通才,可以驾驭多种技术。
  • 所有人都学习了足够的 Linux(命令、进程)来做他们每天需要和使用的事情。

一些员工之间的一个区别因素是他们对脚本、自动化和配置管理方法的接受程度。例如,我们有两名工程师负责 Amazon AWS CloudFormation的大部分工作,另一名负责处理大部分Puppet基础设施。也许四分之一的工程师精通 BASH shell 脚本。

就业市场DevOps 技能的需求非常高的背景下,我很好奇其他组织如何促进这些技能的发展并培养他们的内部人才。脚本编写似乎不是一个特别可教的概念。

  • 系统管理员如何改进他们的 shell 脚本?
  • 没有/无法跟上 DevOps 范式的工程师还有一席之地吗?
  • 我们是否只是假设随着这些技术的发展,有些人会被抛在后面?可以吗?

automation scripting linux configuration-management puppet

30
推荐指数
4
解决办法
4276
查看次数

Linux - 真实世界的硬件 RAID 控制器调整(scsi 和 cciss)

我管理的大多数 Linux 系统都具有硬件 RAID 控制器(主要是HP Smart Array)。他们都在运行 RHEL 或 CentOS。

我正在寻找真实世界的可调参数,以帮助优化将硬件 RAID 控制器与 SAS 磁盘(智能阵列、Perc、LSI 等)和电池后备或闪存后备缓存相结合的设置的性能。假设 RAID 1+0 和多个主轴(4 个以上的磁盘)。

我花了大量时间为低延迟和金融交易应用程序调整 Linux 网络设置。但其中许多选项都有详细记录(更改发送/接收缓冲区、修改 TCP 窗口设置等)。工程师在存储方面做什么?

从历史上看,我对I/O 调度电梯进行了更改,最近选择了deadlinenoop调度程序来提高我的应用程序的性能。随着 RHEL 版本的进步,我还注意到 SCSI 和 CCISS 块设备的编译默认值也发生了变化。随着时间的推移,这对推荐的存储子系统设置产生了影响。但是,我已经有一段时间没有看到任何明确的建议了。而且我知道操作系统默认设置不是最佳的。例如,对于服务器级硬件上的部署而言,128kb 的默认预读缓冲区似乎非常小。

以下文章探讨了更改预读缓存和nr_requests值对块队列的性能影响。

http://zackreed.me/articles/54-hp-smart-array-p410-controller-tuning
http://www.overclock.net/t/515068/tuning-a-hp-smart-array-p400-with -linux-why-tuning-really-matters
http://yoshinorimatsunobu.blogspot.com/2009/04/linux-io-scheduler-queue-size-and.html

例如,以下是 HP Smart Array RAID 控制器的建议更改:

echo "noop" > /sys/block/cciss\!c0d0/queue/scheduler 
blockdev --setra 65536 /dev/cciss/c0d0
echo 512 > /sys/block/cciss\!c0d0/queue/nr_requests
echo 2048 > /sys/block/cciss\!c0d0/queue/read_ahead_kb
Run Code Online (Sandbox Code Playgroud)

还有什么可以可靠地调整来提高存储性能?
我专门在生产场景中寻找 sysctl 和 sysfs 选项。

storage hp performance-tuning hp-smart-array hardware-raid

29
推荐指数
1
解决办法
2万
查看次数

当我安装了 VMware ESXi 的 USB 密钥或 SD 卡出现故障时会发生什么?

安装在运行 VMware ESXi的HP ProLiant DL380p Gen8服务器中的 SD (SDHC) 卡刚刚出现故障:(

我在 vCenter 控制台和 HP ProLiant ILO 事件日志中遇到了一些看起来不祥的消息...

失去与设备的连接......支持引导文件系统。因此,主机配置更改将不会保存到持久存储中。

在此处输入图片说明

嵌入式闪存/SD-CARD:写入媒体 0 时出错,物理块 848880:堆栈异常。

在此处输入图片说明


VMware 提倡对 ESXi 使用 USB 和 SD (SDHC) 引导设备。这是开发占用空间较小的 ESXi(相对于较旧的 ESX)的主要原因之一。我花了很多时间向同事和客户强调ESXi 的可安装模式和嵌入式模式之间的差异。然而,这些失败似乎确实发生了。在这种情况下,这是我的第三个实例。

幸运的是,这是一个带有 SAN 存储的 vSphere 集群。应该采取什么步骤来补救这种失败?

hardware hp hp-proliant vmware-esxi

29
推荐指数
3
解决办法
5万
查看次数