多年来,我不得不扔掉不少计算设备(等等):
(这是除了各种笔记本电脑和打印机以与此问题无关的方式死亡之外。)
显然,从这么少的信息中无法确定,但这可能与电源问题有关吗?我目前没有任何此类设备的 UPS。电涌保护组插座上的所有东西,但没有什么可以平滑断电。
家用 UPS 真的可行和有用吗?我知道市场上有一些相当便宜的 UPS,但我不知道它们到底有多大用处。我对在断电期间保持家庭网络实际运行不感兴趣,但如果当前情况使我的硬件处于危险之中,我希望它更优雅地断电。
我时不时地读到一些数据中心发生严重火灾,大量设备损坏,客户下线。现在我想知道有什么可以支持和传播火力?
我的意思是服务器机房的墙壁通常很少或没有饰面。机架由金属制成。几乎所有单位都有金属外壳。电缆具有(或至少应该具有)不会蔓延火灾的绝缘材料。
什么是在服务器机房或数据中心蔓延的火?
在我的组织中,我们正在考虑购买刀片服务器——而不是机架服务器。当然,技术供应商也让它们听起来非常好。我在不同论坛上经常看到的一个问题是,理论上存在服务器机箱停机的可能性——这将导致所有刀片停机。这是由于共享基础设施。
我对这种可能性的反应是有冗余和两个机箱而不是一个(当然非常昂贵)。
有些人(包括例如 HP 供应商)试图说服我们,由于许多冗余(冗余电源等),机箱极不可能发生故障。
我这边的另一个担忧是,如果出现故障,可能需要备件——这在我们的位置(埃塞俄比亚)很难。
所以我想问一下管理过刀片服务器的有经验的管理员:你的经验是什么?它们是否会整体下降 - 什么是合理的共享基础设施,可能会失败?
这个问题可以扩展到共享存储。我再说一次,我们需要两个存储单元而不是一个——供应商再次说,这些东西非常坚固,预计不会出现故障。
好吧 - 我简直不敢相信,这样一个关键的基础设施在没有冗余的情况下会非常可靠 - 但也许你可以告诉我,你是否有成功的基于刀片的项目,它的核心部件(机箱、存储...... )
目前,我们看看惠普——因为 IBM 看起来太贵了。
我想这些是我周末想到的事情......
在我成长的过程中(不久前),我的父母总是教我们在关闭计算机后等待 30 秒,然后再重新打开它。
快进到今天的专业 IT,我知道很多人仍然这样做。
“30 秒”规则从何而来?有没有人在几秒钟内关闭和打开机器,实际上对机器造成了损坏?
我有一个新的HP ProLiant DL360 G7系统,它出现了一个难以重现的问题。服务器在POST 过程中随机挂在“正在进行电源和热校准... ”屏幕上。这通常在从已安装的操作系统进行热启动/重新启动之后。
系统在这一点上无限期地停止。通过 ILO 3 电源控制发出复位或冷启动,可使系统正常启动而不会发生事故。
当系统处于此状态时,ILO 3 界面完全可访问且所有系统健康指标均正常(全部为绿色)。服务器位于气候控制的数据中心内,电源连接到 PDU。环境温度为 64°F/17°C。该系统在部署之前被置于一个 24 小时的组件测试循环中,没有出现故障。
该服务器的主要操作系统是 VMWare ESXi 5。我们最初尝试了 5.0,后来又尝试了 5.1 版本。两者都是通过 PXE 引导和 kickstart 部署的。此外,我们正在测试裸机 Windows 和 Red Hat Linux 安装。
HP ProLiant 系统具有一套全面的 BIOS 选项。除了静态高性能配置文件之外,我们还尝试了默认设置。我已经禁用了启动启动画面,只是在那个点上有一个闪烁的光标,而不是上面的屏幕截图。我们还为 BIOS配置尝试了一些 VMWare “最佳实践”。我们已经看到来自 HP的建议,它似乎概述了一个类似的问题,但没有解决我们的具体问题。
怀疑是硬件问题,我让供应商发送了一个相同的系统,以便当天交货。除了磁盘之外,新服务器是完全相同的构建。我们将磁盘从旧服务器移动到新服务器。我们在更换硬件上遇到了同样的随机启动问题。
我现在让两台服务器并行运行。该问题在热靴上随机出现。冷靴似乎没有问题。我正在研究一些更深奥的 BIOS 设置,例如禁用 Turbo Boost 或完全禁用电源校准功能。我可以尝试这些,但它们不是必需的。
有什么想法吗?
- 编辑 -
系统详情:
-ie - 如何在命令行中获取硬件组件的完整列表(在没有窗口系统的机器上)
谢谢你。
我们有一个临时的服务器机房,里面有一个机架,里面有六台服务器和一些网络设备。房间由通向阁楼的双软管便携式空调装置冷却。此时便携式空调无法跟上产生的热量,温度在稳定之前上升到华氏 81 度左右。作为旁注,服务器当前直接安装在机架中的彼此顶部(没有空间)。
在我看来,在不安装更大空调的情况下降低房间温度的唯一方法是减少产生的热量。换句话说,我需要减少服务器的数量。
我的朋友争辩说,如果我们将服务器隔开,冷却效率会更高,并导致室温更低。
我想我的哥们不明白能量守恒定律。请帮助我们解决这个争议。
一个 500 瓦的电源总是能输出 500 瓦的功率吗?还是取决于放置在计算机上的负载?
这是一个 n00b 硬件问题。我试图弄清楚在不购买实际测量功率使用情况的仪表的情况下运行我的计算机需要多少成本。
所以 - 我们有一个内部公司数据库,通常的东西:管理客户、电话、销售交易和客户协议/计划。
它是一个 Access 2000 前端和一个 SQL Server 2000 Standard 后端。单台服务器、双 Xeon 3.2GHz、2GB RAM、Windows Server 2003,整天获得大约 40% 的 CPU 负载,分布在操作系统 (HT) 可见的 4 个内核上。
后端数据库设计不佳,已经有机增长超过 10 年,由不那么熟练的人员维护。它被严重规范化,一些明显的问题包括具有数万行没有主键或索引的表,这些表也大量用于系统中一些最常用部分的多表连接(例如呼叫管理器应用程序,每天在每个人的第二台显示器上运行 8 小时,每隔几秒钟运行一次低效的大查询)。
前端也好不到哪里去,它是典型的由数百个表单、嵌套保存的查询、VBA 代码中编写不当的嵌入式 SQL、数十个“怪癖”等组成的典型混乱,并且每当进行更改时,一些无关的东西似乎都会中断。我们已经确定了一个运行“足够好”的 MDB,现在有一个不变的政策,因为我们内部没有 Access 重量级人物(也没有计划雇用一个)。
公司现在正在缓慢增长,增加客户、呼叫等数量,同时并发用户数量适度增加,最近性能明显变差(等待在表单之间移动,等待列表填充等) )
Perfmon 说:
SQL Server 的探查器每分钟看到数十万个查询。客户端上的 CPU 使用率几乎为零,表明它正在等待服务器端查询执行。我已经通过 DB Engine Tuning Advisor 处理了这个工作负载,并将其建议应用于测试备份,但这并没有产生太大的不同。
顺便说一下,我们有 100MB 和千兆以太网的混合,都在一个子网上,两层楼有 40 个用户。
对问题。
在我看来,我们有两种选择来解决/改善这种情况。
我们可以用比更换软件低一个数量级的成本来构建具有疯狂性能数字的 Intel i7 系统。
当最终开发出一个新系统时,它可以托管在这个盒子上,因此不会浪费硬件。一个新的 CRM 系统不断被推迟、关闭、关闭——我认为这种情况至少在一年内不会发生。
对这种情况的任何想法,特别是如果您亲自来过这里,将不胜感激。
谢谢
我记得使用命令行工具闪烁 NIC 的链接指示灯以识别它。我一生都记不起那是什么。
hardware ×10
datacenter ×2
linux ×2
networking ×2
server-room ×2
centos ×1
cooling ×1
hp ×1
hp-proliant ×1
nic ×1
redundancy ×1
sql-server ×1
storage ×1
ups ×1