我使用的是 SuperMicro 服务器、AMI BIOS、金士顿 ECC 8g 注册 RAM 和 Intel X5690。
启动后,BMC响应:
Un-Correctable DRAM ECC Error Detected at CPU01/Channel01/DIMM0A
Press F1 to resume
--- ipmitools ----
2 | 06/24/2011 | 17:55:33 | Memory | Uncorrectable ECC | Asserted
5 | 06/28/2011 | 11:23:16 | Memory | Uncorrectable ECC | Asserted
------------
Run Code Online (Sandbox Code Playgroud)
这种情况只发生了 2 次,但重启 20 次后就再也没有出现过。
请指教。
我有一台服务器,它时不时地向操作系统报告硬件错误,但在其他方面运行时没有任何明显的问题。
谁能告诉我这是什么意思?这是我需要担心的事情吗?是否有我可以更深入查看的日志文件?几周前,我注意到系统未检测到其中一根 RAM 棒,它仅报告 112 GB,而不是 128 GB。现在它显示正确了。
有关更多信息,该服务器具有以下主要组件:
我的 R720 配备 2 个 E5-2650 v2、8 个 8Gb单列RDIMM 和 8 个 8Gb双列 RDIMM。I\xc2\xb4m 不确定如何安装 DIMM 我\xc2\xb4ve 读到单列比双列更快,因此我是否应该将 8 个单列 Dimm 专用于 CPU 1,将其他 8 个双列专用于 CPU 2?或者我应该用 4 个单列和 4 个双列填充 CPU 1?
\n所以,我的任务是帮助购买 2U 服务器的主板/CPU/内存,这些服务器将被带到中国。要求是硬件以尽可能最好的价格可靠/稳定(阅读:持久)。如果它不是流血边缘也没关系。显然,他们那里已经有一个 2U 机箱,该机箱曾经有一个现在有散热问题的台式机主板。
不幸的是,我对负载情况并不了解。
我不太精通服务器硬件的复杂性,通常只会购买可靠的服务器并完成它,所以我真的不知道如何选择。在中国的那个人总体上似乎也不是很了解情况。他曾建议使用 Supermicro MBD-X8DTL-iF-O,但评论非常糟糕,并想为板载 RAID 购买主板。他显然想尝试RAID。
我目前正在考虑从 NewEgg 购买 Supermicro MBD-X8DTL-iF-O(299.99 美元)、2 个 Xeon 5506 CPU(460 美元)和 2x(3x2gb) Kingston ValueRam(ECC 无缓冲)(约 150 美元)。我看过华硕 Z8PE-D12X,但我看到有人不推荐华硕,并且对 PSU 兼容性有一些奇怪的抱怨。
tl;dr:请帮忙提出任何建议。事实上,我很乐意得到特定的型号来购买。2U 机箱的主板/CPU/RAM。
注意:如果确实存在显着的稳定性差异,则价格将不那么重要。支持无关紧要,因为该硬件将运往中国。
编辑:澄清了一些细节,将回过头来说服那些只购买服务器的人只是为了提供信息,如果我打算只购买这些部件来构建自己,我应该得到什么?
我们在 Window 2008 服务器上安装了 SQL 2008 R2 Enterprise。它有 24 GB 的 RAM。SQL 服务器在优化作业期间占用所有内存,并且在作业完成后不会释放它。唯一的解决方法是重新启动 SQL 服务.请告知如何解决此问题。
所以这是 2 到 3 个月内我的专用盒子第二次出现在某个未命名的主机上出现某种形状或形式的错误记忆。这是正常现象还是我的主机只是给我便宜的记忆棒?我怎样才能知道?
内存问题 1:
EDAC MC0: UE row 0, channel-a= 2 channel-b= 3 labels "-": (Branch=1 DRAM-Bank=7 RDWR=Write RAS=32679 CAS=0 FATAL Err=0x4 (>Tmid Thermal event with intelligent throttling disabled))
Run Code Online (Sandbox Code Playgroud)
内存问题 2:
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": (Branch=0 DRAM-Bank=0 RDWR=Read RAS=0 CAS=0, UE Err=0x2 (Aliased Uncorrectable Non-Mirrored Demand Data ECC))
Run Code Online (Sandbox Code Playgroud)
眼镜:
我正在寻找一种能够(远程)监视 Windows 服务器中的 CPU 和内存的工具,但最重要的是,哪个服务/进程正在使用它。
或者 - 是否可以监控特定的运行服务?
我们有一个定期冻结的服务器,我们试图在不使用本地调试器的情况下找到罪魁祸首。
如果监控软件附带一个代理,我们可以将其安装在远程客户端上以获得最大的准确性,那就太好了。
任何建议都非常感谢。
monitoring windows-server-2008 memory central-processing-unit service
我有一台 RHEL 3 机器,它是 VMWare 集群的一部分。
在 VMware mgr 中,我告诉机器有 24Gb 的 RAM
构建时它有 8 GB 的 RAM
查看 /proc/meminfo 我告诉
sudo yum install gcc 我收到以下错误Run Code Online (Sandbox Code Playgroud)Downloading Packages: Running rpm_check_debug Running Transaction Test memory alloc (8 bytes) returned NULL.
是的,我已将ulimit 首选项设置为“无限制”。
memory alloc (8 bytes) returned NULL..memory alloc (8 bytes) returned NULL.这很烦人。memory ×10
hardware ×2
bios ×1
centos ×1
dell ×1
ecc ×1
linux ×1
memory-leak ×1
monitoring ×1
node.js ×1
rackmount ×1
redhat ×1
redis ×1
service ×1
sql-server ×1
vmware-esxi ×1
yum ×1