似乎大多数 mmorpg 游戏都有一些定期的服务器维护,有些是每天,有些是每周一次。他们实际上必须做什么,为什么有必要?
如果你从这样一个项目开始,你能做些什么来避免这种情况?
我们有一些数据库的索引碎片 > 95%。尽我所知,索引从未重建过,更不用说重新组织了。多年。
(公平地说,这些表似乎确实启用了自动更新的统计信息。同样,公平地说,他对备份很勤奋:每天完整,每小时 trx 日志。)
当我问起时,DBA 说他不愿意重建或重组索引。当我问为什么时,他说不上来。最后他说他担心潜在的数据丢失。例如,我们的 Great Plains Dynamics 会计应用程序使用了其中一个数据库,他似乎对此非常焦虑。
我不是 DBA,但从我所读到的内容来看,他的焦虑似乎……我很难理解。
我不确定下一步该怎么做。建议我应该如何进行?
有几台服务器,它们已经两年没有进行碎片整理了。在碎片整理之前应该碎片化的百分比是否有标准?
服务器是 Windows 2003。
如果您想拥有一个非特定国家/地区的英文网站,运行维护的最佳时间是/是什么时候?您还可以通过指定运行维护最糟糕的时间来回答,因为其他一切都是“更好”的。我的网站将更倾向于休闲而非商务。
除了在“内部”设备(管理、编程、网络配置)中完成的工作之外,还存在物理设备和房间。这种物理房间设备也需要日常护理和喂养。
那么问题来了,对于一个有服务器、机架、网络设备等的通用数据中心(插入服务器机房、通信机房等),机房本身应该做哪些日常维护?
这是我在SF上问的第一个问题,所以要温柔的孩子。
随着我的台式机(大约 110 台左右)开始老化以及我的用户抵制 Windows 8,我开始注意到一个奇怪的趋势。我们主要是一家惠普商店。所以我遇到问题的台式机是 DX2200 和 DX2300 系列商务台式机。(是的,我知道它们很旧,但它们仍然可以用于我的用户使用这些机器的目的。)某些机器的用户抱怨机器声音很大和/或“赛车”。而且它们打开 Outlook 和 IE 等应用程序似乎非常缓慢。起初,我继续寻找病毒,但没有找到任何病毒,也找不到消耗资源的任务,这让我很困惑。Task man 显示 CPU 使用率很低,但风扇已经用完了。
为了解决这个问题,我从主板上拆下了散热器和风扇组件。我发现许多这些机器上的散热器化合物似乎已经变干了。我会把这种化合物描述为片状而不是光滑和粘糊糊的。这个问题的解决方法非常简单。只需按照制造商的建议清洁并重新涂抹一些糊剂。在过去的几周里,我在五个桌面上发生了这种情况。奇怪的巧合还是只是最终注意到这一点?谁知道。这解决了所有 5 台机器中 CPU 的问题。
虽然我从未认为这是一个问题,但现在我突然开始怀疑这是否是我的设施所独有的。我们是一家商业印刷厂,大楼内有化学品和溶剂。或者,这仅仅是对老化设备的维护问题。我倾向于相信这是一个“旧机器”问题。
我通常会从我正在工作的任何机器上取下盖子,只是为了物理检查风扇和散热器,但我现在已经添加了拉 CPU 散热器并重新涂抹化合物到工作台上完成的任何系统工作。
是否还有其他人在使用 HP 台式机/服务器时遇到相同或类似的问题?
在更新方面,固件很少受到关注。眼不见,心不烦。
许多设备:RAID 控制器、NIC、芯片组,甚至硬盘驱动器,都从更新中获益。更好的功能、安全/错误修复等。
大多数 SA 说,“只要它坏了,就更新固件。” 但这可能会导致未来的困难;有几次,当就硬盘驱动器故障与戴尔联系时,我被问到我的硬盘驱动器固件是否是最新的。我所有的服务器都使用某种类型的 RAID 配置。如果我已经有一个驱动器出现故障,我是否应该考虑尝试升级其余驱动器或 RAID 控制器上的固件?我会说不。但戴尔似乎有不同的看法。
(我知道戴尔有一个很好的实用程序,称为Server Update Utility,它可以检查任何戴尔服务器上的所有新固件。)
我在 600G 数据文件上运行 SHRINK 文件。
目前,状态报告为“暂停”,并sys.dm_exec_requests.percent_complete为DbccFilesCompact命令会报告它正在运行(但很慢)
有没有办法检查它为什么被暂停以及如何使它运行更顺畅?
仅供参考- 检查状态的 SQL 查询
select T.text, R.Status, R.Command, DatabaseName = db_name(R.database_id)
, R.cpu_time, R.total_elapsed_time, R.percent_complete
from sys.dm_exec_requests R
cross apply sys.dm_exec_sql_text(R.sql_handle) T
order by Command
Run Code Online (Sandbox Code Playgroud) 我的服务器运行良好,但已使用 5 年以上。他们仍然在完美地完成这项工作,升级服务器没有任何优势,我应该让它们永远运行还是应该安排维护以用新硬件更换服务器或其部分?我担心服务器故障可能会导致数据丢失和比计划维护更多的停机时间。这些服务器用于在线销售点、会计、CRM 和管理信息。
由于服务器位置偏远,无法进行预防性维护,例如更换风扇和吸尘。
还要记住故障率随时间变化的“浴缸曲线”。新硬件比已经烧了一段时间的硬件更容易出现故障。
你如何告诉一个对长期无故障的服务器非常满意的客户,他现在不得不花钱更换它,因为它太旧了?
最后,有没有可以远程运行的电压、温度、风扇转速等硬件问题的监控工具?
我负责维护大约 25 台装有各种版本 Windows(Vista、7、8)的 PC。
我在想以下几点:
你推荐什么样的时间表?
使用什么样的软件工具?理想情况下,我希望尽可能多地自动化。
我还应该做什么?
更新:
感谢到目前为止所有出色的答案,不备份/备份单个机器的图像的建议在我的情况下并没有真正起作用。
许可成本高得令人望而却步,因为公司中的不同角色至少有 5 种不同的软件配置——财务、销售、管理、生产(这里仅 3 种类型),并且为每个人都拥有许可证是没有意义的.
此外,为了与我们的一些客户兼容,我们必须保留一些旧版本的软件 - 安装盘(带有许可证密钥)在我之前已经丢失或掩埋了。
maintenance ×10
sql-server ×2
windows ×2
datacenter ×1
dbcc ×1
firmware ×1
hardware ×1
hp ×1
monitoring ×1
patch ×1
update ×1
website ×1