最严重的系统管理员事故

War*_*ica 8 untagged

根据关于最佳系统管理员事故的问题,您参与过的最严重的事故是什么?与上一个问题不同,我的意思是“最坏”,即大多数系统损坏或对人的实际伤害。

我将从我的开始:

我们在 100 英尺长的走廊尽头有两个远程配线间,走廊的地板上有一个金属格栅。在我们安装了 Cat6 电缆后,承包商清理了所有通过格栅掉落到 3 英尺以下混凝土的碎屑。有一天,我和一位同事走进走廊检查进度,但心烦意乱,没有注意到一块格栅被移到了一边。我的伙伴踏入空中,他的胸膛撞在了钢制横梁上。他浑身酸痛,需要休息几天,但幸运的是,钢梁的边缘是圆润的,而且开口的大小让他没有撞到头或下面的地板。

显然,我们了解到地板被部分移除的区域需要标记。

Mar*_*son 25

当我在 Cisco 工作时,我曾经遇到过购买 30 美元无线网卡并且在驱动程序无法安装时吐出芯片的客户,或者那些拥有 Cisco 最便宜的最基本路由器的人,他们会为支持问题大喊大叫。

有一天,当我接到世界上最大的信用卡提供商之一(想想美国运通卡、万事达卡、维萨卡、大莱卡……实际上它是这些品牌之一,我不知道他们是否我很感激我提到它)。我是前线支持人员,我唯一的工作是评估场景,对其进行评级,然后将其提交给适当的支持部门。这个案例是我处理过的唯一一个优先级案例。

卡公司的一名员工打电话说,他们在美国东西海岸的大型机之间的链接已经中断。如果帐户是在一台大型机上创建的,则事务始终在该大型机上进行处理。如果您最近的链接始终靠近该大型机,那很好。但是在这一天,如果您在东海岸服务器上有一个帐户,但您在西海岸,则交易将因链接断开而被拒绝。

评估损害时的标准问题是“这对您的业务造成了多少损失?” 回复平静而镇定,是“每 30 秒大约 100 万美元”。

下次当您想为 30 美元的无线网卡咆哮和向客户支持大喊大叫时,请真正将其置于上下文中。

(应该注意的是,思科在转移后的 5 分钟内就建立并运行了他的链接)

  • 这是我听过有人说“停止问愚蠢的问题并*现在*解决它”的最佳方式。尤其是技术支持。 (6认同)
  • 这可能是您听到的这个问题的唯一诚实答案! (3认同)

chm*_*eee 10

为 rm 或 mv 等命令别名添加“-i”选项以避免错误是很常见的。但这件事发生在我公司不久前。有人将此行放在其中一台服务器中 root 的 .bashrc 中。

alias rm='rm -i'
Run Code Online (Sandbox Code Playgroud)

然后它复制了该行并将 rm 替换为 mv ... 或者他认为:

alias rm='rm -i'
alias mv='rm -i'
Run Code Online (Sandbox Code Playgroud)

剩下的就是历史了:)

好吧,问题是当 mv'ing '你确定吗' 问题说的是 'remove' 而不是 'move' 但是...


ojb*_*ass 1

想象一下,如果您在安德鲁飓风期间(稍早于 24X7 热潮)居住在南佛罗里达州。您的所有服务器都被安全地锁在需要您佩戴徽章的建筑物中,而更安全的区域则需要额外扫描您的徽章。想象一下,一个白痴没有考虑到门上需要实际的把手。想象一下,一份价值 400 万美元的合同需要送货,最近的电力位于以北 230 英里处,天然气供应短缺,道路危险,而发电机的设计只能提供 48 小时的电力。如果你愿意的话,请嘲笑卡车后面的一群服务器,它们被困在米老鼠收费公路上,因缺少汽油而熄火。从后勤、系统管理员和运营的角度来看,这一切都没有理由说明这一切有多糟糕,如果你愿意的话,那就笑吧。最精彩的部分是聆听数百个 UPS 设备同时呼喊着为生命提供电力。

  • 呃,请不要误解这一点,但我不知道故事中到底发生了什么,因为所有的“笑如果”...... (17认同)