系统管理员职位的乔尔测试

Nic*_*ias 142 untagged

基于“组织问题”——IT 痛点? 我认为可以公平地说,系统管理员需要确定一个地方是否值得工作。Joel 为程序员提供了一个类似的众所周知的测试

系统管理员在面试时应该问哪些 12 个问题,以帮助他们决定是否适合工作?

遵循乔尔的规则:

  1. 问题应该与平台和技术无关
  2. 问题应该引出一个简单的回答,例如是或否

编辑:请一次发布一个问题,以便我们了解用户投票的内容。

Osk*_*orn 101

您是否使用事件/票证跟踪系统?

  • 还有一个推论:它支持电子邮件和对话吗?我们在这里使用的系统会对您的问题回答“是”,但接近净损失。不可避免地会收到一份报告,而帮助台没有提出正确的问题。所以其他人进入并收集未记录的辅助信息,解决问题并且不努力记录任何这些。至少在一个临时的电子邮件线程中,您最终会得到引用的对话历史记录。 (11认同)

Bri*_*ian 80

您是否执行系统备份,并定期进行测试恢复?


Ave*_*yne 72

  • 在日常运营中,还有多少人会和我一起工作?

这会影响您以非常直接的方式进行表演的能力。它还会影响您享受不间断假期的能力...

  • 谁是问题的第一响应者?

这个答案会有所不同,但它很好地表明了组织如何实际“组织”。大型设置应该有一个帮助台和票务系统;小型设置至少应该有票务系统,以及某种公司付费的寻呼机寻求帮助。

“只有你”不是一个可接受的答案。这完全缺乏组织性,应该跟进一个“您如何跟踪来自用户的请求?”的问题。这必须用“你没有”以外的东西来回答。

  • 您现有系统与管理员的比例是多少?

这不应太高(高于 50:1)或太低(低于 5:1)。太高了,你的工作量会很严重,你会踩水来保持漂浮。太低了,你要么是一个人的商店,要么是商店管理系统的能力存在严重问题。

与往常一样,规则也有例外。可以从单一来源对 200 多个系统进行映像的实例(想想 Web 前端),以及业务非常小的实例(20 名员工可能只需要 2 台服务器)。

  • 您的最终用户/客户与管理员的比例是多少?

这是对预期的衡量。这些是您的“客户”。当出现问题时,这将是您解决问题所承受的“压力”。如果您的系统出现问题,那么只有 2 位管理员的 5000 人组织可能是一个非常非常紧张的地方。

  • 您的最终用户/客户与现有系统的比率是多少?

这是服务器工作负载的度量。非常高的比率可能是过度使用的迹象,或者在需要扩展时会束缚您的预算限制。在不需要时,未充分利用也可能是一个问题(即 HR 拥有自己的服务器是有道理的,但对于 5,000 人的组织中只有 5 个“常规”用户的文件服务器是一个危险信号);这可能需要一些“虚拟化”来整合服务器......

  • 是否有处理现有系统更新的现有流程,例如应用供应商补丁或固件更新?

这应该是除 (a) “我不知道”或 (b) “我们不更新”之外的任何其他答案。

  • 假设服务器着火了。如果发生危机或灾难,停机时间是可以接受的?

这应该始终是一个合理的问题。如果面试官在这个问题上表现得不自然,那么他们就不了解你的工作性质,这是关于未来前景的重要线索。如果期望是 24/7 全天候运行,那很好 - 除非他们没有相应的基础设施,这意味着您将经常照顾机器。了解什么是可接受的,什么是不可接受的,有助于向您展示他们的真实期望。

  • 说到火灾,您是否为您的设备安装了灭火系统,它的类型是否合适?

喷水器不是一个可接受的答案。这确实会发生,并且您得到一些组织,他们认为将架子塞进没有通风的扫帚壁橱里,头顶上一个消防喷头是个好主意。如果这被轻描淡写,被忽视或遭到敌意,请起身,感谢面试官,不要走路,跑...

  • 描述您的数据备份过程和使用的存储格式。

这是另一个问题,除了“我们没有”和“我们没有备份媒体”之外,还应该用其他任何东西来回答。

  • 您是否定期测试备份?多久测试一次?

以上问题的后续。如果您不定期进行测试,只会招来麻烦。

  • 对于资本支出和小额采购,是否有已知的预算和采购流程?你能向我解释一下我购买东西的过程吗?

如果答案是“我们(其他人)会根据需要购买它”,那就是危险信号。这意味着“我们不相信您会在您真正需要的时候购买设备,因此我们会让其他人代为购买”。 应该总是有某种预算。

购买东西的过程应该很容易在不到 2 分钟的时间内解释清楚。它不应该涉及超过 2 方的签字(数字越大表示繁文缛节),并且它应该有一个以天或小时为单位的周转时间,而不是几周(如果时间过长,关键采购将被搁置)。 应该总是有某种过程。

  • 您是否有更新和回收旧硬件的计划,它多久发生一次?

实际上,我曾见过一些公司在运行 18 年的小型机上运行,​​这些小型机通过支持合同和支持供应商提供的大量备件保持活力。当然,原来的硬件厂商早就离开了……

台式机设备的刷新速度不应快于 3 年或慢于 5 年。在预算紧张的企业中,将台式机延长至 5 年有时是合适的答案。

关于回收的位是一个测试,看看他们是否对旧硬件有“一次性”的态度。从某种意义上说,您应该通过已知的回收商正确处理它是不好的,但从某种意义上说,如果需要,您可以将旧硬件按临时任务进行处理。它还可以让您了解他们的“墓地”(保留在周围的旧硬件堆)的大小。

相关问题:

https://serverfault.com/questions/44638/how-often-does-tech-refresh-happen

  • 不错的综合回复。“刷新和回收”也是询问服务器的一种乐趣;您不想进入一家大部分时间都在护理古老服务器上的商店,对吗? (5认同)

Osk*_*orn 49

您是否有灾难恢复计划,其中是否包括 IT?

精彩评论的后续行动:如果是,是否包括整个组织,而不仅仅是 IT?它是否包括人员,您是否定期对其进行测试?

相关问题:

灾难恢复计划制定最佳实践或资源?

  • 他们是否意识到 DR 不仅仅是 IT 问题?很多地方只从 IT 的角度认真考虑 DR,并且没有他们的纸质文件的计划。 (4认同)
  • 回答“是的,我们完全投保”不是一个有效的答案。 (4认同)
  • 你定期测试吗? (4认同)

JFV*_*JFV 40

是否记录了当前环境?

政策和程序是否记录在案并保持一致?


cha*_*aos 37

内部会计实践是否评估了 IT 向其他部门提供的服务的价值,还是只是将 IT 视为成本中心?

(这与 Stick 的“IT 是贵组织的优先事项还是必要的邪恶?”几乎相同的问题,但措辞是为了可能引出诚实的答案,而不是公然传达的正确谎言。)

  • 是的。恐怕您需要管理人员来指定确切的问题。无法用 68K 机器语言破解至强,也无法用英语破解经理的大脑。 (9认同)

小智 36

我认为必须具备的一件事是具有与实时服务器相同的硬件规格的测试机。

“您的测试环境与生产环境的匹配程度如何?”

  • 以类似的方式,我认为其中一个问题应该是“您是否有独立的开发、阶段和生产系统以及变更控制流程?” (27认同)

小智 34

我觉得很有趣,很多答案都写着“你有这个吗?” 或者“你经常这样做吗?” 如果我要被聘为新的系统管理员,我希望能够实现这些东西,如果它们还不存在的话。灾难恢复和监控日志不会影响面试的成败。如果他们不做这些事情,他们就会在我被录用之后。

正如我之前提到的,我主要关心的是来自上面的支持。如果我说我们需要更换服务器,我想从怀疑中受益。或者,如果我实施了令人讨厌的安全策略,我不希望合作伙伴对抱怨的人给予豁免权,这样他们就可以看起来像个有爱心的好老板。

系统管理员在公司结构的层次结构中处于一个奇怪的位置。有时,他们根据最入门级人员的需求来确定方向和优先级,有时他们会向管理层指示政策。我们同时处于链条的最底层和最顶端。

我愿意在底层扮演替罪羊和苦工的角色,只要管理层在我处于顶层的情况下屈服于我的建议。

  • “如果他们不做这些事情,他们就会在我被录用之后。” 如果你有能力_说服_管理,他们应该根据你的需要改变,我印象深刻。 (3认同)

Osk*_*orn 33

所有新系统/软件/应用程序的购买是否都经过 IT 部门,IT 部门是否有权拒绝并建议另一个系统,也许是另一个部门已经在使用的系统?

  • 这是一个有趣的问题,因为它可能是消极的,也可能是积极的——一个 IT 部门对 IT 部门的权力比支持业务更感兴趣,这可能是一个非常消极的环境。 (5认同)
  • 同样,我有点依赖 IT 为任务选择最佳系统 - 但我见过太多例子,其中三个不同的办公室(同一部门)试图购买不同的系统,例如销售/客户支持或电子钥匙 - 只是因为每个当地经销商都有很小的价格优势......他们没有意识到集中运行和负责所有这些不同系统的 IT 运营成本与实际运行同一个神相比是巨大的该死的系统适用于每个人,并获得掌握它的人的协同效应。 (3认同)
  • ...和软件(或简单的系统)标准化^^ (2认同)
  • 这与断电无关,而是关于拥有可管理的硬件标准。这个绝对不是可选的。 (2认同)

Jef*_*rey 32

您是否愿意花钱购买合适的监控/日志工具?

- 或者,来自最初的乔尔测试问题:

您是否使用金钱可以买到的最好的工具?

相关问题:

服务器健康监控软件

  • 我建议不要将其表述为“愿意花钱”,而是将其表述为“您是否使用(或促进使用)适当的监控日志记录工具”,因为监控一些最好的工具是免费的。Nagios、MRTG、仙人掌等 (11认同)
  • 甚至可能是诸如“您知道服务器是否发生故障吗?”这样简单的事情。 (4认同)
  • 一些最好的根本不是免费的 - 取决于被监控的环境...... (3认同)
  • 哦,乔尔表达这个类似概念的方式是“你使用金钱可以买到的最好的工具吗?” 这几乎适用于任何可以想象的职业。 (3认同)
  • 我将其保留为“愿意花钱”,因为像 nagios 这样的“免费”解决方案通常比开箱即用的解决方案贵很多,而不是国会大厦花费管理时间 - 这等同于金钱(希望如此)。“承诺资源”可能是管理说“我们当然愿意投入您的时间来解决我们的监控问题以及您是我们的系统管理员” (2认同)

小智 31

我可以和你以前的系统管理员谈谈吗?


Max*_*mus 26

您是否使用通用管理员/root 帐户登录?

在一堆“是”中间抛出“不”的答案总是很有趣。


jha*_*yes 23

IT 部门有自己的预算吗?

我的没有,我们依赖其他部门的资金来满足我们的需求。糟透了。


小智 21

您是否在异地存储备份副本?


小智 18

我是否可以获得继续接受培训和教育的津贴,您是否允许我购买材料以了解安全问题的最新情况?

无论多么不受欢迎,你都会支持我对员工的政策和程序决定吗?


Luk*_*uke 17

我要指出的是,对于我们这些喜欢为初创公司或早期公司工作的人来说,大多数人的答案很可能是“不,但是……”。该声明之后的内容通常非常有用。


Jef*_*tes 16

  • 你有配置更改控制吗?
  • 你们有数据恢复政策吗?
  • 您是否执行每日备份?
  • 你有问题数据库吗?

更新

  • 你有内置冗余吗?
  • 你有金钱可以买到的最好的硬件吗?
  • 您可以一步设置一台新的笔记本电脑或台式机吗?
  • 您是否制定了定期打补丁的政策?


小智 16

IT 是您组织的优先事项还是必要的邪恶?

  • 在大多数公司中,我认为 IT 被视为一种费用而不是价值。 (3认同)

小智 13

咖啡机在哪里?


cse*_*ton 12

你使用版本控制吗?你把什么置于版本控制之下?


小智 11

你的系统管理员会写代码吗?

  • 可能更好地表述为“您的管理员是否分配了时间来自动化日常活动?” (5认同)

Kar*_*fia 10

您是否为关键系统制定了响应时间策略/阈值?(或者有什么更好的说法,“你是否已经熟悉什么应该和不应该让我在凌晨 3 点起床的概念?”)


Kyl*_*yle 10

你有集中式日志记录吗?有人读过它们吗?


Jas*_*Tan 9

我是唯一的系统管理员吗?成为唯一的系统管理员可能很好 - 事实上这可能很有趣,但前提是企业理解给我们带来的影响:

你有SLA吗?

  • 如果第一个问题的答案是“是”,那么接下来的问题是“谁会在假期/生病期间代我填写?” - 然后你想在做出决定之前见到那个人。如果没人,就往山上跑。 (12认同)

小智 9

您可以一步添加新用户吗?

向:您能一步完成构建吗?


wcm*_*wcm 8

问他们,当他们说系统管理员时,他们是否真的指的是 SA、DBA、Net Admin、Apache/IIS Admin、Email Admin、AD Admin 和桌面疑难解答。


Osk*_*orn 8

您能判断在任何给定时间哪些系统缺少哪些补丁吗?


小智 8

您是否使用 Puppet 或 Chef 之类的配置管理系统?


JJ0*_*J01 7

你使用补丁/变更管理吗?

您是否执行每月/每年的灾难恢复测试?

IT 是否负责并通过系统正常运行时间和票证来衡量?

您是否对所有 IT 部门使用集中式工单管理?

员工可以在办公桌前打扰 IT 员工吗?

您的 IT 员工是否参与了为业务线创建解决方案的工作,或者他们只是遵循高层管理人员的指示?


sys*_*138 5

即使在接近生命周期结束时,您是否仍保持关键硬件和软件平台的许可和支持?


Osk*_*orn 5

您是否衡量服务可用性,并且是否从管理层商定了每项服务所需的阈值?


Osk*_*orn 5

您如何知道需要注意的事情何时发生?


小智 5

  • 预算中是否有资金用于培训和/或参加会议?

  • 我是否需要随叫随到?

  • 您使用开源软件还是专有软件?为什么或者为什么不?

  • 为什么之前担任这个职位的人离开了?

  • 如果我休假,会有人承担我的责任吗?


小智 5

我是否有权为违反政策的用户禁用系统帐户?这会告诉您他们是否有计算机使用政策,以及谁(如果有的话)负责执行该政策。


Mar*_* M. 5

你有免费的咖啡/茶吗?

我知道这并不完全是技术性的,没有一些好东西是一个强烈暗示,在这种环境中,无论他们在技术上拥有多少火箭科学,我都可能不想工作。


Ziz*_*ncs 5

你有紧急情况的书面定义吗?


Jos*_*ern 5

你的网络地图在哪里?

(如果他们没有,这表明许多其他事情没有记录)