我相信我们中的许多人已经习惯(或经历过)必须重新启动(或重启)电缆调制解调器、dsl 调制解调器、路由器或集线器/交换机的例行程序(或至少偶尔需要)。
但是,我决定在这里发帖以回应我刚刚遇到的一个最近普遍存在的问题。我们在几座建筑物中有许多网络机柜。
他们中的大多数都有管理的、高质量的交换机——千兆位、建筑物之间的光纤,有时是壁橱之间的。
上周末,我们遇到了某种电源故障。然而,故障只发生在一座建筑物上,而不是所有位置。
在那之后,有很多网络问题。打印机问题、连接中断等。穿过所有的建筑物。
似乎所有“高质量”管理的网络设备都很好。但是,在某些领域,我们有一些消费级 - 非托管 - 交换机。例如,一个只有 1 个网络分支但需要多个连接的大型办公室。我们现在已经逐渐转向所有这些开关(由于用户呼叫有问题)并重新启动它们。这解决了用户的问题。开关通常看起来很正常。其中一些所有的灯都亮着(当它们不应该亮时)。
那么为什么所有这些开关都会开始出现故障呢?某种伪造的路由数据从电源故障击中的交换机中推出?
我将在这方面援引奥卡姆剃刀。虽然我想这可能是一些特定的恶意数据包(S)可能会导致你的成本更低切换到落入你描述我认为这是一个不太可能引发的故障模式。您描述为有问题的交换机(小型非托管交换机)不太可能具有生成树实现,更不用说支持第 3 层交换和动态路由协议了。这种类型的交换机应该对其交换的帧的实际内容“视而不见”,而不仅仅是使用源和目标 MAC 地址来做出交换决定。
这让我相信你的权力问题比你意识到的更广泛。
考虑到电源问题,我会说您在使用低成本开关时遇到了问题,因为它们很可能是低质量的开关。我知道这听起来很陈词滥调,但这就是我在整个职业生涯中使用网络设备的经验(极少数例外)。你通常会得到你所支付的(而且,虽然有些东西可能定价不正确,但市场很快就会把它整理出来)。
成本较高的开关通常具有更好的电源,当暴露于“故障”公用电源时,它更有可能在容差范围内运行。我怀疑当公用电源超出规格时,您的低成本交换机中的电源可能开始输出不良电源。在这一点上,开关的“大脑”的某些部分最终出现了“这不应该发生”的情况,因为一个或多个电源轨漂移得太远超出了容许范围。
以太网交换机通常不是运行整个节目的单个 ASIC,而是通常由一组 ASIC 系统组成,这些系统执行不同的工作,相互连接。在不了解相关交换机的架构的情况下,很难说出任何确定的内容。多年前,我曾使用过一种交换机模型,该模型使用单个 ASIC 来运行一组 4 个端口。某些类型的故障会导致交换机上的 4 个端口组“脱落”,而交换机的其余部分则保持正常运行。根据我的经验,开关的部分故障并不异常。
例如,在您出现故障的情况下,处理保持灯亮的开关部件保持正常运行。物理接口硬件(PHY)可能一直运行得很好(因为您可能会看到连接远端的“灯”熄灭)。然而,其他一些事情并没有继续正常工作,您最终发现缺乏连接。在我“幸运”到足以捕捉到像这样失败的“行为”中的开关的情况下,我将我的笔记本电脑插入“问题”端口并观察(使用 Wireshark)一个完全“黑暗”的网络,没有任何广播数据包或其他通常与典型“工作网络”相关联的“噪音”。传输到这些端口的数据包从未出现在网络的其他地方——它们只是掉进了一个“黑洞”。我打赌你会在你的情况下看到类似的东西。
可能是托管交换机可以“处理”的一些 CRC/Jabber/STP/广播错误。消费级的无法处理如此崩溃的数据。
很可能这与此无关,而厚颜无耻的用户已经找到了一种使您的网络崩溃的方法!
| 归档时间: |
|
| 查看次数: |
15210 次 |
| 最近记录: |