排查步骤1:电源故障
由于外部供电不稳定,电源线路老化或者雷击等原因导致电源损坏或者风扇停转,以致不能正常工作。或者由于电源缘故导致机内其他部件的损坏都会使工业交换机出现问题。如果工业交换机面板上的POWER指示灯是绿色的,就表示是正常的;如果该指示灯灭了,则说明工业交换机没有正常供电。这类问题很容易发现,也很容易解决,同时也是容易预防的。针对这类故障,首先应该做好外部电源的供应工作,一般通过引入独立的电力线来提供独立的电源,并添加稳压器来避免瞬间高压或低压现象。如果条件允许,可以添加UPS(不间断电源)来保证工业交换机的正常供电,有的UPS提供稳压功能,而有的没有,选择时要注意。在机房内设置专业的避雷措施,来避免雷电对工业交换机的伤害。现在有很多做避雷工程的专业公司,实施网络布线时可以考虑。
排查步骤2:端口故障
这是常见的硬件故障,无论是光纤接口还是双绞线的RJ-45接口,在插拔接头时一定要小心。如果不小心把光纤插头弄脏,可能导致光纤接口污染而不能正常通信。我们经常看到很多人喜欢带电插拔接头,理论上讲是可以的,但是这样也无意中增加了接口的故障发生率。在搬运时不小心,也可能导致接口物理损坏。如果购买的水晶头尺寸偏大,插入工业交换机时,也容易破坏接口。此外,如果接在接口上的双绞线有一段暴露在室外,万一这根电缆被雷电击中,就会导致所连工业交换机接口被击坏,或者造成更加不可预料的损伤。一般情况下,接口故障是某一个或者几个接口损坏。所以,在排除了接口所连计算机的故障后,可以通过更换所连接口,来判断其是否损坏。遇到此类故障,可以在电源关闭后,用酒精棉球清洗端口。如果接口确实被损坏,那就只能更换接口了。
排查步骤3:模块故障
工业交换机是由很多模块组成,比如:堆叠模块、管理模块(也叫控制模块)、扩展模块等。这些模块发生故障的几率很小,不过一旦出现问题,就会遭受巨大的经济损失。如果插拔模块时不小心,或者搬运交换机时受到碰撞,或者电源不稳定等情况,都可能导致此类故障的发生。当然上面提到的这3个模块都有外部接口,比较容易辨认,有的还可以通过模块上的指示灯来辨别故障。比如:堆叠模块上有一个扁平的梯形端口,或者有的交换机上是一个类似于USB的接口。管理模块上有一个CONSOLE口,用于和网管计算机建立连接,方便管理。如果扩展模块是光纤连接的话,会有一对光纤接口。在排除此类故障时,首先确保交换机及模块的电源正常供应,然后检查各个模块是否插在正确的位置上,后检查连接模块的线缆是否正常。在连接管理模块时,还要考虑它是否采用规定的连接速率,是否有奇偶校验,是否有数据流控制等因素。连接扩展模块时,需要检查是否匹配通信模式,比如:使用全双工模式还是半双工模式。当然如果确认模块有故障,解决的方法只有一个,那就是应当立即联系供应商进行更换。
排查步骤4:背板故障
工业交换机的各个模块都是接插在背板上的。如果环境潮湿,电路板受潮短路,或者元器件因高温、雷击等因素而受损都会造成电路板不能正常工作。比如:散热性能不好或环境温度太高导致机内温度升高,致使元器件烧坏。在外部电源正常供电的情况下,如果交换机的各个内部模块都不能正常工作,那就可能是背板坏了,遇到这种情况即使是电器维修工程师,恐怕也无计可施,唯 一的办法就是更换背板了。
排查步骤5:外部因素
由于病毒或者黑客攻击等情况的存在,有可能某台主机向所连接的端口发送大量不符合封装规则的数据包,造成工业交换机处理器过分繁忙,致使数据包来不及转发,进而导致缓冲区溢出产生丢包现象。还有一种情况就是广播风暴,它不仅会占用大量的网络带宽,而且还将占用大量的CPU处理时间。网络如果长时间被大量广播数据包所占用,正常的点对通信就无法正常进行,网络速度就会变慢或者瘫痪。一块网卡或者一个端口发生故障,都有可能引发广播风暴。由于工业交换机只能分割冲突域,而不能分割广播域(在没有划分VLAN 的情况下),所以当广播包的数量占到通信总量的30%时,网络的传输效率就会明显下降。
排查步骤6:配置不当
初学者对工业交换机不熟悉,或者由于各种工业交换机配置不一样,管理员往往在配置工业交换机时会出现配置错误。比如VLAN 划分不正确导致网络不通,端口被错误地关闭,工业交换机和网卡的模式配置不匹配等原因。这类故障有时很难发现,需要一定的经验积累。如果不能确保用户的配置有问题,请先恢复出厂默认配置,然后再一步一步地配置。在配置之前,先阅读说明书,这也是网管所要养成的习惯之一。每台工业交换机都有详细的安装手册、用户手册,深入到每类模块都有详细的讲解。
排查步骤7:系统错误
工业交换机系统是硬件和软件的结合体。在工业交换机内部有一个可刷新的只读存储器,它保存的是这台工业交换机所必需的软件系统。这类错误也和我们常见的Windows、Linux一样,由于当时设计的原因,存在一些漏洞,在条件合适时,会导致工业交换机满载、丢包、错包等情况的发生。所以工业交换机系统提供了诸如Web、FTP等方式来下载并更新系统。当然在升级系统时,也有可能发生错误。对于此类问题,我们需要养成经常浏览设备厂商网站的习惯,如果有新的系统推出或者新的补丁,请及时更新。
排查步骤8:线缆故障
其实这类故障从理论上讲,不属于工业交换机本身的故障,但在实际使用中,电缆故障经常导致工业交换机系统或端口不能正常工作,所以这里也把这类故障归入工业交换机硬件故障。比如接头接插不紧,线缆制作时顺序排列错误或者不规范,线缆连接时应该用交叉线却使用了直连线,光缆中的两根光纤交错连接,错误的线路连接导致网络环路等。
收起