通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  新兵

注册:2010-7-241
跳转到指定楼层
1#
发表于 2015-2-15 10:55:32 |只看该作者 |倒序浏览
DSLAM间断性网管中断故障处理
要:1.     故障描述
                         1. 网络拓扑图
如图1所示,核心路由器T1200、核心交换机8912、汇聚交换机5928、接入DSLAM9210/8220形成三层网络,通过what's up网管软件远程监控以上在网设备,设备的网管地址采用单独私网地址172.16段,vlan2000DSLAM下接PPPOE用户分公网地址。在网管软件的监控视图中,汇聚交换机、接入DSLAM 时常出现网管中断的情况,如下图所示:
持续中断时间10分钟左右,然后恢复,再过一段时间有出现此状况。远程配置设备过程中出现时常中断,该问题已经严重影响到网络监护,亟待网络维护人员查找原因。
2.     故障分析
首先进入出现网管中断的交换机查看相应配置,是否有告警信息。
在核心交换机8912中出现以下告警:


在中心站交换机5928中出现以下告警:


在二站交换机5928中出现以下告警:


通过以上告警信息,发现vlan2000中出现地址冲突和地址漂移,2000正是网络的网管vlan,因此造成部分网络设备管理时通时断。出现以上告警信息,初步分析是网络出现环路或是下挂用户中毒,造成ARP攻击。但由于中兴DSLAM设备端口在数据转发时是隔离的即便部分用户中毒,也不会对其他端口造成影响。故网络中出现环路可能性教大。
中兴交换机89125928支持单端口环回检测,此功能能够检测到交换机下接用户或者交换机上的环回,从而对端口进行处理,避免因下面用户或者设备的环回导致交换机广播风暴等异常。由于在89125928上均出现地址冲突的告警信息,本着从上到下,从核心到接入的问题查找原则,现在核心交换机8912上对下挂5928设备的端口进行检测,同时配置端口基于vlan2000的环回检测。由于交换机默认在检测到端口环回时关闭相应端口,这样会造成端口其他业务中断,如果此端口是该设备仅有的上联端口,远程网管也将中断,因此需将端口protect属性改为disable,即交换机检测到环回,但不对此端口做任何操作。
通过在8912上做环回检测,得到一下结果:


由以上告警信息可得,在gei_2/10端口存在环回,该端口下联二站5928汇聚交换机,故环回应在5928或其下挂设备。于是在5928做端口环回检测,得到以下结果:





由以上信息显示,在二站5928汇聚交换机gei_1/3检测到又换回。
3.     解决方法
   二站5928配置,发现端口3和端口4做了链路聚合,下联DSLAM8220,用于提高8220的上联带宽。查看8220配置,相应上联的两个端口并没有加入聚合组,遂造成链路环路,通过将5928的端口3关闭,即相应的链路聚合组不成立,端口环路取消,网管vlan不在出现地址冲突,网管冲突时通时断现象消失。
4.     经验总结
在怀疑出现端口环回时,可以使用交换机内的端口环回检测功能进行自检,检测应从上到下,逐级检测,这样才能缩小范围,提高发现问题的效率,在有业务运行的端口上做环回检测时,尽量使用端口保护属性,这样一旦交换机检测到有环回出现时,不会关闭端口,只会出现相应告警,保证其他业务和远程网管的畅通。

举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-7-20 11:18 , Processed in 0.858256 second(s), 17 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部