通信人家园
标题:
DSLAM间断性网管中断故障处理
[查看完整版帖子]
[打印本页]
时间:
2015-2-15 10:55
作者:
cy03ywf
标题:
DSLAM间断性网管中断故障处理
DSLAM
间断性网管中断故障处理
摘
要:
1.
故障描述
图
1.
网络拓扑图
如图
1
所示,核心路由器
T1200
、核心交换机
8912
、汇聚交换机
5928
、接入
DSLAM9210/8220
形成三层网络,通过
what's up
网管软件远程监控以上在网设备,设备的网管地址采用单独私网地址
172.16
段,
vlan
为
2000
,
DSLAM
下接
PPPOE
用户分公网地址。在网管软件的监控视图中,汇聚交换机、接入
DSLAM
时常出现网管中断的情况,如下图所示:
持续中断时间
10
分钟左右,然后恢复,再过一段时间有出现此状况。远程配置设备过程中出现时常中断,该问题已经严重影响到网络监护,亟待网络维护人员查找原因。
2.
故障分析
首先进入出现网管中断的交换机查看相应配置,是否有告警信息。
在核心交换机
8912
中出现以下告警:
在中心站交换机
5928
中出现以下告警:
在二站交换机
5928
中出现以下告警:
通过以上告警信息,发现
vlan2000
中出现地址冲突和地址漂移,
2000
正是网络的网管
vlan
,因此造成部分网络设备管理时通时断。出现以上告警信息,初步分析是网络出现环路或是下挂用户中毒,造成
ARP
攻击。但由于中兴
DSLAM
设备端口在数据转发时是隔离的即便部分用户中毒,也不会对其他端口造成影响。故网络中出现环路可能性教大。
中兴交换机
8912
和
5928
支持单端口环回检测,此功能能够检测到交换机下接用户或者交换机上的环回,从而对端口进行处理,避免因下面用户或者设备的环回导致交换机广播风暴等异常。由于在
8912
和
5928
上均出现地址冲突的告警信息,本着从上到下,从核心到接入的问题查找原则,现在核心交换机
8912
上对下挂
5928
设备的端口进行检测,同时配置端口基于
vlan2000
的环回检测。由于交换机默认在检测到端口环回时关闭相应端口,这样会造成端口其他业务中断,如果此端口是该设备仅有的上联端口,远程网管也将中断,因此需将端口
protect
属性改为
disable,
即交换机检测到环回,但不对此端口做任何操作。
通过在
8912
上做环回检测,得到一下结果:
由以上告警信息可得,在
gei_2/10
端口存在环回,该端口下联二站
5928
汇聚交换机,故环回应在
5928
或其下挂设备。于是在
5928
做端口环回检测,得到以下结果:
由以上信息显示,在二站
5928
汇聚交换机
gei_1/3
检测到又换回。
3.
解决方法
二站
5928
配置,发现端口
3
和端口
4
做了链路聚合,下联
DSLAM8220
,用于提高
8220
的上联带宽。查看
8220
配置,相应上联的两个端口并没有加入聚合组,遂造成链路环路,通过将
5928
的端口
3
关闭,即相应的链路聚合组不成立,端口环路取消,网管
vlan
不在出现地址冲突,网管冲突时通时断现象消失。
4.
经验总结
在怀疑出现端口环回时,可以使用交换机内的端口环回检测功能进行自检,检测应从上到下,逐级检测,这样才能缩小范围,提高发现问题的效率,在有业务运行的端口上做环回检测时,尽量使用端口保护属性,这样一旦交换机检测到有环回出现时,不会关闭端口,只会出现相应告警,保证其他业务和远程网管的畅通。
时间:
2015-2-15 11:05
作者:
原汁原味
好资料
时间:
2015-2-15 14:51
作者:
原汁原味
通信人家园 (https://www.txrjy.com/)
Powered by C114