通信人家园

标题: 单板接口中查询到CRC错和FCS错问题定位指导  [查看完整版帖子] [打印本页]

时间:  2015-3-9 11:17
作者: sunlywu     标题: 单板接口中查询到CRC错和FCS错问题定位指导

单板接口中查询到CRC错和FCS错问题定位指导
这种问题目前已知的有四种情况,分别如下:
1、在主控板LSW端口下查询统计有FCS错,
MA5600T(config)#diagnose
MA5600T(diagnose)%%debugging lswdrv bcm-cli
BCM.0> show c xe18
fcs
IRFCS.xe11      :           325,328,735        +325,328,735              39/s

   2、在单板透明通道中查询tm dis st pt统计时在DISCARD中有下行持续的CRC错误
MA5680T(su)%%tm dis st pt
=============== FORWARD ========================================================
Upstream:

ARP frame                                                    [008]: 00000002
Recv un****** frame from CPU                                 [096]: 00000024

Dnstream:
ARP frame                                                    [008]: 00000001
LCP_Echo_reply frame                                         [019]: 00000006
Recv correct frame from GE                                   [064]: 00050599

=============== DISCARD ========================================================
Upstream:

Dnstream:
Recv frame with error CRC from GE                            [065]: 00000064

=============== TOCPU ==========================================================

3、在单板中有持续较多的TM INT打印
TM INT: XAUI0 UP, XAUI1 UP ...
interrupt:
TM INT: XAUI0 UP, XAUI1 UP ...
interrupt:
TM INT: XAUI0 UP, XAUI1 UP ...
interrupt:

4、在上行口统计中查询到有CRC错误在持续增加
SX_QianQingRanLiaoShiChang_MA5680T(config-if-giu-0/20)#display port  statistics  0   
Number of transmitted frames                                   =47083905
………………………………………………
Total number of octets                                         =3058974669
Number of alignment error frames                               =0
Number of discarded frames                                     =111039
Number of CRC error frames                                     =1184486
Number of collision frames                                     =0
Number of discarded undersized frames                          =0
Number of oversized frames                                     =701637
Number of CRC error packets(less than 64 octets in length)     =17
Number of CRC error packets(longer than 1518 octets in length) =17597


                         图:上行口的连接关系

            图:业务单板与主控板的连接通道
现网业务的快速恢复办法:
从图中可以看到,业务板以及上行口和主控板的联系都是有两个主备业务通道,这两个业务通道都是独立的物理连接,在现网出现问题时如果要快速恢复业务可以先进行主备倒换,使用另外一条物理通道。
此类问题的定位思路:
对于业务单板和主控板之间有CRC错误或者FCS错误增加的,导致问题的可能包括业务单板本身、业务单板槽位、主控板本身、主控板槽位、以及背板。所以这类问题的定位方法是逐个替换来排查确认。
1、        首先拔插业务单板,这个可以确认是否有可能是槽位倒针或者接触不良导致
2、        如果拔插单板无效果,可以更换一块好的业务单板进行测试。如果更换单板解决,那么就可能是业务单板异常。
3、        如果仍然不能解决丢包现象,那么就要排查主控板一侧。排查方法同上,也是拔插主控板确认是否有可能接触不良或者槽位有倒针,如果槽位无异常,就需要更换主控板。
4、        在更换主控板无效果之后,就需要更换机框。
对于上行口有CRC错误增加的,相比更换单板检查槽位,多了上行口光模块和光路问题的确认。上行口光模块和光路的处理也是通过更换本端与对端光模块、更换光纤线路来确认的。
根据历史定位信息,一般情况是单板异常以及背板槽位倒针导致。
单板与背板相连的位置在单板背板,对应的高速接口器件属于静电敏感器件,易受静电损坏。另外,单板接口器件到槽位会经过一些电容,如果单板堆叠,可能会将电容撞掉,也会出现丢包情况。

时间:  2015-4-12 13:36
作者: yifan1018

大家来回帖啊。。。




通信人家园 (https://www.txrjy.com/) Powered by C114