通信人家园

标题: 华为SDH告警处理  [查看完整版帖子] [打印本页]

时间:  2017-4-4 13:26
作者: denglang20     标题: 华为SDH告警处理

二、 常见告警处理方法■APS_FAIL 复用段保护倒换失败指示告警SCC  ASCC  JSCC  GXCSA  EXCSA
告警描述:APS_FAIL为复用段保护倒换失败指示告警(APS protection switching failed)。当复用段倒换失败时就会产生此告警。产生该告警后,复用段倒换失败,对于线性复用段和两纤环形复用段,如果再发生断纤或者其他故障,将中断业务。告警原因分析:1、复用段配置参数错误;2 复用段配置丢失。
处理方法:产生此告警时,升级为问题单提交到相关专业室技术支持,同时电话通知专业负责人。
■APS_INDI复用段状态指示告警SCC  ASCC  JSCC  GXCSA  EXCSA   
告警描述:APS_INDI为复用段状态指示告警(APS state indicate alarm)。当复用段处于倒换态时上报此告警。产生该告警表明发生了自动保护倒换或外部命令倒换,受保护的业务已经倒换到保护通路上传输。该告警不影响业务运行,但如果此时保护通路也出现故障,将中断业务。
告警原因分析
1、     由外部下发倒换命令(包括人工倒换、强制倒换、练习倒换)产生。
2、     由高级告警(R_LOSR_LOFMS_AISB2_EXCB2_SD)引起。
3、     业务板、交叉板故障引起。
处理方法:1、查看该网元上是否存在线路级别告警如R_LOSR_LOF等,若存在,此告警不用处理;
          2、若该网元无线路R_LOSR_LOF级别告警,升级问题单给相关专业室技术支持;若有业务网申告,同时电话通知专业负责人。
■AU_AIS 管理单元告警指示信号FE08   EGT6   EGT2   GE06    SEP   SP08  D64D SD1  SQ1   SL4   SD4   SQE   S16 JLH1  JLHE   JLQ4  JL64  JQ16 JD16  JL16  N1SLT1  N1SLD4  N1SLQ1 N1SL16  N1EFS0  N2SL64 SLQ4   SL16  SL16A  SLO1  SL64  
告警描述:AU_AIS为管理单元告警指示信号(AU alarm indication)。当本站光口接收侧接收到的指针值为全“1”时就会上报该告警。该告警产生时,在没有网络保护的情况下,通道级别业务中断。 产生该告警后,会引起下游站点产生AU_AIS告警。
告警原因分析
1、     高级告警下插(R_LOSR_LOFROOFB1_EXCB2_EXC)。
2、     业务配置错误。
3、     本端收故障或者对端发故障。
处理方法:1、看产生告警的单板是线路板还是业务板。
          2、如果是线路板,通过查看路径,确认路径两端线路板时隙,在该线路板网元管理器中SDH业务配置中查询得到业务板端口。
          3、对于业务板端口: ①如果未上业务,不用处理;②已上业务的,如果同时上报其他高级别告警,则优先处理高级别告警;如果没有其他高级别告警,对于普通电路派发故障配合工作单到地市公司,内容为“请检查单板、ODF架及相关连纤”由地市进行处理,配合市公司处理查看告警情况;对于VIP电路,升级问题单提交专业室。
■AU_LOP AU指针丢失EGT2  EGT6   FE08  SEP  D64D   SP08  GE06 JLH1  JLHE JLQ4  JD16  JQ16  JL16  JL64 N1SLT1  N1SLD4  N1SLQ1  N1SL16  N2SL64  SD1  SD4  SL4  SQ1  SQE  S16  SLO1  SLQ4  SL16  SL16A SL64
告警描述:AU_LOP告警表示AU指针丢失(AU Loss of Pointer),当本站光口接收侧连续8帧接收到NDF或无效指针值时会上报该告警。该告警产生时通道级别业务中断。产生该告警后,系统会通过G1字节自动向对端回告HP_RDI,对端站会上报HP_RDI告警。
告警原因分析
1、     业务配置错误。
2、     本站接收误码过大。
3、     本端收故障或者对端发故障。
处理方法:1、同步该网元和对端网元告警,看是否存在误码告警,如B1_EXCB2_EXCB1_SDB2_SD等误码告警,若存在,派发故障配合工作单到相应地市,内容为“请检查单板、ODF架及相关连纤”。
         2、若该网元及对端网元均无误码产生,升级问题单到专业室。
■BD_STATUS单板物理离线告警所有单板
告警描述:BD_STATUS为单板物理离线告警。当用户在网管上配置了该单板而物理子架上却没有插入实际单板时就会上报此告警。由于设备上没有插入实际单板,主机配置好的的数据无法下发到该单板,业务将无法配置成功。
告警原因分析1、单板未插 2、板间通讯故障 3、单板软件故障,无法和主机通信 4、单板未插好 5、单板正在硬复位或软复位 6、单板故障
处理方法:产生此告警时,如告警影响业务,派故障配合工作单给地市公司,内容为“请插拔单板或更换单板”,同时电话通知专业负责人;如告警不影响业务,操作时间?等待备板到位?
■COMMUN_FAIL单板间通信失效告警所有单板
告警描述:COMMUN_FAIL为单板间通信失效告警。当主控板和其他单板之间的通讯中断时就会上报此告警。产生该告警后,会导致主机的配置无法下发到单板或单板无法工作,出现业务无法配置或保护倒换功能失效等情况。
告警原因分析1、单板故障 2、单板复位
处理方法:产生此告警时,如告警影响业务,派故障配合工作单给地市公司,内容为“请插拔单板或更换单板”,同时电话通知专业负责人;如告警不影响业务,操作时间?等待备板到位?
■ETH_LOS网口连接丢失告警EGT  GE06
告警描述:ETH_LOS为网口连接丢失告警。该告警表示以太网端口接收不到以太网信号。产生该告警后,网口接收不到数据,业务中断。
告警原因分析
1、     网线、光纤故障或松动。
2、     对端发送部分故障,本端接收部分故障。
处理方法:1、在资源管理系统中查询该端口是否使用,无法确认端口是否在用,按照已经使用处理;
         2、若该端口已使用,派发故障配合工作单到端口所在地市公司,内容为“请检查、更换相关连纤或单板”。
        
■FAN_FAIL风扇故障告警EMPU  FAN  AFAN  ASCC  SCC
告警描述:FAN_FAIL为风扇故障告警。当风扇故障时就会上报此告警。产生该告警后,如不及时解决故障,可能会因过热而损坏网元,从而造成整个设备的业务中断。
告警原因分析1、风扇未开 2、风扇失效
处理方法:派发故障配合工作单到市公司,内容为“请清理风扇、防尘网并检查单板”。
■HARD_BAD硬件故障告警
告警描述:HARD_BAD为硬件故障告警(Hardware Fails)。当单板检测到硬件出现异常时,就会上报该告警。产生该告警后,若该单板为备板,则无法进行主备倒换,并可能会造成业务中断。
告警原因分析
1、电源失效
2、单板故障
处理方法:产生此告警时,如告警影响业务,派故障配合工作单给地市公司,内容为“请插拔单板或更换单板”,同时电话通知专业负责人;如告警不影响业务,操作时间?等待备板到位?
■IN_PWR_FAIL光放大单板检测到自身的输入光接口无输入光功率ABA2
告警原因分析:IN_PWR_FAIL告警,表示光放大单板检测到自身的输入光接口无输入光功率。此时光放板无输入光功率。若有承载业务的光信号应该通过该光口被放大且该业务通道有MSPSNCP保护,则会触发MSPSNCP保护。
告警原因分析1、断纤2、连接件故障。(检查前面)3、光模块故障。
处理方法:1、确认同一路由上是否存在光缆中断,若存在,不处理此告警;
          2、若不存在,检查系统倒换是否正常,如果倒换失败,提交问题单到专业室。如果倒换正常,派发故障配合工作单到地市公司,内容为“请检查相关连纤、连接件或拔插单板”。
■IN_PWR_HIGH输入光功率过高告警ABA2
告警描述:IN_PWR_HIGH为输入光功率过高告警(Input power is too high)。当单板检测到实际输入的光功率高于输入光功率的基准值的上限时,就会上报该告警。产生该告警后,光口上的业务会出现误码,并且输入光功率过高会损坏激光器。
告警原因分析1、本端连接件故障2、单板检测单元故障
处理方法:派发故障配合工作单到地市公司,内容为“请检查相关连纤、连接件或拔插单板”。 操作时间?等待备板到位?
■IN_PWR_LOW输入光功率过低告警ABA2
告警描述:IN_PWR_LOW为输入光功率过低告警(Input power is too low)。当单板检测到实际的输入光功率低于输入基准值的下限时,就会上报该告警。产生该告警后,光口上的业务会出现误码。
告警原因分析
1、线路故障
2、本端或对端连纤故障
3、本端或对端连接件故障
4、本端或对端单板故障
处理方法:1、确认同一路由上是否存在光缆中断,若存在,不处理此告警;
          2、若不存在,派发故障配合工作单到地市公司,内容为“请检查相关连纤、连接件或拔插单板”。操作时间?等待备板到位?
■LTI同步源丢失告警JSTG  GXCSA  EXCS  XCS  AXCS  AMXS
告警描述:LTI为同步源丢失告警(Loss of Synchronous Source)。该告警表示本网元的时钟处于不正常状态。产生该告警时,当前网元的时钟已处于不正常的状态。若长时间处于该状态,可能因为时钟质量的降低导致业务误码率升高,指针调整增多。
告警原因分析1、光纤断(跟踪线路时钟)或电缆断(跟踪支路时钟) 2、外部源时钟无输入(跟踪外部时钟) 3、同步源被设为不可恢复或被阻塞。
处理方法:1、检查该告警是否由高级别告警如RLOSRLOF告警引起;若是,不需要处理此告警;
          2、若不是,升级问题单到专业室。
■M_S_SW交叉板或时钟板发生主备板倒换GXCH  JSTG  EXCH  XCS  GXCL
告警描述:M_S_SW告警,表示交叉板或时钟板发生主备板倒换。由于时钟板、交叉板采用1+1保护。如果是由于单板离位或故障引起的主备倒换,那么将破坏1+1保护,影响时钟板、交叉板的自动倒换功能,影响系统的稳定性。
告警原因分析1、插拔交叉板或时钟板。2、交叉板或时钟板故障。3、人工下发命令,强制单板进行保护倒换。
处理方法:1、通过网管检查上报告警的交叉板或时钟板的主备板是否离位或其他告警,若是,派发故障配合工作单到地市公司,内容为“请拔插或更换单板”。(如果故障恢复,在晚上22;00之后倒回主用)
         2、若没有异常,升级问题单到专业室。
■MS_AIS复用段告警指示JLH1 JQ16  JD16  JL16  JLQ4 JLHE JL64 SL16 SLO1  SLQ4  SL64  S16  SQ1  SL4  SEP  SD4 SL16A SP08  SQE N1SL16  N1SLQ1 N1SLT1  N2SL64  D64D  N1SLD4
告警描述:MS_AIS告警表示复用段告警指示(Multiplex section alarm indication),当本站光口接收侧连续5帧接收到的K2字节后三位为‘111’时就会上报该告警。该表示上报告警的光口对应的复用段信号不可用。如果配置了复用段自动保护倒换或通道保护倒换业务,该告警会引起保护倒换。否则该告警产生时,业务会中断。 产生该告警后,系统会自动向对端站回告RDI信号,对端站会产生MS_RDI告警。
告警原因分析
1、     高级告警(R_LOSR_LOF)下插。
2、     对端站交叉时钟板故障。
3、     对端发送部分故障,本端接收部分故障。
处理方法:1、在网管上查看对应的线路板是否有R_LOSR_LOF告警,若存在,按照R_LOSR_LOF告警进行故障处理,此告警不需要处理;
        2、若不存在,派发问题单到专业室。
■MS_RDI复用段远端接收失效指示JLH1 JQ16  JD16  JL16  JLQ4 JLHE JL64 N1SL16  N1SLQ1 N1SLT1  N2SL64  D64D  N1SLD4 SL16 SLO1  SLQ4  SL64  S16  SQ1  SL4  SEP  SD4 SL16A SP08  SQE
告警描述:MS_RDI告警表示复用段远端接收失效指示(Multiplex section remote defect indication),当本站光口接收侧连续5帧接收到的K2字节后三位为‘110’时,就会上报该告警。对端站产生MS_AIS告警时,会向本端站回告此告警。该告警对本站没有影响,只是表明对端站接收业务有中断。
告警原因分析1、对端高级告警(R_LOSR_LOCR_LOFMS_AISB2_EXCB2_SD)下插。 2、对端站接收部分故障 3、本站发送部分故障
处理方法:1、在网管上查看对应的线路板是否有R_LOSR_LOF告警,若存在,按照R_LOSR_LOF告警进行故障处理,此告警不需要处理;
          2、若不存在,升级问题单到专业室。
■OUT_PWR_ABN输出光功率异常JL64  N1SLT1  N2SL64  D64D  N1SLD4  ABA2  SL16   SL64  S16  SEP N1SL16  JLH1  JLHE   SL16A  JQ16   JD16   JL16   JLQ4   N1SLQ1
告警描述:OUT_PWR_ABN告警表示输出光功率异常(Output power abnormal)。该告警会影响业务的传输性能,严重时会造成业务的中断。
告警原因分析1、输出光功率过高或过低 2、单板故障
处理方法:派发配合工作单到地市,内容为“请检查相关连纤、连接件或拔插单板”。操作时间?等待备板到位?
■PS 发生保护倒换指示告警
PQ1  EIPC  XCS  SCC
告警描述:PS为已发生保护倒换指示告警。当业务发生保护倒换后,系统就会上报该告警。在发生倒换期间业务会出现瞬断,瞬断时间小于50ms
告警原因分析:业务发生保护倒换
处理方法:该告警为保护倒换指示告警,保护倒换时此告警伴随产生,如果倒换原因不明,派发问题单到专业室。
■R_LOS线路接收侧信号丢失JL16  JLQ4  JL64 JLH1 JD16  JLHE JQ16 N1SLT1  N1SLQ1  N2SL64  N1SLD4  N1SL16  FE08 D64D SL16  SLO1  SLQ4  SL64  S16  SQ1  SL4  SP08  SQE  SL16A  SEP  SD4 SD1
告警描述:R_LOS告警表示线路接收侧信号丢失(Receive loss of signal)。该告警产生后,业务中断,并向下游下插AIS信号。 产生该告警后,系统会自动向上游站点回告MS_RDI,上游站点会产生MS_RDI告警。
告警原因分析
1.           断纤(干线光缆故障或局间光缆故障引起)
2.           连接件故障。(与该单板相连的波分系统的连接件,连纤)
3.           线路衰耗过大
4.           本站接收部分故障(本端SDH设备的连接件,连纤,单板)
5.           对端站发送部分故障(包括时钟板故障)(对端SDH设备的连接件,连纤,单板)
处理方法:                    
线路单板处理方法:
1、若为干线光缆故障或局间光缆故障引起,派发故障配合工作单到两端地市公司及工程局线路代维人员, 内容为“请检查光缆连纤”,并电话通知监控室和专业室负责人。操作时间?
2、其它情况下,派发故障配合工作单到两端地市公司,内容为“请检查或更换连接件、连纤,拔插或更换单板”。
业务板处理方法:
1若该端口未上业务,不用处理;
2、若该端口已上业务,对于VIP业务,升级问题单给专业室;非VIP业务,派发故障配合工作单到端口所在网元的地市,内容为“请检查或更换连接件、连纤,拔插或更换单板”。多光口单板操作时间?等待备板到位?
■R_LOF线路接收侧帧丢失JL16  JLQ4  JL64 JLH1 JD16  JLHE JQ16 N1SLT1  N1SLQ1  N2SL64  N1SLD4  N1SL16  FE08 D64D SL16  SLO1  SLQ4  SL64  S16  SQ1  SL4  SP08  SQE  SL16A  SEP  SD4 SD1
告警描述:R_LOF告警表示线路接收侧帧丢失(Receive loss of frame),当本站光口接收侧连续5帧没有接收到正确的A1A2字节时就会上报该告警。该告警产生后,业务中断,并向下游下插AIS信号。 产生该告警后,系统会自动向上游站点回告MS_RDI,上游站点会产生MS_RDI告警。
告警原因分析1、对端站发送功率异常或信号无帧结构(对端站连接件、连纤、单板故障)2、本站接收方向故障(本端站连接件、连纤、单板故障)
线路单板处理方法:
派发故障配合工作单到两端地市公司,内容为“请检查或更换连接件、连纤,拔插或更换单板”。
业务板处理方法:
1若该端口未上业务,不用处理;
2、若该端口已上业务,对于VIP业务,升级问题单给专业室;非VIP业务,派发故障配合工作单到端口所在网元的地市,内容为“请检查或更换连接件、连纤,拔插或更换单板”。多光口单板操作时间?等待备板到位?
■R_OOF接收线路侧帧失步JL16  JLQ4  JL64 JLH1 JD16  JLHE JQ16 N1SLT1  N1SLQ1  N2SL64  N1SLD4  N1SL16  FE08 D64D SL16  SLO1  SLQ4  SL64  S16  SQ1  SL4  SP08  SQE  SL16A  SEP  SD4 SD1
告警描述:R_OOFOut Of Frame)告警为接收线路侧帧失步告警,表明线路单板接收信号中连续5帧以上无法判别帧头,进入帧失步状态。该告警产生后,业务中断,并向下游下插AIS信号。 产生该告警后,系统会自动向上游站点回告MS_RDI,上游站点会产生MS_RDI告警。如果帧失步持续了3ms,则进入帧丢失状态,设备产生帧丢失告警R_LOF
告警原因分析1、对端站发送部分故障(对端站连接件、连纤、单板故障)2、本站接收方向故障(本端站连接件、连纤、单板故障)3、同步时钟源严重失步。 4、接收信号衰减过大5、传输过程误码过大
线路单板处理方法:
派发故障配合工作单到两端地市公司,内容为“请检查或更换连接件、连纤,拔插或更换单板”。
业务板处理方法:
1若该端口未上业务,不用处理;
2、若该端口已上业务,对于VIP业务,升级问题单给专业室;非VIP业务,派发故障配合工作单到端口所在网元的地市,内容为“请检查或更换连接件、连纤,拔插或更换单板”。多光口单板操作时间?等待备板到位?
■S1_SYN_CHANGE在S1字节模式下时钟源发生倒换JSTG  GXCSA  EXCS  XCS  AXCS  AMXS  EXCSA
告警描述:S1_SYN_CHANGE告警表示在S1字节模式下时钟源发生倒换(Clock reference Source Change In S1_Mode)。该告警指示在SSM模式下,跟踪的时钟源发生了倒换。产生该告警后,表明在SSM模式下,跟踪的时钟源发生倒换。如新跟踪的时钟源质量下降,会产生指针调整和少量误码,影响业务质量。
告警原因分析1、光纤断 2、外接BITS中断 3、上游站产生本告警
处理方法:1、确认是否有R_LOSR_LOFR_OOF告警伴随产生,若有,此告警不用处理;
2、若没有,升级问题单到专业室技术支持。





通信人家园 (https://www.txrjy.com/) Powered by C114