通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索
查看: 2305|回复: 0
打印

通话异常中断案例 [复制链接]

军衔等级:

  新兵

注册:2015-7-8
跳转到指定楼层
1#
发表于 2020-5-9 11:14:44 |只看该作者 |倒序浏览
通话异常中断是指:用户在通话过程中,突然发生断话。
TC-C6060 POTS配置冗余导致语音业务闪断
通过实际发生过的故障案例,介绍出现“POTS配置冗余导致语音业务闪断”故障时的处理方法。
故障类别
语音业务
关键字
语音业务闪断
现象描述
ONT(HG850e)上配置基于SIP的语音业务,配置完成后发现语音业务会每隔3分种闪断,重拨仍然重复此现象。
告警信息
原因分析
·        OLT配置问题。
·        电话问题。
·        上层软交换配置问题。
·        ONT硬件问题。
·        ONT配置问题。
操作步骤
1.   检查OLT语音业务配置,配置正常,同时不产生相关告警。
2.   更换电话发现问题仍然存在。
3.   了解到上层软交换是友方设备,怀疑配置可能不兼容,联系局方,检查发现软交换配置没有问题。
4.   检查ONT状态,始终在线,所有指示灯均正常,且更换ONT问题仍然存在。
5.   检查ONT配置,发现两个POTS口都配置了号码、用户名和密码,但只有1个POTS口接话机,SIP的重复注册时间设置为180秒,初步怀疑是另外一个POTS口在重复注册时,上层软交换因其未接话机认为信令交互异常导致软交换切断话。
6.   删除未使用的POTS口配置,问题解决。
建议与总结
ONT(HG850e)有两个POTS口,如果只使用其中的一个,确定使用的POTS口进行配置,未使用的POTS口不要配置号码、用户名等信息。
TC-C6063 链路聚合配置问题导致OLT下接ONU语音业务异常
通过实际发生过的故障案例,介绍出现“链路聚合配置问题导致OLT下接ONU语音业务异常”故障时的处理方法。
故障类别
语音业务
关键字
MAC漂移
链路聚合
现象描述
某OLT(MA5800)下挂部分ONU语音业务异常,经常断话。ONU设备有MG接口中断告警,以MGIP Ping网关(NE40E)丢包严重,但是PPPoE业务以及网管正常。组网:
                   |-----MA5200G(PPPoE)       ONU--MA5800--S8016                         |-----NE40E(NGN语音)告警信息
ONU设备上有“MG接口中断告警”。
原因分析
·        链路问题。
·        OLT和ONU设备配置问题。
操作步骤
1.   ONU到NE40E之间链路有问题。由于只是语音业务受到影响,故可以排除。
2.   OLT上MAC学习异常。在MA5800上查看MAC地址表项,发现业务异常的ONU的MAC地址经常在上行口0/19/0上学习到,出现MAC漂移现象。
3.   查看OLT数据配置,发现上行端口配置了链路聚合。端口0/19/0和端口0/19/1透传所有的业务VLAN。查看S8016侧发现并没有配置链路聚合,而且和0/19/1对应的端口2/0/13只透传了VLAN 705。故只是在VLAN 705中出现了MAC地址漂移现象,影响了该VLAN的业务。
4.   在S8016侧也同样配置链路聚合,并透传所有的业务VLAN后,语音业务恢复正常。
建议与总结
TC-C6093 软交换不响应部分tid的904请求导致MA5616 H.248接口闪断
通过实际发生过的故障案例,介绍出现“软交换不响应部分tid的904请求导致MA5616 H.248接口闪断”故障时的处理方法。
故障类别
MG接口故障
关键字
H.248接口闪断
断话
现象描述
业务组网:电话->ONU(MA5616)->OLT(MA5800)->软交换(Soft3000)
故障描述:某局点MA5616设备和华为软交换对接,语音业务每隔十几秒就会断话。查看告警,发现MG接口每隔十几秒就会闪断一次。
告警信息
频繁出现H248接口中断告警。
原因分析
·        MA5616配置问题。
·        MA5616与软交换链路问题。
·        MA5616与软交换信令交互异常导致MA5616接口闪断。
·        MA5616软件异常。
操作步骤
1.   检查MA5616数据配置没有问题,查看H.248接口引用的profile模板是对应Soft3000的profile模板1:NoProfile("")。profile模板选择正确。
2.  MA5616(config)#display if-h248 attribute 0                3.    -------------------------------------------------                             4.    MGID                                0                                               5.    MG Description                      -                                               6.    MG DomainName                       -                                               7.    Protocol                            H248                                            8.    Start Negotiate Version             1                                               9.    Profile Negotiation Parameter       enable                                            10. Profile index                  1:NoProfile("")                        11....                                                 12.  -------------------------------------------------  
13. 检查MA5616到软交换是否丢包。MA5616连续ping软交换地址5000次没有丢包,表明MA5616与软交换链路没有问题。
14. 检查MA5616软件是否异常。使用reboot system命令复位MA5616,故障现象不变。
15. 跟踪信令,发现每次接口复位后MA5616所有端口的tid(tid范围A0~A191)都向MGC发送904请求。但实际上此MA5616上只有64个电话,软交换上只配置了64个tid(A0~A63),因此MA5616上配置的tid数据A64~A191属于垃圾数据。软交换对A0~A63的904请求都正常响应(如P=388650384{C=-{SC=A13{SV{V=1}}}}),对没有配置的A64~A191应该回复错误430(如P=372844506{C=-{MF=A64{ER=430{"A64"}}}})。但是对于部分tid发送的904请求软交换没有任何响应,导致MA5616发送900复位接口。
16. 在MA5616上删除A64~A191后,这段tid不再向MGC发904请求。H.248接口不再复位,问题解决。
建议与总结
进行数据配置时,请保证接入网侧与核心网侧数据保持一致,删除多余的配置数据。
TC-C6130 错误修改ONU管理VLAN导致MG接口中断
通过实际发生过的故障案例,介绍出现“MG接口中断”故障时的处理方法。
故障类别
H.248语音
关键字
MG接口中断
现象描述
业务组网:电话->ONU(MA5620)->OLT(MA5800)->软交换
故障描述:ONU原来的管理VLAN和语音业务VLAN是同一个。按照客户需求修改管理VLAN和管理IP后,导致MG接口中断。
告警信息
MG接口中断
原因分析
·        ONU的H.248接口数据配置丢失。
·        ONU的VLAN或路由数据配置不正确导致到MGC不通。
·        其它网络设备问题导致到MGC不通。
操作步骤
1.   MG接口中断,首先想到Ping软交换进行测试。从ONU Ping软交换,Ping不通。从ONUPing语音网关IP,也Ping不通。
2.   在ONU上使用display vlan 100命令检查ONU语音业务VLAN配置(假设语音业务VLANID为100)。发现Standard port number为0,表示语音业务VLAN的上行口数据配置丢失。
3.   在ONU上使用port vlan命令添加VLAN上行口后,ONU可以Ping通软交换,MG接口恢复。
建议与总结
在OLT上使用ont ipconfig命令修改ONU的管理VLAN时,会自动删除ONU上原管理VLAN的配置。由于原管理VLAN上配置有VoIP业务,所以VLAN无法删除,只删除了VLAN上行口,导致ONU到软交换的路由不通,语音业务中断。
TC-C6162 ONU主备MGC地址配置相反导致H.248接口反复中断
通过实际发生过的故障案例,介绍出现“H.248接口反复中断”故障时的处理方法。
故障类别
语音
关键字
H.248 接口中断 断话
现象描述
H.248接口反复中断,现场窄带用户有时摘机无音,且通话过程中会断话。
告警信息
接口中断告警
原因分析
·        由于网络原因导致,如网络中断、丢包等。
·        数据配置错误。
·        主控板故障。
操作步骤
1.   登录ONU查询到大量接口中断告警。在ONU上ping MGC地址发现没有丢包,且在ping过程中出现接口中断告警,表明该故障不是由于网络原因导致的。
2.   检查H.248接口数据,配置没有问题。
3.   跟踪H.248接口信令,发现ONU过一段时间就会主动向主用MGC发起热启动请求(RE="902"),MGC回复错误(ER=402{"unknown MGW"})后接口中断。接着ONU再向备用MGC发起注册请求,MGC正常响应后接口恢复。如此反复循环,H.248接口反复中断。
4.   与MGC核对数据,发现ONU配置的主备用MGC地址和MGC实际的主备地址刚好相反。在ONU中MG接口软件参数2配置为2,即支持双归属,支持自动回切。这样当ONU检测到主用MGC地址能正常通信就会发起回切,主动向主用MGC发起注册,从而导致了该故障的产生。
5.   在ONU上使用if-h248 attribute命令修改ONU侧主备MGC地址,并使用reset coldstart命令复位接口。问题解决。
建议与总结
该问题也可以通过修改ONU MG接口软件参数2为1(支持双归属,不支持自动回切)解决。不建议使用该方式,因为这样会导致MGC和ONU主备地址和实际规划不一致,不利于维护。
TC-C6182 SBC到媒体网关间丢包导致SBC下挂MA5616电话通话异常
通过实际发生过的故障案例,介绍“SBC下挂MA5616电话通话异常”故障时的处理方法。
故障类别
语音业务
关键字
MA5616 通话异常
现象描述
组网:MA5616 —> SBC —> MGC(SoftX3000)
MA5616下用户拨打电话,有时对端响铃摘机后通话无音,有时通话会中断,有时正常。
告警信息
原因分析
VoIP业务异常问题简单可以分为两个方面:
·        信令交互异常引起的业务故障。
·        媒体流通道异常引起的业务故障。
要准确定位该问题,在明确故障细节后需确认信令的交互情况和媒体流的通道是否正常。
操作步骤
1.   经过现场反复拨打不同网络电话测试,确认拨打同一个MGC内的用户都正常。拨打其他MGC下电话用户有时通话中断,有时对端响铃摘机后通话无音。
2.   抓包确认无论拨打同一个MGC还是其他MGC下的用户,分析信令未发现异常。初步判断问题是在SBC与MGC上。
3.   协调核心网工程师从SBC向MGC多次ping包,发现间歇性丢包。核心网工程师登录SBC和MGC检查后,确认设备运行正常。
4.   协调客户排查SBC到MGC之间的承载网络。确认SBC到MGC之间的其他厂家承载设备端口间歇性的UP与DOWN,导致业务异常。
5.   排除网络故障后,MA5616下用户拨打电话正常。
建议与总结
VoIP业务异常往往涉及到接入网、核心网与承载网的众多设备,定位问题需要涉及到多个部门和多个工程师的配合协调。定位类似问题的关键在于准确地收集故障信息。需要具体化,细化故障现象,一点一点地确认清楚,从而分析判断问题是处在哪个层面,推动相关层面解决问题。
TC-C6302 OLT发送大量的ARP请求导致ONU语音业务瞬时中断
通过实际发生过的故障案例,介绍出现“OLT发送大量的ARP请求导致ONU语音业务瞬时中断”故障时的处理方法。
故障类别
语音质量问题
关键字
ARP
瞬断
HG850a
现象描述
电话 -> HG850a -> OLT -> 传输设备 -> NE40E
OLT使用V800R006C02SPC124版本,HG850a语音用户打电话时每隔4~5秒左右就要瞬间中断0.3秒左右。
告警信息
可能原因
·        上行传输质量差。
·        OLT GPON单板故障。
·        HG850a故障。
操作步骤
1.   在传输设备侧通过抓包的方式确认传输设备没有问题。
2.   更换GPON单板后故障依旧,排除OLT GPON单板故障。
3.   更换HG850a故障依旧,排除HG850a故障。
4.   继续定位发现该OLT下不同PON口之间的用户拨打电话也存在问题。通过抓包定位发现,瞬时中断时,HG850a在0.2秒内大概收到了60个ARP报文。怀疑由于ARP报文过多,使HG850a CPU被占用,导致语音业务瞬时中断。
5.   继续分析该OLT下只挂了HG850a,而且用户数量超过2000个,语音业务的IP地址非常多,并且语音业务的IP地址的网关在OLT设备上。怀疑由于OLT设备默认的ARP老化时间为20分钟,OLT会频繁发送ARP请求,导致ONU语音业务瞬时中断。
6.   使用arp aging-time命令修改ARP老化时间,修改为1分钟后,用户根本无法通话。修改为240分钟后,等待20分钟测试,发现用户通话明显改善。由此定位该故障是由于OLT发送大量的ARP请求导致ONU语音业务瞬时中断。
建议与总结
如果OLT下挂大量ONU,并且ONU语音业务的IP地址的网关在OLT上,建议使用arp aging-time命令将OLT的ARP老化时间设置的长一些。
TC-C8007 ONU设备异常导致用户通话中断
通过实际发生过的故障案例,介绍出现“用户通话中断”故障时的处理方法。
关键字
听不到声音
V21flag
现象描述
ONU下挂的语音用户,在通话过程中会突然听不到对端声音。
告警信息
原因分析
·        终端电话问题。
·        ONU上的数据配置问题。
·        ONU设备异常。
操作步骤
1.   更换终端电话,故障依旧,排除电话问题。
2.   检查ONU的数据配置,和一台正常的ONU设备相比,发现两者没有区别,排除ONU设备数据配置问题。
3.   在通话过程中,在ONU上获取H248信令,发现ONU设备上报如下信息:
[22:28:47.830]msg  from mg([10.51.124.123]:2944) to  mgc([10.2.192.1]:2944): !/1 [10.51.124.123]:2944 T=258884434{C=61{N=A2{OE=2686075394{20111119T22284700:ctyp/dtone{dtt=V21flag}}}}}
如上信令说明ONU主动上报传真参数协商信息,但是和对端协商不通过导致用户通话时异常断话,由此判断是ONU异常。
4.   更换此ONU,问题解决。
建议与总结
TC-C8143 因ONU之间环路导致某ONU下带语音用户经常中断
通过实际发生过的故障案例,介绍出现“某ONU下带语音用户经常中断”故障时的处理方法。
关键字
H.248语音中断
现象描述
某ONU下带语音业务经常在晚上出现中断。
告警信息
H.248接口中断告警
原因分析
·        软交换侧存在问题。
·        ONU的ARP(Address Resolution Protocol)刷新机制存在问题。
·        ONU与上层网络间存在丢包或者中断。
操作步骤
1.   在OLT下只有15号ONU的语音存在问题,可以排除软交换侧存在问题。
2.   在故障重现时,发现此(15号)ONU的语音网关ARP是正常的,排除ONU的ARP刷新机制存在问题。
3.   在故障重现时,发现从此(15号)ONU语音地址PING BRAS上的网关是不通的。怀疑存在环路。
a.    在OLT上使用display location命令查询15号ONU的桥MAC地址,发现是从同一个PON口的2号ONU上学习到的。
从现网环境获知:ONU是在OLT的0/7/0槽位,2号ONU的桥MAC地址为:00e0-fc00-3020,15号ONU的桥MAC地址为:00e0-fc00-4020
b.   在2号ONU上使用ringcheck enable命令开启环路检测功能。在OLT上使用display location命令查询2号ONU的MAC地址是从此PON下的15号ONU上学习到的:
c.  huawei(config)#display location d.  { mac-addr<P><XXXX-XXXX-XXXX> }:00e0-fc00-3020 e.   f.    Command: g.            display location 00e0-fc00-3020 h.    It will take several minutes, and console may be timeout, please use command  idle-timeout to set time limit i.    Are you sure to query MAC address location ? (y/n)[n]:y j.    --------------------------------------------------------------------- k.    SRV-P BUNDLE TYPE MAC            MAC TYPE F /S /P  VPI  VCI   VLAN ID l.    INDEX INDEX                                                               m.    --------------------------------------------------------------------- n.      483    -   epon 00e0-fc00-3020 dynamic  0 /7 /0  15   -     3410   //在0/7/0的PON端口下,VPI为15代表是15号ONUo.    ---------------------------------------------------------------------p.  Note: F--Frame, S--Slot, P--Port, VPI indicates GEM PortID for GPON, q.          VPI indicates ONT ID for EPON, v/e--vlan/encap, r.          pri-tag--priority-tagged, ppp--pppoe, ip—ipoe
s.    登录到15号ONU设备上进行查看,发现2号ONU的桥MAC是在15号ONU的0/1/16端口上学习到的。
t.  huawei(config)#display location 00e0-fc00-3020 u.    It will take several minutes, and console may be timeout, please use command  idle-timeout to set time limit v.    Are you sure to query MAC address location ? (y/n)[n]:y w.    --------------------------------------------------------------------- x.    SRV-P BUNDLE TYPE MAC            MAC TYPE F /S /P  VPI  VCI   VLAN ID y.    INDEX INDEX                                                               z.    --------------------------------------------------------------------- aa.     15    -   eth  00e0-fc00-3020 dynamic  0 /1 /16 15    -     1231   bb.  --------------------------------------------------------------------- cc.  Note: F--Frame, S--Slot, P--Port, VPI indicates GEM PortID for GPON, dd.        VPI indicates ONT ID for EPON, v/e--vlan/encap, ee.        pri-tag--priority-tagged, ppp--pppoe, ip—ipoe
ff.   在15号ONU上开启环路检测,在OLT上使用display location命令查询15号ONU的MAC地址是从此PON下的2号ONU上学习到的:
gg.huawei(config)#display location 00e0-fc00-4020           hh.  It will take several minutes, and console may be timeout, please use command   ii.idle-timeout to set time limit                                                   jj.  Are you sure to query MAC address location ? (y/n)[n]:y                       kk.  ---------------------------------------------------------------------         ll.  SRV-P BUNDLE TYPE MAC                    MAC TYPE F /S /P  VPI  VCI   VLAN ID         mm.  INDEX INDEX                                                                   nn.  ---------------------------------------------------------------------         oo.   6940    -   epon 00e0-fc00-4020         dynamic  0 /7 /0  2   -     3410             pp.  ---------------------------------------------------------------------         qq.  Note: F--Frame, S--Slot, P--Port, VPI indicates ONT ID for GPON and EPON,     rr.        VCI indicates GEM Port index or GEM PortID for GPON, v/e--vlan/encap,   ss.        pri-tag--priority-tagged, ppp--pppoe, ip--ipoe
tt.   登录到2号ONU设备上进行查看,发现15号ONU桥MAC是从2号0/1/24端口学习到的。
uu.huawei(config)#display location  00e0-fc00-4020   vv.  It will take several minutes, and console may be timeout, please use command   ww.idle-timeout to set time limit                                                   xx.  Are you sure to query MAC address location ? (y/n)[n]:y                       yy.  ----------------------------------------------------------------------------- zz.  SRV-P TYPE  MAC            MAC TYPE F /S /P  VPI  VCI  FLOW  FLOW      VLANID aaa.              INDEX                                                  TYPE  PARA             bbb.              ----------------------------------------------------------------------------- ccc.                 23 eth   00e0-fc00-4020 dynamic  0 /1 /24 2    -    vlan  untag       1072ddd.            
eee.            在OLT上将其中一个端口禁用(Down)掉,观察3天,发现这两个ONU上没有再产生H.248接口中断告警。从而判断:2号ONU的0/1/24端口与15号ONU的0/1/16端口成环是导致此次问题的根本原因。
fff.  知会用户整改此环路端口的用户家网络后,业务恢复正常。
建议与总结

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-7-23 06:01 , Processed in 0.730988 second(s), 17 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部