通话异常中断是指:用户在通话过程中,突然发生断话。 TC-C6060 POTS配置冗余导致语音业务闪断通过实际发生过的故障案例,介绍出现“POTS配置冗余导致语音业务闪断”故障时的处理方法。 故障类别语音业务 关键字语音业务闪断 现象描述ONT(HG850e)上配置基于SIP的语音业务,配置完成后发现语音业务会每隔3分种闪断,重拨仍然重复此现象。 告警信息无 原因分析· OLT配置问题。 · 电话问题。 · 上层软交换配置问题。 · ONT硬件问题。 · ONT配置问题。 操作步骤1. 检查OLT语音业务配置,配置正常,同时不产生相关告警。 2. 更换电话发现问题仍然存在。 3. 了解到上层软交换是友方设备,怀疑配置可能不兼容,联系局方,检查发现软交换配置没有问题。 4. 检查ONT状态,始终在线,所有指示灯均正常,且更换ONT问题仍然存在。 5. 检查ONT配置,发现两个POTS口都配置了号码、用户名和密码,但只有1个POTS口接话机,SIP的重复注册时间设置为180秒,初步怀疑是另外一个POTS口在重复注册时,上层软交换因其未接话机认为信令交互异常导致软交换切断话。 6. 删除未使用的POTS口配置,问题解决。 建议与总结ONT(HG850e)有两个POTS口,如果只使用其中的一个,确定使用的POTS口进行配置,未使用的POTS口不要配置号码、用户名等信息。 TC-C6063 链路聚合配置问题导致OLT下接ONU语音业务异常通过实际发生过的故障案例,介绍出现“链路聚合配置问题导致OLT下接ONU语音业务异常”故障时的处理方法。 故障类别语音业务 关键字MAC漂移 链路聚合 现象描述某OLT(MA5800)下挂部分ONU语音业务异常,经常断话。ONU设备有MG接口中断告警,以MGIP Ping网关(NE40E)丢包严重,但是PPPoE业务以及网管正常。组网: |-----MA5200G(PPPoE) ONU--MA5800--S8016 |-----NE40E(NGN语音)告警信息ONU设备上有“MG接口中断告警”。 原因分析· 链路问题。 · OLT和ONU设备配置问题。 操作步骤1. ONU到NE40E之间链路有问题。由于只是语音业务受到影响,故可以排除。 2. OLT上MAC学习异常。在MA5800上查看MAC地址表项,发现业务异常的ONU的MAC地址经常在上行口0/19/0上学习到,出现MAC漂移现象。 3. 查看OLT数据配置,发现上行端口配置了链路聚合。端口0/19/0和端口0/19/1透传所有的业务VLAN。查看S8016侧发现并没有配置链路聚合,而且和0/19/1对应的端口2/0/13只透传了VLAN 705。故只是在VLAN 705中出现了MAC地址漂移现象,影响了该VLAN的业务。 4. 在S8016侧也同样配置链路聚合,并透传所有的业务VLAN后,语音业务恢复正常。 建议与总结无 TC-C6093 软交换不响应部分tid的904请求导致MA5616 H.248接口闪断通过实际发生过的故障案例,介绍出现“软交换不响应部分tid的904请求导致MA5616 H.248接口闪断”故障时的处理方法。 故障类别MG接口故障 关键字H.248接口闪断 断话 现象描述业务组网:电话->ONU(MA5616)->OLT(MA5800)->软交换(Soft3000) 故障描述:某局点MA5616设备和华为软交换对接,语音业务每隔十几秒就会断话。查看告警,发现MG接口每隔十几秒就会闪断一次。 告警信息频繁出现H248接口中断告警。 原因分析· MA5616配置问题。 · MA5616与软交换链路问题。 · MA5616与软交换信令交互异常导致MA5616接口闪断。 · MA5616软件异常。 操作步骤1. 检查MA5616数据配置没有问题,查看H.248接口引用的profile模板是对应Soft3000的profile模板1:NoProfile("")。profile模板选择正确。 2. MA5616(config)#display if-h248 attribute 0 3. ------------------------------------------------- 4. MGID 0 5. MG Description - 6. MG DomainName - 7. Protocol H248 8. Start Negotiate Version 1 9. Profile Negotiation Parameter enable 10. Profile index 1:NoProfile("") 11.... 12. ------------------------------------------------- 13. 检查MA5616到软交换是否丢包。MA5616连续ping软交换地址5000次没有丢包,表明MA5616与软交换链路没有问题。 14. 检查MA5616软件是否异常。使用reboot system命令复位MA5616,故障现象不变。 15. 跟踪信令,发现每次接口复位后MA5616所有端口的tid(tid范围A0~A191)都向MGC发送904请求。但实际上此MA5616上只有64个电话,软交换上只配置了64个tid(A0~A63),因此MA5616上配置的tid数据A64~A191属于垃圾数据。软交换对A0~A63的904请求都正常响应(如P=388650384{C=-{SC=A13{SV{V=1}}}}),对没有配置的A64~A191应该回复错误430(如P=372844506{C=-{MF=A64{ER=430{"A64"}}}})。但是对于部分tid发送的904请求软交换没有任何响应,导致MA5616发送900复位接口。 16. 在MA5616上删除A64~A191后,这段tid不再向MGC发904请求。H.248接口不再复位,问题解决。 建议与总结进行数据配置时,请保证接入网侧与核心网侧数据保持一致,删除多余的配置数据。 TC-C6130 错误修改ONU管理VLAN导致MG接口中断通过实际发生过的故障案例,介绍出现“MG接口中断”故障时的处理方法。 故障类别H.248语音 关键字MG接口中断 现象描述业务组网:电话->ONU(MA5620)->OLT(MA5800)->软交换 故障描述:ONU原来的管理VLAN和语音业务VLAN是同一个。按照客户需求修改管理VLAN和管理IP后,导致MG接口中断。 告警信息MG接口中断 原因分析· ONU的H.248接口数据配置丢失。 · ONU的VLAN或路由数据配置不正确导致到MGC不通。 · 其它网络设备问题导致到MGC不通。 操作步骤1. MG接口中断,首先想到Ping软交换进行测试。从ONU Ping软交换,Ping不通。从ONUPing语音网关IP,也Ping不通。 2. 在ONU上使用display vlan 100命令检查ONU语音业务VLAN配置(假设语音业务VLANID为100)。发现Standard port number为0,表示语音业务VLAN的上行口数据配置丢失。 3. 在ONU上使用port vlan命令添加VLAN上行口后,ONU可以Ping通软交换,MG接口恢复。 建议与总结在OLT上使用ont ipconfig命令修改ONU的管理VLAN时,会自动删除ONU上原管理VLAN的配置。由于原管理VLAN上配置有VoIP业务,所以VLAN无法删除,只删除了VLAN上行口,导致ONU到软交换的路由不通,语音业务中断。 TC-C6162 ONU主备MGC地址配置相反导致H.248接口反复中断通过实际发生过的故障案例,介绍出现“H.248接口反复中断”故障时的处理方法。 故障类别语音 关键字H.248 接口中断 断话 现象描述H.248接口反复中断,现场窄带用户有时摘机无音,且通话过程中会断话。 告警信息接口中断告警 原因分析· 由于网络原因导致,如网络中断、丢包等。 · 数据配置错误。 · 主控板故障。 操作步骤1. 登录ONU查询到大量接口中断告警。在ONU上ping MGC地址发现没有丢包,且在ping过程中出现接口中断告警,表明该故障不是由于网络原因导致的。 2. 检查H.248接口数据,配置没有问题。 3. 跟踪H.248接口信令,发现ONU过一段时间就会主动向主用MGC发起热启动请求(RE="902"),MGC回复错误(ER=402{"unknown MGW"})后接口中断。接着ONU再向备用MGC发起注册请求,MGC正常响应后接口恢复。如此反复循环,H.248接口反复中断。 4. 与MGC核对数据,发现ONU配置的主备用MGC地址和MGC实际的主备地址刚好相反。在ONU中MG接口软件参数2配置为2,即支持双归属,支持自动回切。这样当ONU检测到主用MGC地址能正常通信就会发起回切,主动向主用MGC发起注册,从而导致了该故障的产生。 5. 在ONU上使用if-h248 attribute命令修改ONU侧主备MGC地址,并使用reset coldstart命令复位接口。问题解决。 建议与总结该问题也可以通过修改ONU MG接口软件参数2为1(支持双归属,不支持自动回切)解决。不建议使用该方式,因为这样会导致MGC和ONU主备地址和实际规划不一致,不利于维护。 TC-C6182 SBC到媒体网关间丢包导致SBC下挂MA5616电话通话异常通过实际发生过的故障案例,介绍“SBC下挂MA5616电话通话异常”故障时的处理方法。 故障类别语音业务 关键字MA5616 通话异常 现象描述组网:MA5616 —> SBC —> MGC(SoftX3000) MA5616下用户拨打电话,有时对端响铃摘机后通话无音,有时通话会中断,有时正常。 告警信息无 原因分析VoIP业务异常问题简单可以分为两个方面: · 信令交互异常引起的业务故障。 · 媒体流通道异常引起的业务故障。 要准确定位该问题,在明确故障细节后需确认信令的交互情况和媒体流的通道是否正常。 操作步骤1. 经过现场反复拨打不同网络电话测试,确认拨打同一个MGC内的用户都正常。拨打其他MGC下电话用户有时通话中断,有时对端响铃摘机后通话无音。 2. 抓包确认无论拨打同一个MGC还是其他MGC下的用户,分析信令未发现异常。初步判断问题是在SBC与MGC上。 3. 协调核心网工程师从SBC向MGC多次ping包,发现间歇性丢包。核心网工程师登录SBC和MGC检查后,确认设备运行正常。 4. 协调客户排查SBC到MGC之间的承载网络。确认SBC到MGC之间的其他厂家承载设备端口间歇性的UP与DOWN,导致业务异常。 5. 排除网络故障后,MA5616下用户拨打电话正常。 建议与总结VoIP业务异常往往涉及到接入网、核心网与承载网的众多设备,定位问题需要涉及到多个部门和多个工程师的配合协调。定位类似问题的关键在于准确地收集故障信息。需要具体化,细化故障现象,一点一点地确认清楚,从而分析判断问题是处在哪个层面,推动相关层面解决问题。 TC-C6302 OLT发送大量的ARP请求导致ONU语音业务瞬时中断通过实际发生过的故障案例,介绍出现“OLT发送大量的ARP请求导致ONU语音业务瞬时中断”故障时的处理方法。 故障类别语音质量问题 关键字ARP 瞬断 HG850a 现象描述电话 -> HG850a -> OLT -> 传输设备 -> NE40E OLT使用V800R006C02SPC124版本,HG850a语音用户打电话时每隔4~5秒左右就要瞬间中断0.3秒左右。 告警信息无 可能原因· 上行传输质量差。 · OLT GPON单板故障。 · HG850a故障。 操作步骤1. 在传输设备侧通过抓包的方式确认传输设备没有问题。 2. 更换GPON单板后故障依旧,排除OLT GPON单板故障。 3. 更换HG850a故障依旧,排除HG850a故障。 4. 继续定位发现该OLT下不同PON口之间的用户拨打电话也存在问题。通过抓包定位发现,瞬时中断时,HG850a在0.2秒内大概收到了60个ARP报文。怀疑由于ARP报文过多,使HG850a CPU被占用,导致语音业务瞬时中断。 5. 继续分析该OLT下只挂了HG850a,而且用户数量超过2000个,语音业务的IP地址非常多,并且语音业务的IP地址的网关在OLT设备上。怀疑由于OLT设备默认的ARP老化时间为20分钟,OLT会频繁发送ARP请求,导致ONU语音业务瞬时中断。 6. 使用arp aging-time命令修改ARP老化时间,修改为1分钟后,用户根本无法通话。修改为240分钟后,等待20分钟测试,发现用户通话明显改善。由此定位该故障是由于OLT发送大量的ARP请求导致ONU语音业务瞬时中断。 建议与总结如果OLT下挂大量ONU,并且ONU语音业务的IP地址的网关在OLT上,建议使用arp aging-time命令将OLT的ARP老化时间设置的长一些。 TC-C8007 ONU设备异常导致用户通话中断通过实际发生过的故障案例,介绍出现“用户通话中断”故障时的处理方法。 关键字听不到声音 V21flag 现象描述ONU下挂的语音用户,在通话过程中会突然听不到对端声音。 告警信息无 原因分析· 终端电话问题。 · ONU上的数据配置问题。 · ONU设备异常。 操作步骤1. 更换终端电话,故障依旧,排除电话问题。 2. 检查ONU的数据配置,和一台正常的ONU设备相比,发现两者没有区别,排除ONU设备数据配置问题。 3. 在通话过程中,在ONU上获取H248信令,发现ONU设备上报如下信息: [22:28:47.830]msg from mg([10.51.124.123]:2944) to mgc([10.2.192.1]:2944): !/1 [10.51.124.123]:2944 T=258884434{C=61{N=A2{OE=2686075394{20111119T22284700:ctyp/dtone{dtt=V21flag}}}}}如上信令说明ONU主动上报传真参数协商信息,但是和对端协商不通过导致用户通话时异常断话,由此判断是ONU异常。 4. 更换此ONU,问题解决。 建议与总结无 TC-C8143 因ONU之间环路导致某ONU下带语音用户经常中断通过实际发生过的故障案例,介绍出现“某ONU下带语音用户经常中断”故障时的处理方法。 关键字H.248语音中断 现象描述某ONU下带语音业务经常在晚上出现中断。 告警信息H.248接口中断告警 原因分析· 软交换侧存在问题。 · ONU的ARP(Address Resolution Protocol)刷新机制存在问题。 · ONU与上层网络间存在丢包或者中断。 操作步骤1. 在OLT下只有15号ONU的语音存在问题,可以排除软交换侧存在问题。 2. 在故障重现时,发现此(15号)ONU的语音网关ARP是正常的,排除ONU的ARP刷新机制存在问题。 3. 在故障重现时,发现从此(15号)ONU语音地址PING BRAS上的网关是不通的。怀疑存在环路。 a. 在OLT上使用display location命令查询15号ONU的桥MAC地址,发现是从同一个PON口的2号ONU上学习到的。 从现网环境获知:ONU是在OLT的0/7/0槽位,2号ONU的桥MAC地址为:00e0-fc00-3020,15号ONU的桥MAC地址为:00e0-fc00-4020 b. 在2号ONU上使用ringcheck enable命令开启环路检测功能。在OLT上使用display location命令查询2号ONU的MAC地址是从此PON下的15号ONU上学习到的: c. huawei(config)#display location d. { mac-addr<P><XXXX-XXXX-XXXX> }:00e0-fc00-3020 e. f. Command: g. display location 00e0-fc00-3020 h. It will take several minutes, and console may be timeout, please use command idle-timeout to set time limit i. Are you sure to query MAC address location ? (y/n)[n]:y j. --------------------------------------------------------------------- k. SRV-P BUNDLE TYPE MAC MAC TYPE F /S /P VPI VCI VLAN ID l. INDEX INDEX m. --------------------------------------------------------------------- n. 483 - epon 00e0-fc00-3020 dynamic 0 /7 /0 15 - 3410 //在0/7/0的PON端口下,VPI为15代表是15号ONUo. ---------------------------------------------------------------------p. Note: F--Frame, S--Slot, P--Port, VPI indicates GEM PortID for GPON, q. VPI indicates ONT ID for EPON, v/e--vlan/encap, r. pri-tag--priority-tagged, ppp--pppoe, ip—ipoes. 登录到15号ONU设备上进行查看,发现2号ONU的桥MAC是在15号ONU的0/1/16端口上学习到的。 t. huawei(config)#display location 00e0-fc00-3020 u. It will take several minutes, and console may be timeout, please use command idle-timeout to set time limit v. Are you sure to query MAC address location ? (y/n)[n]:y w. --------------------------------------------------------------------- x. SRV-P BUNDLE TYPE MAC MAC TYPE F /S /P VPI VCI VLAN ID y. INDEX INDEX z. --------------------------------------------------------------------- aa. 15 - eth 00e0-fc00-3020 dynamic 0 /1 /16 15 - 1231 bb. --------------------------------------------------------------------- cc. Note: F--Frame, S--Slot, P--Port, VPI indicates GEM PortID for GPON, dd. VPI indicates ONT ID for EPON, v/e--vlan/encap, ee. pri-tag--priority-tagged, ppp--pppoe, ip—ipoeff. 在15号ONU上开启环路检测,在OLT上使用display location命令查询15号ONU的MAC地址是从此PON下的2号ONU上学习到的: gg.huawei(config)#display location 00e0-fc00-4020 hh. It will take several minutes, and console may be timeout, please use command ii.idle-timeout to set time limit jj. Are you sure to query MAC address location ? (y/n)[n]:y kk. --------------------------------------------------------------------- ll. SRV-P BUNDLE TYPE MAC MAC TYPE F /S /P VPI VCI VLAN ID mm. INDEX INDEX nn. --------------------------------------------------------------------- oo. 6940 - epon 00e0-fc00-4020 dynamic 0 /7 /0 2 - 3410 pp. --------------------------------------------------------------------- qq. Note: F--Frame, S--Slot, P--Port, VPI indicates ONT ID for GPON and EPON, rr. VCI indicates GEM Port index or GEM PortID for GPON, v/e--vlan/encap, ss. pri-tag--priority-tagged, ppp--pppoe, ip--ipoe tt. 登录到2号ONU设备上进行查看,发现15号ONU桥MAC是从2号0/1/24端口学习到的。 uu.huawei(config)#display location 00e0-fc00-4020 vv. It will take several minutes, and console may be timeout, please use command ww.idle-timeout to set time limit xx. Are you sure to query MAC address location ? (y/n)[n]:y yy. ----------------------------------------------------------------------------- zz. SRV-P TYPE MAC MAC TYPE F /S /P VPI VCI FLOW FLOW VLANID aaa. INDEX TYPE PARA bbb. ----------------------------------------------------------------------------- ccc. 23 eth 00e0-fc00-4020 dynamic 0 /1 /24 2 - vlan untag 1072ddd. eee. 在OLT上将其中一个端口禁用(Down)掉,观察3天,发现这两个ONU上没有再产生H.248接口中断告警。从而判断:2号ONU的0/1/24端口与15号ONU的0/1/16端口成环是导致此次问题的根本原因。 fff. 知会用户整改此环路端口的用户家网络后,业务恢复正常。 建议与总结无
|