通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  列兵

注册:2010-5-5
跳转到指定楼层
1#
发表于 2010-7-8 11:00:42 |只看该作者 |倒序浏览
中兴软交换A200用户故障维护经验
中兴软交换设备在XXXX本地网试商用运行有将近一年的时间了。作为一个新产品,并且是试商用运行,总的来说运行还不错。XXXX本地网中兴软交换局现有7万多用户,共有85个节点,其中有4TG1SG67AG8IADAGA200M100两种设备,A20055个,M10012个,以A200用户居多,由于用户数量比较大,且是新设备、新技术,在试商用阶段难免会出现一些问题;软交换设备不同于传统程控数字交换机,不仅仅是在语音传输方面的不同,其呼叫原理和用户数据方面的一些概念和程控数字交换机相比也是有比较大的出入,加之软交换还需与PSTN网互联互通,还有与本地电信业务相融合的一个过程,这就给我们的维护带来了一些难度。在对用户故障的处理上也有别与传统的程控交换机,我们XXXX维护人员在处理用户故障的过程中积累和总结了一些方法和经验,以图共享,达到共同提高维护水平的目的。
    根据我们在日常维护中遇到过的问题,加以总结,用户级故障主要分为三类:
一、用户数据方面的原因
用户数据方面引起的故障我们根据肇庆本地网的实际业务情况可以总结归纳为以下多种情况:
1、
前后台数据不一致。如我们在SS1BGUI界面看到用户有来电显示标志,但用户反应没有来电显示,在横列测试也是如此,实际上用户是没有来电显示的。这类故障主要是在工程初期,因为要对后台倒送大量的待割接用户数据,导致后台和前台同步不过来,出现个别用户与前台没有同步成功。注意,SS1BGUI界面查询到的数据是后台数据库里面的数据。我们在修改一个用户数据时是在对后台操作,对后台写完后,后台然后再跟前台同步,所有用户数据都是在前台里面运行的,如果前台里面没有数据,用户当然是有故障了。解决办法就是将用户数据重新做一遍,如欠费复机,来电显示等新业务。
2、
用户漫游权限模板错。故障现象为用户呼入提示“您拨打的用户无权”提示音,呼出没问题。此类故障,是因为在用户属性里面有一项参数错,即用户漫游权限模板号错,应为1,默认为0,但如为0的话,就会出现此类故障,建议该问题通过厂家打补定解决,模板01做成一样的。默认为0
3、
用户TIDNAME错或无TIDNAME。故障现象为用户呼入忙音,不能呼出,横列测试无拨号音。此类故障可用H.248跟踪,观察其TIDNAME,看TIDNAME对不对,TIDNAME一般有3部份组成,前三位为单元号,后三位为子单元号,最后五位为用户电路号,如果TIDNAME不对或没有的话,用户就不能打入打出。修改为正确的TIDNAME后,故障解决。
4、
号码分析子中号码分析拦截。如某用户打入提示空号,但查该号码数据正常。此类故障是因为在该号码字冠前面的分析器中有该号码的号码分析。如22399992239字冠在本地号码分析器中为本局落地字冠,但在其前面的专网号码分析器中有2239999的出局字冠,并且有号码变换前插了4401送到了改号平台,故呼2239999时,只在本地网号码分析器前面的专网号码分析器里面分析,把223999送到了改号平台。删除专网号码分析器里2239999的局码分析,故障解决。此类故障,还表现有某一个号码打入无反应,呼出正常,用7号跟踪发现是该号码做成了死循环,原因大同小异。
5、
群号码分析子中群号码分析器和号码图表数据不全。故障现象是某一群内用户短号不能互打。一拨对方小号就忙音。检查发现在群号码分析器中,无群内小号字冠的分析,补做后故障消除。有时候群字冠是有,但群号码图表不全或没有,用H.248跟踪可以发现下发的号码图表不对。补做数据后即可。遇见此类故障,一定要检查群分析字冠和群号码图表对不对。
  设备故障方面的原因
由用户设备引起的用户故障情况主要有下面几种情况:
1、用户设备闭塞。提机忙音,打入提示用户线故障。处理方法:在“数据库图形界面”——“动态数据管理”——搜索用户,查看用户设备状态,如为故障状态,则解闭即可。
2、
A200
APR板不好。故障现象为用户通话经常断线,通话质量不好有杂音、单通。用QOS分析发现该节点有丢包,时延和抖动都比较大。通话经常断线应该是APR板质量不好,换板后故障即可解决。详细处理可见案例分析一。
3、
用户拨打电话有串音现象,有时能够听到拨键盘声。因为没有更好的检测手段,首先将故障定位于用户板,换板测试,并观察一段时间后,故障消失。
4、
用户TIDNAMEMFP板中吊死。故障现象为某一用户提机有拨号音,但打不出,呼入忙音,处理过程详见后面的案例分析二。
5、传真机收发传真不正常。该类型故障可分两种原因,一是传真机设置问题,二是用户属性模板配置中参数设置问题。故障现象为只能发传真不能收传真,解决办法:现场测试,有时使用传真机连电话都打不了,SS侧跟踪信令,传真机没有将所拨的号码报上来,修改传真机上设置USER SETTING/LINE TYPETOUCH TONEAUTO REDIAL改为ON,或关闭传真机上V.34功能试试,如仍不能解决问题,可在SS1BGUI界面上如图所示,修改H.248属性模板配置中参数。

将传真机属性模板中线路增益参数调整为增强型传真参数,具体参数需厂家开发人员提供,因涉及到全局数据修改,这个需厂家提供修改方案,谨慎修改。

6、
彩票机和POS机、拨号上网经常掉线。同传真机故障一样,将拨号模板中线路增益参数调整为增强型拨号参数。
7、MFP板故障。故障现象为故障节点用户电话大部分呼叫失败,用H.248跟踪,失败原因显示协议错,持续约15分钟,将MFP倒换到另一块MFP板后,故障消除,判断为该块MFP板有故障,更换MFP板后,倒换回去,故障无复现。因MFP板负责与SS的之间的协议处理,
8、
A200
数据配置问题。故障现象为软交换用户出入局呼叫存在协议错呼损。分析:局内呼叫不存在协议错呼损,因此问题可能在M100侧;
a)
M100上跟踪H.248信令,发现故障时M100432510错误给SS
b)
通过逐个AUC单元拨测,对发现问题的AUC单元,逐个处理;
c)
M100
侧回432错误表明是数据占用RTP失败,与SS侧的432含义不一样,检查M100的数据发现有一个AUC单元的IPPTIDNAME没有配置,配置好后占用此单元的呼叫正常;
三、 承载网方面的原因
在软交换体系中,承载网是必须得到保障的,一旦网络丢包严重,用户在使用电话的过程中就伴随有通话时延大、通话时而无音,甚至通话断线的问题。在大面积出现此类故障时,应首先检查承载网的网络情况。我们可以在承载网上PING故障节点的地址,来判断网络的优劣,也可以对该节点做QOS分析。当丢包率大于0.1%时,时延大于40ms,抖动大于10ms时,用户通话质量就会下降,严重的话也会引起通话断断续续,甚至通话断线。处理方法是通过PING故障节点设备的MFP板、ANIC板的外口地址来判断网络状况,如网络无问题,下一步就是来定位是哪一块单板的问题。具体处理方法和思路可见案例三。
杂音现象往往给用户带来很大的不便,故障的定位也有一定难度,下面我就将处理此类故障的经验与大家分享一下,请看以下几个案例:
[案例分析一]
故障现象A200下带的用户很多都反映在通话过程中有很大的杂音,经询问有杂音的几率很高,且无论对方是何种终端(固话或小灵通)呼入都如此。
故障定位及处理
首先挑选一个该节点的测试号码,在横列断开外线接上测试话机,打开上SS1b的网管客户端软件,给该号码登记H.248信令跟踪,然后开始呼叫测试,如果有出现杂音,就在信令跟踪中查找这次呼叫占用的VOIP电路,并记录下来(见图一),如RTP00300700058

图一
因为APR板有两块子卡,每块子卡60VOIP电路,共120VOIP电路,如RTP00300700058就表示第二块APR板的第一块子卡的第58VOIP电路。经过若干次测试后,确认再没有出现杂音,就可以将所有出现杂音的VOIP电路用指令闭塞:
50043=154=15=586=58(见图二),之后再拨打测试,杂音现象已不再出现,由此证明是APR板上的部分VOIP电路故障引起的杂音。换板后故障解决。
图二
[案例分析二]
故障现象:某一A200用户提机有拨号音,但就是不能打入打出,打出无反应,打入忙音。
故障处理经过:
1、
检查用户数据无误。怀疑为外线问题。
2、
112测外线正常。如外线不正常的话,打入时,应该送用户线故障的通知音。
3、
在动态数据管理里发现该号码是故障上电状态,闭解无效。
4、
H.248协议跟踪报500错误,呼损观察为协议错。500错误代码表示协议错。
5、
将用户数据删掉重新做数据后仍得不到解决。怀疑为用户板有问题。排除数据问题。
6、
到现场断开外线测试仍是如此,拔插用户板和换板测试后仍不见好。
7、
TELNET
MFP板,用5000命令查看用户状态为SEIZE,用50015002闭塞解闭用户电路不成功。应该是MFP板没有将该号码的用户TIDNAME释放所致。操作如下图:


8、
倒换MFP板,故障消除。
故障分析:


该故障基本上包括了所有处理用户故障的方法,一步一步的排查判断,最后才发现是MFP板没有释放该用户TIDNAME,指令释放无效,在不影响业务的前提下,只有通过到现场倒换MFP板强迫其释放,故障才解决。
[案例分析三]
A200MFP板的MAC冲突造成PING时丢包严重
故障现象:从中心机房PING各个A200的两块MFP板丢包严重。
处理步骤:
1、从中心机房PING各个A200ANIC板外口地址,正常不丢包;
2、从当地A200ANICMFP外口接的交换机上接根网线到PC上,通过PCPING当地的A200NICMFP外口地址,正常不丢包;
3、拔掉MFP的网线,将PC的网卡地址配置成MFP的地址,与中心机房互PING,正常不丢包;
4、在中心机房路由器T64E上检查端口连接信息,发现在T64E的同一个端口上连接的A200MFPIP地址对应的MAC地址全部相同;
5、重新修改A200的配置文件/tffs0/config/zxmg.cfglocalID的值,其缺省为110,规划所有A200该值范围为1-126,并且不重复。
6、修改完成zxmg.cfg后重起MFP,能正常PINGMFP,不丢包。
故障分析:
1、因为能PINGMFP外口,所以排除了没有配置维护路由的可能;
2、从中心机房PING各个A200ANIC正常而PINGMFP不正常时,怀疑MFP网口与当地以太网交换机网口不兼容;
3、将PC接在交换机上PING当地A200MFP地址正常,说明MFP网口与当地以太网交换机网口间不存在不兼容的问题;
4、排除了硬件故障后估计是IPMAC冲突,将PC的网卡配置上MFP的地址,与中心机房互PING正常说明IP地址没有冲突;
5、从中心机房路由器T64E上检查发现不同的MFP的地址对应的MAC地址相同,说明MAC地址有冲突;
6、因为A200均在同一个广播域里,而配置A200时没有修改其MFP外网口(E0)的MAC地址,A200MFP外口出厂默认MAC00d0d0c054db(12)00d0d0c054dc,只有通过修改zxmg.cfg才能更改MFP的外网口MAC地址;
6、
修改好各个A200MFP外口MAC不一样后,中心机房与MFPPING正常。修改方法: 1501端口TELNETMFP板上,用mod_mfp_mac命令修改MFP内口(E1)的MAC地址。
四、总结
在处理中兴软交换用户故障时,需在确认用户数据无误的前提下,综合利用各种工具,如H.248信令跟踪、呼损观察、即时话务观察、QOS分析,在排除了承载网的问题后,也可以利用网络来判断设备故障。随着电信技术的发展,NGN也就是下一代网络的试商用成功,软交换设备已呈逐步取代传统程控交换机的趋势,这对于我们来说是一个机会也是一个挑战。我们要不断的吸收新知识,接受新概念,学习和软交换的呼叫原理,积累经验,才能把软交换设备的维护工作做的更好。

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-8-14 03:27 , Processed in 0.450943 second(s), 17 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部