通信人家园
标题:
中兴软交换A200用户故障维护经验
[查看完整版帖子]
[打印本页]
时间:
2010-7-8 11:00
作者:
黄建强
标题:
中兴软交换A200用户故障维护经验
中兴软交换
A200
用户故障维护经验
中兴软交换设备在
XXXX
本地网试商用运行有将近一年的时间了。作为一个新产品,并且是试商用运行,总的来说运行还不错。
XXXX
本地网中兴软交换局现有
7
万多用户,共有
85
个节点,其中有
4
个
TG
,
1
个
SG
,
67
个
AG
,
8
个
IAD
,
AG
有
A200
和
M100
两种设备,
A200
有
55
个,
M100
有
12
个,以
A200
用户居多,由于用户数量比较大,且是新设备、新技术,在试商用阶段难免会出现一些问题;软交换设备不同于传统程控数字交换机,不仅仅是在语音传输方面的不同,其呼叫原理和用户数据方面的一些概念和程控数字交换机相比也是有比较大的出入,加之软交换还需与
PSTN
网互联互通,还有与本地电信业务相融合的一个过程,这就给我们的维护带来了一些难度。在对用户故障的处理上也有别与传统的程控交换机,我们
XXXX
维护人员在处理用户故障的过程中积累和总结了一些方法和经验,以图共享,达到共同提高维护水平的目的。
根据我们在日常维护中遇到过的问题,加以总结,用户级故障主要分为三类:
一、用户数据方面的原因
用户数据方面引起的故障我们根据肇庆本地网的实际业务情况可以总结归纳为以下多种情况:
1、
前后台数据不一致。如我们在
SS1B
—
GUI
界面看到用户有来电显示标志,但用户反应没有来电显示,在横列测试也是如此,实际上用户是没有来电显示的。这类故障主要是在工程初期,因为要对后台倒送大量的待割接用户数据,导致后台和前台同步不过来,出现个别用户与前台没有同步成功。注意,
SS1B
—
GUI
界面查询到的数据是后台数据库里面的数据。我们在修改一个用户数据时是在对后台操作,对后台写完后,后台然后再跟前台同步,所有用户数据都是在前台里面运行的,如果前台里面没有数据,用户当然是有故障了。解决办法就是将用户数据重新做一遍,如欠费复机,来电显示等新业务。
2、
用户漫游权限模板错。故障现象为用户呼入提示“您拨打的用户无权”提示音,呼出没问题。此类故障,是因为在用户属性里面有一项参数错,即用户漫游权限模板号错,应为
1
,默认为
0
,但如为
0
的话,就会出现此类故障,建议该问题通过厂家打补定解决,模板
0
和
1
做成一样的。默认为
0
。
3、
用户
TIDNAME
错或无
TIDNAME
。故障现象为用户呼入忙音,不能呼出,横列测试无拨号音。此类故障可用
H.248
跟踪,观察其
TIDNAME
,看
TIDNAME
对不对,
TIDNAME
一般有
3
部份组成,前三位为单元号,后三位为子单元号,最后五位为用户电路号,如果
TIDNAME
不对或没有的话,用户就不能打入打出。修改为正确的
TIDNAME
后,故障解决。
4、
号码分析子中号码分析拦截。如某用户打入提示空号,但查该号码数据正常。此类故障是因为在该号码字冠前面的分析器中有该号码的号码分析。如
2239999
,
2239
字冠在本地号码分析器中为本局落地字冠,但在其前面的专网号码分析器中有
2239999
的出局字冠,并且有号码变换前插了
4401
送到了改号平台,故呼
2239999
时,只在本地网号码分析器前面的专网号码分析器里面分析,把
223999
送到了改号平台。删除专网号码分析器里
2239999
的局码分析,故障解决。此类故障,还表现有某一个号码打入无反应,呼出正常,用
7
号跟踪发现是该号码做成了死循环,原因大同小异。
5、
群号码分析子中群号码分析器和号码图表数据不全。故障现象是某一群内用户短号不能互打。一拨对方小号就忙音。检查发现在群号码分析器中,无群内小号字冠的分析,补做后故障消除。有时候群字冠是有,但群号码图表不全或没有,用
H.248
跟踪可以发现下发的号码图表不对。补做数据后即可。遇见此类故障,一定要检查群分析字冠和群号码图表对不对。
二
设备故障方面的原因
由用户设备引起的用户故障情况主要有下面几种情况:
1
、用户设备闭塞。提机忙音,打入提示用户线故障。处理方法:在“数据库图形界面”——“动态数据管理”——搜索用户,查看用户设备状态,如为故障状态,则解闭即可。
2、
A200
上
APR
板不好。故障现象为用户通话经常断线,通话质量不好有杂音、单通。用
QOS
分析发现该节点有丢包,时延和抖动都比较大。通话经常断线应该是
APR
板质量不好,换板后故障即可解决。详细处理可见案例分析一。
3、
用户拨打电话有串音现象,有时能够听到拨键盘声。因为没有更好的检测手段,首先将故障定位于用户板,换板测试,并观察一段时间后,故障消失。
4、
用户
TIDNAME
在
MFP
板中吊死。故障现象为某一用户提机有拨号音,但打不出,呼入忙音,处理过程详见后面的案例分析二。
5、
传真机收发传真不正常。该类型故障可分两种原因,一是传真机设置问题,二是用户属性模板配置中参数设置问题。故障现象为只能发传真不能收传真,解决办法:现场测试,有时使用传真机连电话都打不了,
SS
侧跟踪信令,传真机没有将所拨的号码报上来,修改传真机上设置
USER SETTING/LINE TYPE
为
TOUCH TONE
、
AUTO REDIAL
改为
ON
,或关闭传真机上
V.34
功能试试,如仍不能解决问题,可在
SS1B
—
GUI
界面上如图所示,修改
H.248
属性模板配置中参数。
将传真机属性模板中线路增益参数调整为增强型传真参数,具体参数需厂家开发人员提供,因涉及到全局数据修改,这个需厂家提供修改方案,谨慎修改。
6、
彩票机和
POS
机、拨号上网经常掉线。同传真机故障一样,将拨号模板中线路增益参数调整为增强型拨号参数。
7、
MFP
板故障。故障现象为故障节点用户电话大部分呼叫失败,用
H.248
跟踪,失败原因显示协议错,持续约
15
分钟,将
MFP
倒换到另一块
MFP
板后,故障消除,判断为该块
MFP
板有故障,更换
MFP
板后,倒换回去,故障无复现。因
MFP
板负责与
SS
的之间的协议处理,
8、
A200
数据配置问题。故障现象为软交换用户出入局呼叫存在协议错呼损。分析:局内呼叫不存在协议错呼损,因此问题可能在
M100
侧;
a)
在
M100
上跟踪
H.248
信令,发现故障时
M100
发
432
及
510
错误给
SS
;
b)
通过逐个
AUC
单元拨测,对发现问题的
AUC
单元,逐个处理;
c)
M100
侧回
432
错误表明是数据占用
RTP
失败,与
SS
侧的
432
含义不一样,检查
M100
的数据发现有一个
AUC
单元的
IPP
的
TIDNAME
没有配置,配置好后占用此单元的呼叫正常;
三、
承载网方面的原因
在软交换体系中,承载网是必须得到保障的,一旦网络丢包严重,用户在使用电话的过程中就伴随有通话时延大、通话时而无音,甚至通话断线的问题。在大面积出现此类故障时,应首先检查承载网的网络情况。我们可以在承载网上
PING
故障节点的地址,来判断网络的优劣,也可以对该节点做
QOS
分析。当丢包率大于
0.1%
时,时延大于
40ms,
抖动大于
10ms
时,用户通话质量就会下降,严重的话也会引起通话断断续续,甚至通话断线。处理方法是通过
PING
故障节点设备的
MFP
板、
ANIC
板的外口地址来判断网络状况,如网络无问题,下一步就是来定位是哪一块单板的问题。具体处理方法和思路可见案例三。
杂音现象往往给用户带来很大的不便,故障的定位也有一定难度,下面我就将处理此类故障的经验与大家分享一下,请看以下几个案例:
[
案例分析一
]
故障现象
:
A200
下带的用户很多都反映在通话过程中有很大的杂音,经询问有杂音的几率很高,且无论对方是何种终端(固话或小灵通)呼入都如此。
故障定位及处理
首先挑选一个该节点的测试号码,在横列断开外线接上测试话机,打开上
SS1b
的网管客户端软件,给该号码登记
H.248
信令跟踪,然后开始呼叫测试,如果有出现杂音,就在信令跟踪中查找这次呼叫占用的
VOIP
电路,并记录下来(见图一),如
RTP00300700058
。
图一
因为
APR
板有两块子卡,每块子卡
60
路
VOIP
电路,共
120
路
VOIP
电路,如
RTP00300700058
就表示第二块
APR
板的第一块子卡的第
58
路
VOIP
电路。经过若干次测试后,确认再没有出现杂音,就可以将所有出现杂音的
VOIP
电路用指令闭塞:
5004
:
3=15
,
4=1
,
5=58
,
6=58
(见图二),之后再拨打测试,杂音现象已不再出现,由此证明是
APR
板上的部分
VOIP
电路故障引起的杂音。换板后故障解决。
图二
[
案例分析二
]
故障现象:某一
A200
用户提机有拨号音,但就是不能打入打出,打出无反应,打入忙音。
故障处理经过:
1、
检查用户数据无误。怀疑为外线问题。
2、
用
112
测外线正常。如外线不正常的话,打入时,应该送用户线故障的通知音。
3、
在动态数据管理里发现该号码是故障上电状态,闭解无效。
4、
用
H.248
协议跟踪报
500
错误,呼损观察为协议错。
500
错误代码表示协议错。
5、
将用户数据删掉重新做数据后仍得不到解决。怀疑为用户板有问题。排除数据问题。
6、
到现场断开外线测试仍是如此,拔插用户板和换板测试后仍不见好。
7、
TELNET
到
MFP
板,用
5000
命令查看用户状态为
SEIZE
,用
5001
和
5002
闭塞解闭用户电路不成功。应该是
MFP
板没有将该号码的用户
TIDNAME
释放所致。操作如下图:
8、
倒换
MFP
板,故障消除。
故障分析:
该故障基本上包括了所有处理用户故障的方法,一步一步的排查判断,最后才发现是
MFP
板没有释放该用户
TIDNAME
,指令释放无效,在不影响业务的前提下,只有通过到现场倒换
MFP
板强迫其释放,故障才解决。
[
案例分析三
]
A200
—
MFP
板的
MAC
冲突造成
PING
时丢包严重
故障现象:从中心机房
PING
各个
A200
的两块
MFP
板丢包严重。
处理步骤:
1
、从中心机房
PING
各个
A200
的
ANIC
板外口地址,正常不丢包;
2
、从当地
A200
的
ANIC
和
MFP
外口接的交换机上接根网线到
PC
上,通过
PC
来
PING
当地的
A200
的
NIC
和
MFP
外口地址,正常不丢包;
3
、拔掉
MFP
的网线,将
PC
的网卡地址配置成
MFP
的地址,与中心机房互
PING
,正常不丢包;
4
、在中心机房路由器
T64E
上检查端口连接信息,发现在
T64E
的同一个端口上连接的
A200
的
MFP
的
IP
地址对应的
MAC
地址全部相同;
5
、重新修改
A200
的配置文件
/tffs0/config/zxmg.cfg
中
localID
的值,其缺省为
110
,规划所有
A200
该值范围为
1-126
,并且不重复。
6
、修改完成
zxmg.cfg
后重起
MFP
,能正常
PING
通
MFP
,不丢包。
故障分析:
1
、因为能
PING
通
MFP
外口,所以排除了没有配置维护路由的可能;
2
、从中心机房
PING
各个
A200
的
ANIC
正常而
PING
其
MFP
不正常时,怀疑
MFP
网口与当地以太网交换机网口不兼容;
3
、将
PC
接在交换机上
PING
当地
A200
的
MFP
地址正常,说明
MFP
网口与当地以太网交换机网口间不存在不兼容的问题;
4
、排除了硬件故障后估计是
IP
或
MAC
冲突,将
PC
的网卡配置上
MFP
的地址,与中心机房互
PING
正常说明
IP
地址没有冲突;
5
、从中心机房路由器
T64E
上检查发现不同的
MFP
的地址对应的
MAC
地址相同,说明
MAC
地址有冲突;
6
、因为
A200
均在同一个广播域里,而配置
A200
时没有修改其
MFP
外网口(
E0
)的
MAC
地址,
A200
的
MFP
外口出厂默认
MAC
为
00d0d0c054db(12
槽
)
和
00d0d0c054dc
,只有通过修改
zxmg.cfg
才能更改
MFP
的外网口
MAC
地址;
6、
修改好各个
A200
的
MFP
外口
MAC
不一样后,中心机房与
MFP
互
PING
正常。修改方法:
用
1501
端口
TELNET
到
MFP
板上,用
mod_mfp_mac
命令修改
MFP
内口(
E1
)的
MAC
地址。
四、总结
在处理中兴软交换用户故障时,需在确认用户数据无误的前提下,综合利用各种工具,如
H.248
信令跟踪、呼损观察、即时话务观察、
QOS
分析,在排除了承载网的问题后,也可以利用网络来判断设备故障。随着电信技术的发展,
NGN
也就是下一代网络的试商用成功,软交换设备已呈逐步取代传统程控交换机的趋势,这对于我们来说是一个机会也是一个挑战。我们要不断的吸收新知识,接受新概念,学习和软交换的呼叫原理,积累经验,才能把软交换设备的维护工作做的更好。
时间:
2013-10-14 13:37
作者:
dengchaofeng
很好哦
通信人家园 (https://www.txrjy.com/)
Powered by C114