通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  中校

注册:2010-8-25155
跳转到指定楼层
1#
发表于 2015-10-21 09:11:55 |只看该作者 |倒序浏览
天下功夫,内力为本,招数为末。欲练上乘内功,需搬运真气,让内息通行经脉。网优之内功心法,无非打通各大信令流程。如能滚瓜烂熟,且独辟蹊径,逆练经脉,则犹如网优之北冥神功,天下武功无不为我所用,天下故障无不为我所化。本秘籍虽为菊花派所创,然而天下内功都是一般,举一反三而已。

本秘籍偶拾于网络深谷,签名菊花派,如有版权问题,请联系小编处理!

1 接入问题定位优化方法

1.1 接入流程及问题表现

1.1.1 接入流程

接入流程可以分为四个步骤:

1)随机接入

2)RRC连接建立

3)鉴权

4)E-RAB建立

接入问题的主要表现也体现在这四个步骤上。
1.1.2 随机接入失败

随机接入失败的常见原因

1)ENB侧参数配置问题

2)UE侧参数配置问题

3)信道环境影响

4)核心网侧配置问题

备注:由于随机接入是L2的过程,在ENB侧没有明显的特征表现,需要结合UE侧的log来进行观察与判断
  

1.1.3 RRC连接建立失败

RRC连接建立的话统统计

1)【A点】

指标L.RRC.ConnReq.Att加1,不统计重发的次数

2)【C点】

指标L.RRC.ConnReq.Succ加1,不统计重发的次数
RRC建立连接失败在ENB侧的表现如下:

1)RRC_CONNECTION_CMP没有收到

2)ENB回复RRC_CONNECTION_REJECT
1.1.4 鉴权流程失

这里所说的鉴权流程指的是在S1口上,ENB发起UE_INITIAL_MESSAGE到收到核心网侧发送的INITIAL_UE_context_Setup_REQ这之间的所有流程交互:
该流程存在问题导致接入失败的几个现象

1)UE与核心网直传消息空***互丢失(ENB侧来看是对应的上行直传消息没有收到)

2)核心网直接发送释放命令

3)核心网不响应或者响应过慢
1.1.4 E-RAB建立失败

E-RAB建立的话统统计
  

1)【A点】

如图中A点所示,当eNodeB收到来自MME的E-RAB SETUP REQUEST或者INITIAL CONTEXT SETUP REQUEST消息时E-RAB建立尝试次数累加

2)【B点】

如图中B点所示,当eNodeB收到来自MME的E-RAB SETUP RESPONSE或者INITIAL CONTEXT SETUP RESPONSE消息时E-RAB建立成功次数累加

E-RAB建立失败在空口信令的表现

1)空口安全交互,UE回复FAIL

2)空口安全交互,UE未回复CMP

3)空口DRB建立重配,UE未回复CMP

4)空口UE能力查询,UE未回复
E-RAB建立失败S1口信令表现(空口信令交互正常)

1)核心网异常

2)无线资源申请失败

3)GTPU资源申请失败
1.2 问题定位、解决方法

接入失败问题定位规定动作
1.2.1 问题定位:第一板斧

话统分析

1)通过话统分析可以区分RRC建立失败或者E-RAB建立失败的TOP小区和统计TOP时间段

2)通过话统分析可以区分RRC建立失败是因为空口原因导致还是由于小区资源问题导致。
3)通过话统分析可以统计E-RAB建立过程,由于空口安全交互,UE回复FAIL导致建立失败的次数,该现象为UE和核心网交互失败导致,需要联合UE和CN共同定位。
1.2.2 问题定位:第二板斧

CHR日志分析

通过CHR日志分析可以获取RRC建立失败或者是E-RAB建立失败的top用户的TMSI。
1.2.3 问题定位:第三板斧

跟踪

1)标口跟踪:通过话统统计出top小区和top时间段后,在对应的小区和时间段开启标口跟踪,查看接入流程走到哪一步失败。

2)IFTS跟踪:在对应的小区和时间段开启IFTS跟踪,确认接入失败用户的链路质量状况。

3)启动单用户全网跟踪:通过TOP用户的TMSI在核心网侧获取其IMSI,然后启动该用户的全网跟踪。

1.2.4 问题解决方法

传输及核心网问题

从跟踪分析流程,如果属于核心网问题,需要联合核心网侧人员共同定位解决

ERAN侧异常

1)空口异常:上行受限、下行受限、覆盖空洞、干扰过大

2)基站异常:一般属于产品问题,需要相关产品日志进行分析定位

UE侧问题

如果统计显示一直是某个用户接入有问题,而该小区其他用户一直正常,该终端异常的可能性较大,需要通过获取的IMSI信息回溯,实地复现定位解决。

问题解决方法:上下行不平衡和覆盖空洞

无论是上下行不平衡还是覆盖空洞,均表现为链路质量较差

1)上行链路较差的表现就是RB缩到最小,上行MCS选择0阶,PHR已经在0db以下,而且上行BLER较大不收敛,CRC校验解错的概率较高。

2)下行链路较差的表现为UE上报CQI较差或者网络侧HARQ收到大量来自UE侧反馈的DTX和NACK

3)上行受限指的是上行较差而下行还可以;下行受限指的是上行还可以而下行较差;覆盖空洞指的是上下行链路均已较差。
  

对于上行受限可采用如下办法解决:

1)增加基站,减小下行小区覆盖距离

2)增加塔放,增加上行信号补偿

3)减小导频功率,减小下行小区覆盖距离

4)增加天线数,增强上行信号增益

对于下行受限可采用如下办法解决:

1)增加基站,减小下行小区覆盖距离

2)增大导频功率,增加下行小区覆盖距离

3)天线拉远,增强边缘覆盖

对于覆盖空洞

增加基站,增强覆盖。

2 切换问题定位优化方法

2.1 切换流程及问题表现

2.1.1 切换原理及信令流程

切换的过程就是终端在移动过程中与网络连接交互发生变化的过程:
LTE系统的整个切换过程完全由网络侧(eNB)控制,所以eNB需要监测UE所处的无线质量环境,这个过程是通过eNB下发测量控制让UE在满足一定条件时上报测量报告来实现的:

1)触发:当前我司eNB是采用A3事件触发同频切换,通过A2、A4事件来触发异频切换

2)切换:eNB下发切换命令给UE,UE收到切换命令后,中断与源小区的交互,按命令切换
2.1.2 切换失败

判断是否切换,通常以信令为判断依据,在终端侧,以发出触发切换的测量报告为开始,以切换完成消息为结束;

切换成功时,从UE侧观察表现为UE从一个源小区到一个新的小区(可从PCI变化来观察)进行正常业务交互;

Q1:测量报告丢失现象

UE侧发出测量报告后,但没有收到切换命令,在UE侧和eNB的现象分别如下:
  

Q2:切换命令丢失现象:

UE侧发出测量报告后,eNB收到测量报告,并下发切换命令,但UE侧没有收到;
UE侧看到的现象与切换测量报告丢失一样;从eNB侧看,则是收到测量报告下发切换命令后,在目标小区没有收到切换完成消息;
  

Q3:目标小区接入失败现象:

UE侧发出测量报告后,eNB收到测量报告,并下发切换命令,UE收到切换命令后,在目标小区发起接入,但目标侧没有收到切换完成消息,在UE侧和eNB的现象分别如下:
  

2.2 问题定位、解决方法

2.2.1 切换问题定位规定动作
设备状态检查

1)查询基站、小区告警,保证没有与切换相关的严重告警(如X2配置链路断开、RRU告警等)

2)检查测试终端是否能正常使用,是否支持异频、异系统重选、切换功能

参数核查

1)确认切换开关状态

2)确认邻区配置,确认邻区关系、X2接口配置、传输配置

3)确认切换参数,比如切换门限,幅度迟滞,时间迟滞等

4)确认是否存在PCI冲突告警

切换失败TOP站邻区漏配检查

地理位置、网络规划角度,确认是否邻区漏配,并实施相应操作

2.2.2 切换问题的定位、解决方法

TOP1:邻区漏配核查

从网络侧跟踪UU口和终端侧Uu口跟踪结合判断:

1)网络侧:同一用户(CALL ID)连续上报测量报告但没有下发切换命令,检查X2或S1跟踪中分别也没有HANDOVER REQUST及S1AP_HANDOVER_REQUIRED,则很可能是漏配的小区(通过查询配置确认);

2)终端侧:随着UE移动服务小区RSRP越来越差,SINR越来越差,而邻区RSRP越来越好,上报测量报告,没有收到切换命令;
  
TOP2:切换不及时:

当邻区无线质量满足切换门限时,服务小区的RSRP突然陡降:
  
1)修改服务小区与邻区的偏置CellIndividualOffset来提前切换

2)修改服务小区的延迟触发时间IntraFreqHoA3TimeToTrig来提前切换(建议配置为40ms到200ms之间的一个值,如80ms)

3)调整切换门限参数IntraFreqHoA3Hyst、 IntraFreqHoA3Offset来提前切换(此操作用得很少)

TOP2:弱覆盖:

从终端侧判断:

当邻区无线质量满足切换门限时,服务小区和邻区的RSRP都十分弱;
  

从网络侧判断:

从网络侧跟踪的UU口消息中,触发切换的A3测量报告记录的源小区、目标小区RSRP都很低,当测量报告中携带的服务小区RSRP值小于-110dBm时,可以认为处于信号质量微弱的区域,此时容易出现切换失败,需要调整覆盖;

弱覆盖的解决方法:

1)调整天线方向角、倾角:当下行先受限时,可以通过调整天线(如减小下倾角)补充远点的下行覆盖;

2)增加塔放、基站:当上行先受限时,可以通过增加塔放、增加小区(基站或接远RRU)的方式增强上行覆盖;

TOP3:乒乓切换:

乒乓切换的解决方法

1)相对调整两小区的CIO值,抵制乒乓切换;

2)当前默认使用同频切换门限为2dB,从前面整理出来的乒乓区域RSRP相对值来看,最大RSRP差距为4dB,所以设置CIO为-3dB,可以防止乒乓;
TOP3:干扰

干扰的表现

在RSRP比较好的情况下,吞吐率不如预期、容易出现切换失败甚至掉话等多种现象;

干扰的解决方法

找出干扰原因,去除干扰源

3 掉话问题定位优化方法

3.1 掉话流程及问题表现

3.1.1 LTE网络掉话定义

话统掉话定义

当eNodeB收到来自MME的E-RAB RELEASE COMMAND( UE CONTEXT RELEASE COMMAND)消息,或eNodeB向MME发送E-RAB RELEASE INDICATION( UE CONTEXT RELEASE REQUEST )消息,且释放原因不为“Normal Release”,“User Inactivity”,“Partial Handover”,“Handover triggered”,“successful-handover”,“cs-fallback-triggered”时统计该指标。如果E-RAB RELEASE COMMAND消息中要求同时释放多个E-RAB,则相应指标按各个业务的QCI分别进行累加。
3.2 问题定位、解决方法

3.2.1 掉话排查基本步骤
首先需要在话统侧获取全网的掉话率指标以及趋势,掉话率趋势分析至少需要1~2周左右的数据,如果全网掉话率指标突然偏高,一般执行步骤:

1)是否全网问题:

对MME及eNB侧进行告警排查(传输,设备等告警)、观察期间是否实施版本升级

2)是否存在Top小区:

●小区级的掉话率指标和掉话绝对次数按从高到低的顺序进行排序,优先分析掉话绝对次数多而且掉话率高的Top小区
●对Top小区进行参数核查、告警检查等

●对引起掉话的Top原因进行定位分析

3)若是共性问题,将优化结果复制到全网

3.2.1 掉话问题定位、解决方法

Top1:参数对比

随机抽取部分站点的脚本与基线参数进行核对,对不一致的参数进行分析;

Top2:告警核查

1)是否存在传输告警:观察S1传输是否出现问题;

2)是否存在设备告警:观察eNB侧是否存在告警;

3)检查系统是否升级、打补丁等动作;

Top3:Top小区筛查

1)将小区级的掉话率指标和掉话绝对次数按从高到低的顺序进行排序,优先分析掉话绝对次数多且掉话率高的Top小区;

2)通常取每天掉话率高于平均指标的Top5小区进行分析,确定掉话的主要原因;

3.2.2 Top小区分析流程
1)获取小区级话统的掉话率指标及趋势,掉话率趋势分析至少1~2周左右的数据:

●如果小区的掉话率指标突然偏高,需要检查eNB侧是否存在该小区相关的告警信息,检测该小区所属eNB的告警,确认该小区是否出现故障等信息;

●常见的告警如RRU相关的告警,通道相关的告警,传输相关的告警,基带板相关的告警等;

2)分析CHR数据,获取导致掉话的各种原因的比例,按照比例从高到低的顺序分别针对不同的原因进行定位,并对各Top原因进行分析处理;

3)判断是否存在OM操作导致的站点复位,重启等导致的掉话;

4)检测是否有Top用户存在,如果有,需要对Top用户的log进行详细分析;

5)如果无法通过CHR数据定位解决的问题,需要通过抓取该Top小区内eNB侧的IFTS跟踪;

6)如果无法进一步深入分析,在需要使用测试终端进行复现,并抓取UE侧的log及内部打印信息进一步定位;

3.2.3 CHR原因统计

取每天的Top5站点通过InsightSharp对CHR数据进行分析,找到影响每个Top小区掉话率的主要原因:
3.2.4 CHR常见释放原因
3.2.5 Top用户排查

Top用户的确定

1)Top用户的判断主要是依据终端接入时上报的TMSI进行判定,华为核心网TMSI分配的机制是对于同一个IMSI用户,TMSI的右起第5位进行随机赋值,即某用户的TMSI中只有*指示的8bits位置发生变化,就是同一个用户,C0 6* 00 05;

2)TMSI可以通过CHR数据分析获取:
3.2.6 Top用户log分析
Step1:分析是否存在同频邻小区漏配或者错配导致的掉话;

Step2:分析是否存在弱覆盖导致的掉话;

Step3:分析是否由于切换来不及导致的掉话;

Step4:分析是否导频污染引起的掉话:

Step5:分析是否存在上行干扰导致的掉话:

如果掉话原因不是步骤1~5所述的原因,则很有可能是非RF原因导致的掉话,需要结合IFTS信息进一步定位;

如果是异常导致的掉话,则需要结合一键式日志、TTI跟踪等信息进行异常定位。

3.2.7 Top用户隔离定位

输入数据

1)eNB IFTS跟踪

2)UE TTI跟踪

3)UE侧路测log

4)eNB表口log

6)一键式日志

7)CHR日志
3.2.8 Top用户掉话分析四步曲

Step1:标口流程分析谁主动发起释放

1)eNB主动发起释放

eNB主动向核心网发起释放请求,收到核心网下发的释放命令后释放用户RRCConnRel、并向核心网反馈释放完成

2)核心网主动发起释放

eNB收到核心网下发的释放命令,释放用户RRCConnRel、并向核心网反馈释放完成

Step2:通过S1释放请求/命令中的释放原因值隔离掉话原因

1)无线侧原因触发释放

2)传输原因触发释放

3)NAS原因触发释放

4)协议原因触发释放

5)其他混合原因触发释放

Step3:CHR分析详细释放原因

Step4:复现问题抓取IFTS跟踪、UE侧Log,深度定位掉话根因

4 相关工具和信息获取方式

消息跟踪工具:
  

数据分析工具:
  

“切换测量控制”及“切换测量报告”消息的确认:
  

切换命令”消息的确认:

用消息查看软件,打开UU接口“切换测量报告”消息后面的一条RRCConnectionReconfiguration消息,便可打开消息查看其详细内容,以UE侧跟踪的消息为例:

重建请求消息发送“小区”的确认:

重建请求消息是发往哪个小区的,在网络侧通过跟踪文件比较容易确认,在UE侧可用消息查看软件查看UE侧UU接口“RRC_CONN_REESTAB_REQ”消息前的RRC_SIB_TYPE1消息,双击打开消息查看其详细内容
已有 2 人评分家园分 收起 理由
lelon + 1
litom2004 + 1 赞一个!

总评分: 家园分 + 2   查看全部评分

举报本楼

本帖有 27 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-5-22 09:57 , Processed in 0.439234 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部