通信人家园

 找回密码
 注册

只需一步,快速开始

搜索

军衔等级:

  上校

注册时间:
2006-12-6

家园09年十大网友 家园10年十大网友 爱心徽章,2011年为家园助学活动奉献爱心纪念徽章 家园11年度杰出网友 家园12年度杰出网友

发表于 2010-9-7 00:29:07 |显示全部楼层
如何用统计来讲故事

无论什么样的统计,最终所描述的内容不外乎几类要素:总体;集中趋势;离中趋势;统计分布;相关。随机过程提到过用特征数值来描述随机过程的方法,其中就包含了均值、方差、相关函数,随机过程的描述仍旧脱离不开统计描述的这几类要素。
Ø总体
在网络规划中的总体描述实际上就是对规模的描述。现网有多少基站、多少载波、多少信道、多少小区、总体的忙时话务量有多少,网络掉话次数有多少、数据流量有多少……,。实际上就是将每一类数据进行累加。
总体描述是最直观的统计,也是统计的根本。在网络规划中,我们使用总体描述来描述网络的规模,网络的成本以及网络的容量。这似乎是很简单的描述,即便数次,仍旧能发现一些内容值得玩味。
当我们在描述一个总体规模时,需要精确到什么程度最合适?比如,对于一个城市的网络扩容工程,如果根据某种预测方法的预测(如比较流行的线性内插法、或者曲线拟合法等等),得出需要新增4231.9Erl的忙时话务量。而实际上我们到底按4231.9Erl来描述和配置资源还是要按其他来描述。实际上,4231.9这个数值的意义并不是说真的需要增加如此数目的话务量,因为这个数值本身就不真实。如果有两个预测话务量数值,第一个人通过估算得出需要大约4500Erl,第二个人得出需要4231.9Erl,哪个人的估算更准确呢?大家似乎更加相信第二个人的估算,不过如果大家都做过类似的估算,我们心里就能明白,第二个人的结论是“被准确”的。有时,客户们并不喜欢看似简单粗略的数据,他们喜欢带有小数的“被准确”的数据。
那么,这个精确数值的目的主要是:1. 确定扩容规模的数量级;2. 证明规划所做的预测是科学的严谨的客观的。对于第一个目的,实际通过相对粗略的估算就能得到。因此,让数据“被准确”的更直接目的就是证明了。
很多时候我们通过累加的方式来统计总体数据。但是,当我们累加了数据,我们也累加了偏差,最终的总体数据看上去有零有整,但实际上没有什么意义。如果经过累加统计后说某省的载波总数为42319个,你要是真信了,那只能说明你跟上帝心有灵犀其实不如说大约4.3万到4.4万个更靠谱些,但你真这么说了,领导和客户又得批评你不够精确了。(我们可以举某个更直观的例子来说,比如我们说某国有厕所347865个,这个数肯定不准确,倒不如说有34万个左右更显诚实。当然,最巧妙的方法是周总理的方法:“厕所有两个,一个男厕所,一个女厕所。”)
因此,在现实的规划中,特别是对现状的描述和对未来的预测中,还是只好据“实”描述,“精确”描述。同时,我们心里要清楚,网络现状和预测都是统计的描述,这不是像计算神州5号的动力、能量的精确数值计算和设计,这是两码事。
Ø集中趋势的描述
对于集中趋势的描述,最常采用的方法是均值,即算数平均数。平均数是对单个个体的数值描述。在无法将一个一个个体都进行描述时,只好采用统计总体之后求平均的方法来描述单个个体的数值。在网络规划中,会频繁的使用均值,如平均每信道忙时话务量、平均通话时间、电波的平均电平、平均功率密度、……。
关于均值的陷阱,用这样一个打油诗可以充分的描述:“张家兄弟九个半,老大赚了一千万,剩下九个穷光蛋,如果一算平均数,各个都是“张百万””。之所以均值得到如此的误用(或者是刻意的误用),取决于于整个数值的分布。当均值同中位数接近时,认为均值可以描述整体数据的集中趋势,比如总体的分布是趋于正态的分布,则使用均值来描述集中的趋势最为合理。而如果总体的分布不是趋于正态的分布,是很偏的偏态分布(如指数分布、幂率分布等),则使用均值就可能是一个假象,因此才有老百姓收入“被提高”的现象(收入分布从来都不是正态的,要么就是指数的,要么就是幂率的)。
根据长期的采集统计和理论分析,普遍认为电波衰落是遵从对数正态分布,因此由之而推断的网络覆盖及相关的多个指标分布都可以用正态分布来判断,此时用均值描述网络质量最为合适。(从电波统计理论分析,电平的分布是用中位数来进行推断的,但是正态分布的中位数同均值一致)
对于话务理论而言,如何看待?比如,每信道忙时话务量,我们可以找一个城市的每个小区的每信道忙时话务量报表来进行分析。下图是将各个小区的每信道忙时话务量统计出来而呈现的分布图。
(图略)
上图的分布很难就某种特殊形式进行认定,但是就图形的形状而言,似乎属于略微的右偏态分布。之后我们可以再观察一下整个数值的均值和中位数:均值为0.416Erl/信道,中位数为0.436Erl/信道。这两个数值比较接近,因此,采用均值来描述每信道话务量(即网络利用率)还算可靠。如果我们将密集城区或者郊区再作为单独的总体来分析,则会更接近于正态分布。
由此我们可以看到,网络规划中对于集中趋势的描述,用均值(或数学期望)能够适用于大多数情况。不过,均值包括了数学平均、几何平均、加权平均等概念。多数情况下使用数学平均,但在描述如增长率、发展率等同趋势发展有关的数值时,采用几何平均更为合理;而对于多因素分值统计,如对多场景网络质量的总体评价,则可以按不同场景设定权重,并进行加权平均。
另外,不要忽略了其他描述集中趋势的变量,如中位数,中位数能避免“被平均”的现象出现。
说完了集中趋势的描述,并不表明统计描述的完备。因为我们还想知道整个数值到底有多集中,因此我们还会采用离中趋势的描述。
Ø离中趋势的描述
方差、标准差是离中趋势描述的主要参数。
对于离中趋势的描述还有其他的参数,比如全距、平均差。但是,人们普遍喜欢用方差、标准差来描述。
由方差、标准差的公式可以看出,方差实际上可以看作是均值分布的均值。采用平方处理的作用是代数运算的方便。同时,方差、标准差的好处还可以用三句话来说明:容易计算;具有可加性,能把总体的波动分解为不同要素的波动;受异常数据的变动影响最小。
在网络规划中,均值加标准差的描述最为常见,如在链路预算中的参数估计,在模型修正中的数值分析,在话务分布中的统计描述以及在网络仿真结果的统计分析。
按照切比雪夫的说法,当我们知道了一堆数据的均值和方差,我们就知道了这堆数据的范围和分布(切比雪夫定律)。
Ø分布的描述
统计分布同上边讲的概率分布如出一辙。概率分布的依据就是无数工程师多年的统计,由统计而发现规律。一般来说,我们可以根据数据的内在规律来猜测其分布。比如,大多数成熟网络指标统计的分布都可以近似于正态分布,因为大多数问题都是稳定在一个值周围,同时受到多个稳定的随机因素影响而波动;而对于总和一定,则统计分布呈负指数分布;对于离散形式的分布,则最为普遍的是二项分布,因为大量的离散事件都可以视为伯努利事件,当然,也可以从二项分布中,根据事件发生的概率,从而推导出泊松分布;……
Ø相关的描述
谈到相关,我记得以前上学时老师在考前划重点时说:“下周期末考试,我来给大家划一下重点,不过我要强调的是,划的内容同考试的内容相关系数为零。”当听到这句话,我们的第一反应就是这节课白听了,因为复习的内容跟考试的内容不相关,完全独立。这一度让我们很沮丧,因为大家已经逃了不少课,就指望划重点来考试及格呢。
统计中的相关说的是两个或多个统计事件题的关系,即指通过事件A的大量统计数值和事件B的大量统计数值的分析来观察这两个现象的相互关系。举个很直接的例子,小朋友1岁的时候,在后院里种了一棵小树,以后每隔一个季度就记录一下小朋友的身高和小树的高度,多年过去,对这两个事件形成了一定的数据,通过对这些数据进行相关分析,可以发现二者呈现明显的正相关(相关系数接近1,由此,我们可以推断:随着小朋友身高的变高,小树的高度也在变高。关系是很让人类重视的概念,自然科学的研究主题之一就是一个现象同另一个现象的关系,哲学的大量思辨也是针对关系的,我们对人际关系也最为重视。
通信网络中使用了大量的相关分析,这在网络规划中也经常提及,有时,我们采用种种手段让两个网元、系统、信道、码字等完全不相关,有时我们又通过分析两个指标的相关来进行规划和预测。在CDMA系统、WCDMA系统中最常使用的扩频码,一般认为,扩频码的自相关性和互相关性越接近于零,网络的性能就会越好;还有天线的分集,只有分集的相关性接近于零,才能实现分集增益;另外,话务量的预测分析中,也经常运用相关来分析话务量同用户收入、用户年龄、用户分布及资费的关系;在网络布局规划中,经常会用相关分析来观察不同指标的相关度,由此研究网络的性能。
相关分析能得到很多有意思的结果,比如:在一些特定场景(校园)话务量和用户收入并不相关,而跟用户年龄有一定的相关度;根据小区间的切换次数和同频干扰的相关度进行频率规划;……。对于相关的挖掘是在网络规划中创新的源泉。
由此,运用统计要素来讲故事则趋向于如下的套路:
某一事件的总体规模如何?遵从什么分布?均值和方差一般为什么?这个事件同其他事件的相关系数如何?


[ 本帖最后由 瑞士军刀 于 2010-9-7 00:32 编辑 ]

军衔等级:

  一级通信军士

注册时间:
2009-9-20
发表于 2010-9-8 21:17:04 |显示全部楼层
谢谢楼主的分享

军衔等级:

  下士

注册时间:
2009-7-22
发表于 2010-9-9 22:52:34 |显示全部楼层
顶下楼主先啊

军衔等级:

  少尉

注册时间:
2005-2-17
发表于 2010-9-10 12:12:35 |显示全部楼层

总结

总结:
科学和艺术是对立统一

军衔等级:

  上等兵

注册时间:
2010-8-19
发表于 2010-9-13 15:25:40 |显示全部楼层

3Q

刚进入这个行业,值得好好学习,谢谢楼主的引导~!

军衔等级:

  列兵

注册时间:
2010-5-20
发表于 2010-9-14 11:20:21 |显示全部楼层
理解精辟到位,受益匪浅

军衔等级:

  下士

注册时间:
2007-8-8
发表于 2010-9-17 10:27:36 |显示全部楼层

通俗易懂、言简意赅

军衔等级:

  中士

注册时间:
2009-6-10
发表于 2010-9-18 09:39:55 |显示全部楼层

军衔等级:

  列兵

注册时间:
2010-9-12
发表于 2010-9-19 17:36:47 |显示全部楼层
讲的真垃圾

军衔等级:

  上士

注册时间:
2008-6-12
发表于 2010-9-20 01:50:25 |显示全部楼层

回复 7# 的帖子

我也收取这样的东西了!

军衔等级:

  下士

注册时间:
2010-7-29
发表于 2010-9-23 15:56:19 |显示全部楼层
厉害。搬个板凳。

军衔等级:

  上士

注册时间:
2010-9-20
发表于 2010-9-24 11:07:46 |显示全部楼层
准备长期长期关注此贴!感谢楼主分享。

军衔等级:

  四级军士长

注册时间:
2006-4-7
发表于 2010-9-25 17:10:36 |显示全部楼层
顶下楼主!
写的通俗易懂、综合性很强,适合新手了解流程和环节,几乎把所有的环节讲到了,也不用对号入座,不同的项目适用不同的工作方法和解决方案,有些地方可能根本用不到。
如果有了几年经验,看起来更容易产生共鸣

军衔等级:

  中士

注册时间:
2010-8-16
发表于 2010-9-25 19:54:04 |显示全部楼层
刚接触不不太明白。

军衔等级:

  三级通信军士

注册时间:
2005-2-25
发表于 2010-9-26 08:41:50 |显示全部楼层






[ 本帖最后由 沉醉太平 于 2010-9-26 08:45 编辑 ]

军衔等级:

  上校

注册时间:
2006-12-6

家园09年十大网友 家园10年十大网友 爱心徽章,2011年为家园助学活动奉献爱心纪念徽章 家园11年度杰出网友 家园12年度杰出网友

发表于 2010-9-26 08:46:14 |显示全部楼层
做规划要测试吗?

    测试在之前提过多次,网络测试是网络规划必不可少的环节,不单单规划,从网络的规划、运营、优化整个的工作过程中,测试都在扮演着不可或缺的角色。在工作生活中,我们会遇到很多测试。尤其是在中国,会有一些令人作呕但又刻骨铭心、经常出现在梦中的测试,比如测试我们学习能力的高考,测试我们出国语言能力的托福。通过这种测试,来评价我们是否有资格进入国内国外的大学,也是给我们这些年学习的证明。
    网络测试的直接目的是采集数据,通过专用的仪表在网络的各个接口把抽样的数据提取出来。采集了这许多数据自然需要做进一步的处理。由此,网络测试主要有两个目的:网络评价和网络优化。
    网络评价是通过测试提取网络数据,并依据网络质量的指标来评价网络的质量;这跟考试很类似,考试成绩就是测试结果,由此来评价一个人是否够格上学、是否够格工作;网络评价实际上也是一种证明,通过评价来证明网络质量从而证明网络规划的意义和质量。一个中学生靠什么证明自己学习好,靠高考的成绩。
    网络优化是通过测试提取网络数据,从中寻找网络的问题,进而追根溯源,解决问题,优化网络;考试同样也有此作用,通过一次次考试,看看自己在哪些方面有问题和缺陷,之后优化自己的能力。
    因此,网络测试是一个质量保证和质量控制的工作,通过测试来证明网络是否有缺陷,通过测试来给网络挑毛病。如果站在网络规划的角度来看,规划实际上也是在“看病”,前边提到的现状分析、需求分析就是在找问题,问题怎么找?测试是个好方法。我们去医院看个病,比如咳嗽,医生怎么看?先开一堆检查单,验血、验尿、B超、心电图、核磁、活体检查、尸检(%#$^&*)……这也是用测试来找问题。
    网络测试除了用于保证质量、控制质量之外,还有一个更加特别的目的,就是研究网络的特点以找到规律,从而为规划和优化提供方法论。比如通过大量的测试和统计,而找到电波传播模型;通过大量的测试和统计,找到了话务流量模型;通过大量的测试和统计,找到干扰模型;……。
   
    功能测试测的主要是网络是否具备各种功能,比如切换,功能测试就主要测试是否具备各类越区切换的功能(软切换、接力切换、硬切换、小区间切换、BSC/RNC间切换、MSC间切换、由于质量所造成的切换、距离所引起的切换、功率余量所引起的切换、……),这种测试主要用于系统入网,一般在试验环境下实施(如实验室或者试验网)。功能测试一般只测有无,不测程度。
    性能测试则更加细致,是测试程度。以规划为目的的测试主要为性能测试。如覆盖性能测试,则是将网络模拟加载,通过路测,提取接收功率、发射功率、信干比、误帧率等指标的数值,由此评估小区覆盖的程度。性能测试的结果通常需要统计,并多次比较,同规划结果比较,同网络目标比较,通过比较找到网络的问题,进行质量控制。网络优化中经常做的路测、拨打测试则都可视作性能测试。性能测试贯穿于整个网络的建设、运营、维护、升级过程当中。
    网络的性能测试同功能测试往往难以分开,因为一个网络如果仅仅做功能测试,我们只能知道这个网络是个能打电话传递信息的网络,至于能否让用户感到满意则无从可知,那网络建设的性价比就太低了。想一下如果对汽车只是测试它有油门能加速、有刹车能减速、有方向盘能拐弯,之后就出厂,这一定是很不靠谱的测试。因此,在试验网中通常是就某一功能,同时进行功能测试和性能测试。由此来判断这个功能是否具备,能够达到什么程度,是否能满足指标的要求,会产生什么风险。
   

    就测试的环境可分为实验室测试、试验网测试和现网测试。
    实验室测试。实验室测试可以针对具体的网元、设备、器件以及网络的简单结构和接口进行测试。实验室所做的网络测试多为功能性测试,如切换,只能搭建少量基站而进行的切换功能测试。但是,对于不同的设备,实验室测试则可以确保设备的性能、质量、可靠性。(这里有必要区分设备性能和网络性能,二者的着眼点不同,设备性能着眼于设备本身的质量,网络性能着眼于网络搭建后的质量,设备性能是网络性能的必要条件。)尽管网络规划人员并不过于关注实验室测试,但是不少网络中所出现的质量问题,追根溯源是设备本身质量不过关,未能充分有效测试造成的。
    试验网测试。当重要的网络技术正式商用之前,如1800MHz系统、3G的多个制式、家庭基站等,都需要预先建设试验网。试验网是非商用小规模网络,非商用,指网络尚未面向公众,网络的用户均为试验用户,小规模,指网络一般布局在某一个城市或城市的局部,但既然已经成为网络,那就是麻雀虽小,五脏 俱全。各种网元全部搭建完毕,同时网络的规模能够实现规模用户的业务应用,网络覆盖能够实现多场景 多地形的综合覆盖。试验网的测试,是典型的网络功能+性能测试。长期的试验网测试可获取大量用于网络
规划的数据,同时,通过对网络参数的调整测试,能对网络商用后的一部分问题预先暴露,并预先解决。如果按照科学发展观的思路,最大程度利用试验网测试,可以发现很多网络规划优化中的问题。不过,在客户赶进度、压成本、要成绩的需求下,受到时间、资源、成本的限制,一些试验网测试更多的目的是为了证明,证明网络、网元设备是没有问题、可以商用的,这种以结果为导向的测试给网络的迅速商用铺平了道路,不过自然也隐藏了不少问题,这就为网络优化人员提供了工作量和工作机会。如果人都不得病那还要医生做甚,如果网络没什么问题,那网优这个职业也就消亡了。
    现网测试。拜网络本身的复杂性和不可预测性所赐,网络商用后,其问题会出现,会常常出现,会常常大量出现。因此,在现网中就会有更大量的测试。现网测试是典型的性能测试,就是要测量网络的覆盖性能、容量压力以及关键技术的性能。另外,网络的问题总是比较隐蔽,现象背后有原因,原因背后还有原因,找到问题的根源必须通过测试。至于我们所做的网络规划,如果我们不通过测试找到现网的问题、发现现网的问题,在规划过程中就没法有所侧重,做出的规划甚至会放大原来的问题。因此,在规划前期的调研时,如能直接找到网优测试的报告和结果,十分有助于我们对问题区域、问题话务的判断。另外,作为网络规划人员,进行必备的现网测试也是必须的工作,仅仅是纸上谈兵,规划成果的价值几许暂且不说,规划工作也会让客户怀疑。

    另外,还有必要提及的是关于实验和试验的异同。我们在测试中常常会提到实验和试验两个词。从某种程度上说,测试同实验或试验是可以划等号的。
    实验,即可控制的观察。通过实验来对理论、假设、假说进行贴合实际的检验,通过对实验因素的控制来对理论、假设进行验证、推测和反驳。因此,实验是需要精心设计,并可以逐步的调整、控制实验因素,比如:在测试中对基站负载的调整,以观察网络覆盖的效果变化。
    试验,是了解未知事物的功能、性能及影响的试探性操作。试验之前往往没有假设或假说,只是了解网络的部分性能。因此,试验是实验的前奏。有时,也可将试验作为实验的一部分看待。
由此,试验网与其名为试验网,更该名为实验网。因为在试验网中的测试,都可以对其因素进行多次调整控制,以更好的验证、推测网络的性能。而现网的测试则更像试验,因为很难对现网的要素进行控制,不能为了一次测试改变网络的结构,甚至不能改变功率、倾角的细微的要素。
    尽管试验网测试的结果更为全面,提供的数据更为丰富,但试验网有其本身的缺陷。将试验网结论同现网试验结合进行规划方是“本手”。


[ 本帖最后由 瑞士军刀 于 2010-9-26 08:50 编辑 ]

军衔等级:

  上等兵

注册时间:
2010-1-6
发表于 2010-9-27 17:30:56 |显示全部楼层
mark

军衔等级:

  少尉

注册时间:
2007-8-7
发表于 2010-9-28 15:28:01 |显示全部楼层
顶楼主,虽然我现在不做规划,看看还是很受益的

军衔等级:

  二级通信军士

注册时间:
2009-8-3
发表于 2010-9-28 21:34:53 |显示全部楼层
学习了

军衔等级:

  中士

注册时间:
2009-7-28
发表于 2010-9-29 09:25:09 |显示全部楼层
顶楼主,学习了!

您需要登录后才可以回帖 登录 | 注册 |

Archiver|手机版|C114 ( 沪ICP备12002292号 )|联系我们 |网站地图  

GMT+8, 2020-12-4 19:27 , Processed in 0.140625 second(s), 14 queries , Gzip On.

Copyright © 1999-2020 C114 All Rights Reserved

Discuz Licensed

回顶部