通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大校

注册:2008-9-8488
跳转到指定楼层
1#
发表于 2022-7-4 22:02:27 来自手机 |只看该作者 |倒序浏览
本帖最后由 关东黑土豆 于 2022-7-5 07:53 编辑

当地时间7月2日凌晨1点35分开始,日本运营商KDDI的移动网络发生大规模通信故障,导致全日本范围内无法拨打电话、无法收发短信、数据通信变慢。

此次事故影响范围大,持续时间长,影响用户数量达3915万,故障一直持续到7月4日下午才基本完全恢复,给日本全社会造成了极大的不便和损失,也是KDDI有史以来遭遇的最大一次网络系统故障。

故障发生后,KDDI高层及时召开新闻发布会,向广大深受影响的个人和企业用户鞠躬致歉,并表示考虑赔偿损失。

那究竟是什么原因造成了此次大规模通信故障?看完KDDI的报告后,发人深省。

故障原因一:
核心路由器割接失败

7月2日凌晨,KDDI组织工程师对连接全国移动核心网和中继网络的一个核心路由器进行割接,将老旧的核心路由器更换为新产品。

不幸的是,通信人最担心的噩梦发生了——割接失败了。在更换核心路由器的过程中,新的核心路由器出现了不明原因的故障。

640?wx_fmt=jpeg

搞通信的伙伴们都知道,核心路由器位于网络核心位置,是整个网络的“交通枢纽”,不仅性能强悍、价格昂贵,且需时时刻刻保持稳定运行,否则,一旦出现问题,动辄可能影响全网数百万甚至数千万用户。

正因如此,核心路由器割接好比为活人换“心脏”,是一项极具挑战的工作,也对要更换的新产品的成熟性、稳定性、互联互通性等能力要求极高。

但KDDI偏偏在这项要求极其谨慎的工作上掉了链子,接下来的后果当然就相当严重了——

由于新核心路由器无法将语音流量正确路由到VoLTE交换节点,直接导致部分VoLTE语音业务中断15分钟。

故障原因二:
信令风暴击溃VoLTE网络

核心路由器割接失败,这场景简直不敢想象,隔着屏幕都能吓出冷汗!

怎么办?赶紧回退呗。KDDI的工程师们快速启动了回退操作,于7月2日凌晨1点50分将连接重新切换回旧的核心路由器。

但更大的问题发生了。

640?wx_fmt=jpeg

回退后,“由于VoLTE终端每50分钟进行一次位置注册”,大量终端向VoLTE交换节点发起位置注册信令,以重新连接至网络。海量信令集中突发,很快引发VoLTE交换节点拥塞,致使大量用户无法进行VoLTE通信。

同时,移动网络中有一个“用户数据库”,负责存储用户的签约数据和位置信息,由于VoLTE交换节点拥塞,“注册在用户数据库的位置信息无法反映在VoLTE交换机上”,出现数据不匹配问题,也导致很多用户无法通信和拨打电话。

针对此情况,KDDI于7月2日凌晨3:00后开始从无线侧、VoLTE核心网侧同时实施流量控制策略,以及通过断开PGW的方式减轻用户数据库负荷,以缓解网络拥塞,并在PGW采用“会话重置”措施解决用户数据库中的数据不一致问题。

640?wx_fmt=jpeg

因为实施流量控制,接下来导致了全国范围内的数据通信和语音通话难以连接。

接下来,KDDI开始紧张的网络恢复工作。7月3日上午11点,KDDI宣布日本西部基本完成网络修复工作。下午5点30分,日本东部基本完成。但仍然有一些用户难以进行数据通信和语音通话。

640?wx_fmt=jpeg

直到7月4日下午4点,距离故障发生62个小时后,KDDI表示已在全国范围内基本恢复。

发人深省

类似的重大网络故障在日本并不是头一次。

2021年10月14日,日本另一家运营商NTT DoCoMo的移动网络也发生过全国性的重大通信事故,导致大量手机用户无法进行通话和数据通信。

此次事故同样因为割接失败后回退操作,引发信令流量大爆发,导致网络大拥塞。

具体情况是,NTT DoCoMo在替换用于存储物联网终端设备的用户和位置信息的网络设备时出现了问题,然后立即启动回退操作,重新倒回到旧设备。

但这一回退操作,引发了大量物联网终端向旧设备重新发起位置注册信息,汹涌而来的“信令风暴”快速引发了网络拥塞,并波及3G/4G/5G网络的语音和数据分组核心设备,导致大量用户无法通话和数据通信。

与NTT DoCoMo不同的是,KDDI此次是因为核心路由器割接失败引起,而且故障持续时间要长很多。

但值得一提的是,KDDI似乎并非没有吸取DoCoMo的教训。

KDDI在全日本范围内拥有6个交换中心,共18个VoLTE交换节点,且交换中心内的VoLTE交换节点是相互冗余备份的。而本次因核心路由器割接导致VoLTE业务中断的只是其中一个交换中心的VoLTE交换节点。

“我们做过压力测试,因为有冗余备份,即使一个交换中心范围内的所有终端同时发起重新连接请求,也不会发生拥塞。”

KDDI表示,“但不知道什么原因,结果还是发生了拥塞,我们还没有完全搞清楚到底是哪里出了问题。”

但愿KDDI最终能彻底找出此次事故的所有原因。也希望通信业再也不要重蹈覆辙。因为,重大网络故障,这六个大字,对于通信业而言,实在太可怕了。

举报本楼

军衔等级:

  大元帅

注册:2016-5-52981
2#
发表于 2022-7-4 22:42:21 |只看该作者
通信界太落后,互联网界就不会发生,为啥?

因为互联网界经常搞秒杀。秒杀大家都知道,瞬间大流量冲击,流量密度是平时的100~1000倍。

如果一个系统,能扛的住秒杀的瞬间大流量冲击,那平时发生点流量冲击,根本就不叫事儿了。

互联网界通过人为制造流量洪峰,检验了系统的稳定性。

点评

ets88  因为互联网是寄生在通信网上的  详情 回复 发表于 2022-7-5 09:17

举报本楼

军衔等级:

  上尉

注册:2014-8-3083
3#
发表于 2022-7-5 07:07:10 来自手机 |只看该作者
KDDI竟然要赔偿用户,万恶的日帝!

举报本楼

军衔等级:

  三级通信军士

注册:2012-8-864
4#
发表于 2022-7-5 09:06:22 |只看该作者
太脆了。

举报本楼

军衔等级:

  一级军士长

注册:2007-11-2616
5#
发表于 2022-7-5 09:17:55 |只看该作者
马云的云 发表于 2022-7-4 22:42
通信界太落后,互联网界就不会发生,为啥?

因为互联网界经常搞秒杀。秒杀大家都知道,瞬间大流量冲击, ...

因为互联网是寄生在通信网上的

点评

damocles931  有没有一种可能,寄生的因为过于强大,加上本体不思进取大话连篇,早已可以并合本体,但被某种神秘力量阻止了?  详情 回复 发表于 2022-7-5 09:59

举报本楼

军衔等级:

  二级通信军士

注册:2021-8-1226
6#
发表于 2022-7-5 09:20:24 |只看该作者
所以新设备是哪家的?

举报本楼

军衔等级:

  一级军士长

注册:2013-6-1657
7#
发表于 2022-7-5 09:44:26 来自手机 |只看该作者
lusty 发表于 2022-7-5 07:07
KDDI竟然要赔偿用户,万恶的日帝!

别这样说,kddi在日本是老二,如果电信出现此类故障,别说全国,哪怕就整个上海,工信部罚得塔妈都不认得,而且电信也会赔偿用户。加之电信领导仕途到头了。

举报本楼

军衔等级:

  列兵

注册:2020-5-133
8#
发表于 2022-7-5 09:59:21 |只看该作者
ets88 发表于 2022-7-5 09:17
因为互联网是寄生在通信网上的

有没有一种可能,寄生的因为过于强大,加上本体不思进取大话连篇,早已可以并合本体,但被某种神秘力量阻止了?

点评

ets88  告诉你吧,这种“神秘力量”就是互联网本身,因为他们看不上通信行业的“重资产”模式。看看Google Fiber ,半死不活的!  详情 回复 发表于 2022-7-8 10:08
老周部落  美国 Google 公司的 Google Fiber 做的也一般吧。 而且互联网也看不上运营商这种重资产+低收益行业,唯一想搞的也就是自建骨干网和运营商平等 Peering 互不结算。  详情 回复 发表于 2022-7-5 10:24

举报本楼

军衔等级:

  大元帅

注册:2016-5-52981
9#
发表于 2022-7-5 10:19:40 |只看该作者
ets88 发表于 2022-7-5 09:17
因为互联网是寄生在通信网上的

VoLTE不也是寄生在底层通信网上的?VoLTE就是运营商版的简化微信。

举报本楼

军衔等级:

  中校

注册:2012-5-2582
10#
发表于 2022-7-5 10:24:14 |只看该作者
damocles931 发表于 2022-7-5 09:59
有没有一种可能,寄生的因为过于强大,加上本体不思进取大话连篇,早已可以并合本体,但被某种神秘力量阻 ...

美国 Google 公司的 Google Fiber 做的也一般吧。
而且互联网也看不上运营商这种重资产+低收益行业,唯一想搞的也就是自建骨干网和运营商平等 Peering 互不结算。

举报本楼

军衔等级:

  大元帅

注册:2016-5-52981
11#
发表于 2022-7-5 10:26:58 |只看该作者
老周部落 发表于 2022-7-5 10:24
美国 Google 公司的 Google Fiber 做的也一般吧。
而且互联网也看不上运营商这种重资产+低收益行业,唯一 ...

美国挖沟架杆太费劲,所以Fiber不好铺,这不是谷歌一家能解决的,所以mmWave的5G被当成WTTH用。

点评

老周部落  国内能解决各种奇葩物业的也是神人啊,更别说现在有些市区的管井资源只租不允许自建之类的事情了。 所以我觉得互联网专注自己的高收益业务,烂摊子交给运营商处理算了。  详情 回复 发表于 2022-7-5 10:33

举报本楼

军衔等级:

  大元帅

注册:2016-5-52981
12#
发表于 2022-7-5 10:27:15 |只看该作者
老周部落 发表于 2022-7-5 10:24
美国 Google 公司的 Google Fiber 做的也一般吧。
而且互联网也看不上运营商这种重资产+低收益行业,唯一 ...

美国挖沟架杆太费劲,所以Fiber不好铺,这不是Google一家能解决的,所以mmWave的5G被当成WTTH用。

点评

Colombia.2005  不仅是挖沟不容易,接线跳线都太烦了,而且这些事情不太容易搞成自动化,所以GOOGLE fiber失败了。  详情 回复 发表于 2022-7-5 16:51

举报本楼

军衔等级:

  大元帅

注册:2016-5-52981
13#
发表于 2022-7-5 10:27:34 |只看该作者
老周部落 发表于 2022-7-5 10:24
美国 Google 公司的 Google Fiber 做的也一般吧。
而且互联网也看不上运营商这种重资产+低收益行业,唯一 ...

美国挖(敏感)沟架杆太费劲,所以Fiber不好铺,这不是Google一家能解决的,所以mmWave的5G被当成WTTH用。

举报本楼

军衔等级:

  大元帅

注册:2016-5-52981
14#
发表于 2022-7-5 10:27:51 |只看该作者
老周部落 发表于 2022-7-5 10:24
美国 Google 公司的 Google Fiber 做的也一般吧。
而且互联网也看不上运营商这种重资产+低收益行业,唯一 ...

美国挖沟架杆太费劲,所以Fiber不好铺,这不是Google一家能解决的。

举报本楼

军衔等级:

  大元帅

注册:2016-5-52981
15#
发表于 2022-7-5 10:28:08 |只看该作者
老周部落 发表于 2022-7-5 10:24
美国 Google 公司的 Google Fiber 做的也一般吧。
而且互联网也看不上运营商这种重资产+低收益行业,唯一 ...

所以美国毫米波5G被当成WTTH用。

举报本楼

军衔等级:

  上校

注册:2018-11-19505
16#
发表于 2022-7-5 10:30:31 来自手机 |只看该作者
我只想知道倭国那边是怎么个管理模式,会不会对技术部门或相关技术人员进行处罚。如果有,怎么个处罚法?

点评

termite2013  土下座  详情 回复 发表于 2022-7-6 08:56

举报本楼

军衔等级:

  中校

注册:2012-5-2582
17#
发表于 2022-7-5 10:33:21 |只看该作者
马云的云 发表于 2022-7-5 10:26
美国挖沟架杆太费劲,所以Fiber不好铺,这不是谷歌一家能解决的,所以mmWave的5G被当成WTTH用。

国内能解决各种奇葩物业的也是神人啊,更别说现在有些市区的管井资源只租不允许自建之类的事情了。
所以我觉得互联网专注自己的高收益业务,烂摊子交给运营商处理算了。

举报本楼

军衔等级:

  大元帅

注册:2016-5-52981
18#
发表于 2022-7-5 10:34:30 |只看该作者
老周部落 发表于 2022-7-5 10:33
国内能解决各种奇葩物业的也是神人啊,更别说现在有些市区的管井资源只租不允许自建之类的事情了。
所以 ...

是的,谷歌搞Fiber的时候,运营商还都是xDSL呢,当运营商也搞Fiber的时候,谷歌就不搞了,没必要跟运营商竞争。

举报本楼

军衔等级:

  三级军士长

注册:2004-11-1779
19#
发表于 2022-7-5 10:35:02 |只看该作者

举报本楼

军衔等级:

  三级军士长

注册:2019-9-11182
20#
发表于 2022-7-5 11:18:13 |只看该作者
通信网络越来越脆弱了。今后还会发生更大的事故,过于集中带来的隐患的一次爆发

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

Archiver|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-4-19 19:00 , Processed in 0.170587 second(s), 19 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部