通信人家园

标题: 不懂就问:腾讯的波分设备?  [查看完整版帖子] [打印本页]

时间:  2020-4-28 10:26
作者: Eer     标题: 不懂就问:腾讯的波分设备?

运营商集采用得上吗?

http://www.c114.com.cn/news/22/c20645.html


C114讯 4月28日消息(水易)5G时代的到来,叠加大数据、AI、物联网等新型技术的涌现,数据流量呈现爆发式增长。有数据预测,全球数据中心IP流量到2021年将会增长至20.6ZB。同时在数字经济的浪潮下,云应用场景激增,从全球范围来看,到2021年云数据中心流量将达到总数据中心流量的95%。


数据流量的激增,也就意味着需要更快的部署带宽资源来满足业务要求。归根结底是要多快好省的部署数据中心,无论是在设备成本上还是在后期运维成本上都需要寻求一个最适合数据中心服务运营商自身的解决方案,实现目标的最大化。


基于这样的背景,作为国内公有云的头部厂商,近日腾讯云宣布推出自研光传输设备TPC-4平台(Transponder platform chassis),该设备能够有效提升数据中心之间的互联效率,同时降低传输设备和带宽的整体成本,进而为云上客户提供更高性价比的跨数据中心部署方案。



日前,腾讯波分网络团队接受了C114的专访,从腾讯开放光网络平台(TOOP)的持续演进的角度,以及腾讯对于自研开放光网络设备的初衷,对腾讯云业务发展的推动作用进行了解读。


直面挑战,推进TOOP持续演进


互联网时代,尤其是移动互联网时代,层出不穷的应用被创造出来,便捷了我们的生活,提升了效率。不过在这背后需要消耗海量的数据流量,而随着5G万物互联时代的到来,流量的需求迅速增长。对于云服务提供商而言,必须要以更快的速度部署越来越多的带宽资源。


早期的数据中心建设,往往采用的是传统光传输网络系统供应商的设备,被深度锁定。但是,传统光传输设备由于不同厂商设计差别较大,没有统一标准,部署和运维难度大、时间长,成本也不易控制。也会在出现故障或者需要扩容时,由于供应链的不灵活而耽误业务发展。


为此,腾讯一直在积极推进开放光网络理念,寻求解除传统供应商的锁定,同时推动变革,优化能力资源配置,构建更为高效的问题处理机制,有效提升光网络的运营效率。


“我们对于开放光网络的整体规划其实是始于18年,那一年我们启动了TOOP(腾讯开放光网络平台),” 腾讯波分网络团队表示:“从光网络角度来看,自研该平台是因为在面对数据中心互联带宽的高速增长前,我们没有更好的解决方案来应对如此爆发式的增长,传统设备的局限性愈发凸显,因此我们走上了自研的道路。”


基于TOOP的发展目标,腾讯团队通过总结长期以来在数据中心互联应用实践中积累的经验,秉承开放互通,简化部署运维,长期演进理念,打造了光层的OPC-4(开放光层平台)和电层TPC-4(开放电层平台)。据悉,光层和电层平台共享同样的机架和背板设计(T2X4C8),可以实现独立光层,独立电层或光电混合应用,从而减少重复研发成本,并加速研发速度。


“不过,随着网络规模化增长,相比设备购买成本来说,运营成本是更可怕的,集中化控制是光网络乃至整个网络的未来。”腾讯波分团队表示,因此腾讯自研TOC光网络控制器,能够无差异的管理自研的OPC-4光层产品,以及商用的例如主流的华为中兴诺基亚以及自研TPC-4电层产品,实现真正的单一控制器无差别的管理多厂商设备。


至此,TOOP完成了从光层到电层以及控制器的开放光网络平台搭建。该团队表示,目前TOOP的OPC-4光层产品以及TOC控制器已经在腾讯数据中心内规模部署,TPC-4已经实现在实验室的端到端业务试验验证,预计下半年会开始在数据中心内部署。


技术先行,价值回归根本


腾讯自研开放光网络设备的背景是,传统商用的光传输设备在数据中心场景下的局限性,无论是设备成本,还是多厂商设备由于设计不同、标准不同造成的部署和运维时间成本,都无法满足高速增长的流量需求下,高效部署带宽资源的需求。


“我们做TOOP时定下了一个愿景,‘让价值回归其根本,让技术回归其应有的位置。’” 腾讯波分团队指出,“如果我们做光网络产品,一定做一个比商用系统好用的产品,包括在成本上帮助我们节约CAPEX和OPEX即资产采购成本和运营成本。我们深知越庞大的网络其运营成本越可怕。”


结合这一愿景,腾讯团队开始对波分设备做减法。据介绍,腾讯的自研产品可以让完全没有波分专业知识背景的人员无障碍的操作、安装波分设备,并极大的减少错误操作的可能。同时借助TOC控制器带来的自动化提升,实现快速安装及部署,缩短交付时间。“这些优势让我们的用户可以在扩容资源时更快的获取资源,无需漫长等待,同时在遇到故障时用户受损的风险会更小,系统的可靠性会进一步提升。”


可以看到,相对于传统商用产品,腾讯自研设备最大的优势在于,其更适应于腾讯自有数据中心的互联场景需求。腾讯团队表示,“没有人比我们更了解我们自己的需求是什么,因此我们设计产品得天独厚的优势就是我们的产品会更适合我们的场景。”


腾讯团队将所有的业务板卡和核心模块统一设计为现场可替换模块,电层板卡在线路口和客户接口均采用可插拔模块设计,从而实现最大程度的“随增长而付费(pay-as-you-grow)”的部署模式。这样的开放式可插拔硬件设计不仅有利于选用创新产品与一些高品质器件,同时在故障时也是单独更换,从而缩小故障域范围。


除此之外,相比商用系统来说,腾讯自研的开放光传输设备在硬件层面原生支持1秒及telemetry的性能采集。“我们头一次彻底的在微观层面,在秒级尺度上进行了故障描述。” 腾讯波分网络团队表示,这解决了以往瞬间业务丢包时,统一将故障归类为光缆抖动的粗略描述。“但是现在,我们可以在光域、电域内进行更微观尺度的检查,精准定位到底是光缆真的发生了瞬间的抖动还是激光器存在异常,将业务中断造成的损失降至最低。”


面向未来,腾讯波分网络团队认为,在光网络方面,集中化控制,智能化故障判断,故障提前预判这三个方面继续成为主流。而腾讯光网络的自研目标就是打造一个更服务数据中心场景需求,更贴近用户的产品。


“更加智能化、更低功耗、绿色环保的云服务基础设施在某种意义上是对社会资源的一个节约。同时,光网络设备的开放对产业上游的企业带来更多需求,有利于整个产业链生态的发展。”腾讯波分网络团队表示:“当然,对于腾讯来说,探索更加深度的核心技术也是每一个腾讯技术人所渴望的事情。”


时间:  2020-4-28 11:01
作者: xuqz

对比运营商,买买买
时间:  2020-4-28 11:09
作者: z3326

这个波分组在哪?
时间:  2020-4-28 11:25
作者: 非法用户

BAT们用的波分和运营商用的波分定位和功能上不尽相同,运营商的需求是包含了BAT们的。

运营商不是没有能力去研究,和BAT们类似,目前主要集中在软的方面,硬的方面还不行,还得通过合作或并购来实现
时间:  2020-4-29 07:09
作者: ospf666

和诺基亚贝尔合作研发的
时间:  2020-4-29 07:54
作者: 大头you

非法用户 发表于 2020-4-28 11:25
BAT们用的波分和运营商用的波分定位和功能上不尽相同,运营商的需求是包含了BAT们的。

运营商不是没有能 ...

运营商确实没有能力去研究。别的不说,运营商怎么养高水平的开发人员,不是说没有钱养,而是制度设计就不允许存在这样的高薪工人,吃大锅饭才是本质。
时间:  2020-4-29 09:20
作者: hechen0001

自研有点儿过了,说定制更符合实际
时间:  2020-5-9 17:27
作者: mipha

转载下,腾讯波分团队专家进一步的解答

TOOP竞争优势体现在哪里呢?控制器?

答复:TOOP竞争的整体优势体现在,降成本并非通过应用廉价器件的方式,而是通过系统方案来增加竞争力,光电解耦厂商电层设备降价积极性提高,毕竟没有扩容的既得利益,所有需求都变为新建。
另外电层可插拔dco方案,解决了相干器件的成本问题,毕竟做模块的供应商及潜在供应商的数量多于系统厂商,同时模块的出货量和功耗均相比传统5x7MSA模块有一定优势,做减法,同时控制器实现集中化控制,TOOP的控制器是全球第一家实现1秒全量PM数据telemetry的控制器,对于运营来说,以前光缆抖动一下,你都不一定在网管上可以看到其事件,比如U2000,经常的15分钟性能并没有显示瞬间抖动的数据,或者多跨段需要查询半天定位原因,现在我们端到端一个界面在秒级尺度下很清楚的看到那一刻到底方式了什么,比如EDFA in功率降低了,随后恢复,对端发射功率没有异常,osc也同样情况,则判断为光缆抖动。

如果EDFA的泵浦激光器发生异常,也可以很容易看到,不再将故障统一归属于某一个非根因的故障。楼上有朋友反映,最好云的服务,这些事情就是在最好云的基础资源可靠,可能腾讯现在是唯一的可以在这个精细化级别去做光网络运营的云服务提供商,故障不可避免,如果产生故障我们可以提高故障排除的时间,从某种意义上来说是一种挽回损失的办法,同时,toop的价值更多的在于未来这些精细化管理的数据,是不是可以提供故障预判?看到光缆损耗劣化符合中断事件预期,可以做一些避免故障发生了再弥补的事情,这些事不是一蹴而就的,也是每一个模块,每一个点去用心做的结果,我们相信DCI应用的痛点是一致的

时间:  2020-5-9 17:27
作者: mipha

“传统光传输设备由于不同厂商设计差别较大,没有统一标准,部署和运维难度大、时间长,成本也不易控制”这个结论怎么来的?这两厂家的设备没有遵从ITU-T的标准吗?
答复:这里说的标准没有统一并不是指OTN标准,是系统设计,每个厂商都参照ITU标准设计设备,但是管控逻辑,信号流,功能细节有很大区别,举个简单的例子,Nokia有wavelength tracker,华为直到最近在OSN908上才做了类似功能的波长trace id功能,zte还没有类似功能,有人问没有这个功能有什么问题吗?还便宜?,

好问题,一个8维度节点,来自8个不同方向的196.05这一波,没有波长不带id的情况如果现场布线施工错了,如何区分哪个196.05是那个方向过来的呢?另外端口的管理状态也不一样Ciena,Nokia的端口支持三种状态enable/maintenance/disable,国内厂商只有up/down两种,对应控制器开发问题就很麻烦,maintenance的LED显示另外两家没有,现场的同志也会不理解这是major告警了?还是维护状态提示?光放Nokia双向光放内置了OSC,单向光放在光放板卡上插sfp的osc,华为需要有FIU合并osc,这些差异性对同一个运维人员在同时维护多厂商时面临的问题就是系统设计标准不统一,毕竟ITU没有推出样机让大家去参考,即使有,每家的专利,系统设计水平也有差异,结果就是不利于集中化控制和简易运营


时间:  2020-5-9 17:54
作者: CTUSER

xuqz 发表于 2020-4-28 11:01
对比运营商,买买买

一个是花公家的钱,采办爽呢。
一个是花自家的钱,抠门啊

时间:  2020-5-11 18:08
作者: lfc1987

ospf666 发表于 2020-4-29 07:09
和诺基亚贝尔合作研发的

是的,对于控制器来说是这样的,国内很棒的团队,他们成都团队的小伙伴确实是国内少有的很不错的团队,提供了很大的支持!
不过,这么长时间了,就和魔兽世界重制版和魔兽世界05年版本一样,同一款游戏但后面很多内容是有变动的,但和硬件没有任何关系,这一点可以确认
时间:  2020-5-11 18:17
作者: lfc1987

hechen0001 发表于 2020-4-29 09:20
自研有点儿过了,说定制更符合实际

是的,很高兴有同志们质疑,其实我们也希望大家能对自研来个正名,如果将PCBA的设计也算进去,那可能主流厂商没有几个能叫自研发的,大部分也会做外包设计,当然再深入一步,或者换个思路,按照核心器件占比的分类方式,如果真的把TROSA,DSP全做了的叫自研设备,毕竟这些器件占比超过成本70%,那可能国内只有一家可以称之为自研设备
时间:  2020-5-19 09:53
作者: hechen0001

lfc1987 发表于 2020-5-11 18:17
是的,很高兴有同志们质疑,其实我们也希望大家能对自研来个正名,如果将PCBA的设计也算进去,那可能主流 ...

我是这么理解这件事的,设备的开发能力大概有这么几个等级:

1. 设备关键/核心模块自研。

2. 硬件设计(集成) + 软件系统软件自研。

3. 需求设计(设备硬件形态、参数、功能;软件性能、接口...)

第3类不能算传统意义上的自研,如果算进去,很多主流运营商都可以宣称自研了。因为运营商实际上多年前也在折腾这些事儿,不过没有做解耦。

网管和运营系统的自研应该是设备自研的平行层面,相信互联网企业在这方面是有优势的

btw,你是腾讯的lfc?




通信人家园 (https://www.txrjy.com/) Powered by C114