本帖最后由 cantjie 于 2023-3-9 08:47 编辑
本文内容是SIGCOMM2022年的一篇论文的内容总结概括,原文链接为:https://dl.acm.org/doi/abs/10.1145/3544216.3544219【图片虽然带着知乎水印,但也是自己的,不是未经授权的转载哈】
本文通过快手APP直播业务,测量了国内5G网络,特别是独立组网SA 5G网络的带宽、延迟、可靠性等的表现,并从端到端、无线接入网和核心网进行分析,最后提出了一种5G感知的视频缓存优化策略,帮助观众降低卡顿时长。
1. 背景与挑战既然是通信人论坛,背景就不用怎么提了,简单来说就是:(学术界)已有的很多测量工作都是在5G部署早期阶段进行的,主要集中在NSA 5G上,SA 5G的具体表现还有待测量验证。
![]()
因此,这篇文章与先前的工作不同之处便在于:1)从内容提供商视角出发进行测量和优化;2)包含并着重关注了SA 5G的表现。 我们使用快手的众包直播服务来测量 5G 网络。 上图的下半部分分别画出了视频流所经历的接入网、核心网和互联网部分。 ![]()
这种测量提出了许多挑战。 第一个挑战来自庞大复杂的在线系统本身。 它引入了如此多的性能指标和条件因素,应该仔细考虑才能使比较公平和结果具有说服力。 此外,数据收集可能对 QoE 产生的任何轻微负面影响都会影响大量用户,因此应该避免。 第二个挑战来自系统中的黑盒。 不仅来自多个供应商的CDN通常作为黑盒工作,而且核心网络的配置也很少向公众开放。 2. 测量方法![]() 测量包括两部分:被动部分和主动部分。 在被动部分,我们让用户每隔10秒将四种信息记录到日志中,并定期上传日志。 我们一年总共收集了超过一百 TB 的原始日志,并且很大一部分用户报告了 SA 5G 中的日志。 我们有超过一点七万亿的日志,其中超过 130 亿来自 SA 5G。 在2020年12月至2021年11月的采集过程中,对于5G设备用户,SA 5G日志占比从4%上升到25%以上。 那是六十多倍的增长。
![]()
在主动部分,我们使用 traceroute 命令。 我们首先选择大约 500 万最活跃的 5G 用户,然后分配 traceroute 任务。 当时在线的人将对选定的四个域名执行traceroute并报告结果。 注意,在中国,核心网很少响应traceroute请求。 因此,我们忽略了内部组件,仅通过第一个互联网跃点来估计核心网络中的网关。
3. 测量结果论文中的Measurement Results分为端到端、接入网和核心网三个部分。这里我们重新整理结果,给出结果的另一种看法(见图中左侧小目录)。 ![]() 5G 的一个关键承诺是减少延迟。 因此,我们首先检查连接建立延迟,这是启动延迟的重要组成部分。 我们发现,与 4G 相比,NSA 和 SA 5G 都减少了延迟。 SA 5G甚至可以和Wi-Fi相媲美,比NSA和4G好很多。
![]() 此外,我们检查了从主播到观众的整个传输过程,这对交互体验也很关键。 我们发现,与使用 4G 的用户和观众相比,任何一方使用 SA 5G 都会导致更低的延迟。
![]() 此外,在使用 4G 和使用 SA 5G 之间进行比较,我们发现没有转码的流(减少 600 毫秒)可以从 SA 5G 中获益更多(与转码的流相比:减少 237 毫秒)。 简而言之,原因是经过转码的流在互联网上的传播距离比没有转码的流更长。 因此,可以得出结论,SA 5G更多地受益于分布式系统。 这与我们的预期一致:更长的互联网传输距离将削弱 SA 5G 相对于 4G 的优势。
![]() 我们并没有就此止步。 我们进一步好奇 5G 的新结构如何有助于降低延迟。 因此,我们使用 traceroute 结果来回答这两个问题。 SA 5G 中的用户是否更接近互联网? 靠近互联网是否有助于减少 RTT? 对于第一个问题,我们找到了肯定的答案。 请注意,肯定的答案并不意味着用户迁移到大都市或放置服务器的地方。 这意味着核心网和互联网之间的网关更靠近 SA 5G 用户。 对于第二个问题,我们发现它取决于网关的路由策略。 为了回答第二个问题,我们定义了两个城市级别的距离。 即用户到网关的距离,以及网关到服务器的距离。 然后,我们看看RTT和这两个距离的关系。 对于给定的总距离间隔,我们使用线性回归来获得 RTT 与用户网关和网关服务器距离之间的斜率。
![]() 类似地,我们计算不同总距离间隔和ISP的结果。 我们发现,对于SA 5G,当总距离在三百公里以上时,RTT均与用户-网关距离负相关,而与网关-服务器距离正相关。 然而,4G 几乎显示出完全相反的关系。 这表明,在 SA 5G 中,将具有远程目的地的流量路由到本地互联网可能不是一个好主意。 相反,一个好的选择可能是将具有本地目标的流量路由到本地互联网(红线),同时将具有远程目标的流量路由到上层 UPF 以减少网关与服务器的距离(紫线)。
![]() 增强的可靠性是 5G 的另一个关键承诺,也与用户感知的卡顿情况高度相关。 我们发现 NSA 5G 和 4G 的性能差不多,而 SA 5G 比它们好很多。 这是因为可靠性更多地与控制平面相关。 因此,NSA 5G 和 4G 具有相似的性能,因为它们使用相同的 4G 控制平面,而 SA 5G 使用 5G 控制平面。
![]() 我们知道,handover,即用户移动导致服务基站发生变化,会造成可靠性下降。 因此,我们检查切换前后的卡顿频率。 我们首先发现,就在handover之前,卡顿频率已经高于全局平均水平。 这是因为用户通常在小区边缘获得更差的服务质量。 此外,我们发现大多数handover会立即增加卡顿频率。 因此,我们按百分比计算切换后的频率增加。 对于表示网络类型变化的垂直handover,NSA 5G 和 4G 之间的垂直handover对卡顿频率的增加最小,而涉及 SA 5G 的垂直handover则对卡顿影响最严重。对于水平handover,即在网络类型没有变化时。 SA 5G 增加缓冲频率最小,而 NSA 5G 最严重。 所以,我们说SA 5G对水平handover的容忍度更高。
![]() 我们还测量了5G的下载速度。 我们发现虽然SA 5G的下载速度远高于4G,但其下载速度在过去一年有所下降。 一个可能的原因是用户数量的增加。 我们从无线接入网的角度验证了这一点:我们发现随着接入密度的增加,SA 5G 的下载速度比 4G 下降得更快。
![]()
能耗是 5G 的另一个关键 QoE 问题。 我们使用用户可直接感知的电池电量下降率来比较不同网络类型、ISP 和比特率之间的性能。 一种观察是,性能与 5G SoC 高度相关,SA 5G 不一定比 4G 更耗电。 有关详细信息,请参阅我们的论文。
4. 讨论与增强![]() 首先,我们对5G时代的关键参与者给出了一些改进建议。 例如,我们鼓励内容提供商将服务器放置在离用户更近的位置,因为我们观察到 SA 5G 从分布式系统中受益更多。 我们还鼓励 ISP 仔细设计 UPF 的路由策略,其中应区别对待具有远程目的地和本地目的地的流量。
![]() (video presents the strategy more clearly. At 11:25 of the video, url presented above) 我们并没有止步于改进意见,还在SA 5G中进行了改进实验。 我们观察到单个卡顿的平均持续时间在所有网络中都是相似的。 我们认为这是因为5G的更高的带宽和更好的可靠性没有得到充分利用。 因此,我们修改了 SA 5G 中的卡顿恢复策略,以缓解未充分利用的情况。 原始策略(左)有一个固定的水位: - 当网络状况不佳时,缓冲区长度会减少。 当它短于一帧时,播放器卡顿。
- 网络恢复后,重新填充缓冲区。 当它到达固定的水位线时,播放器恢复播放。
我们认为在 SA 5G 中,更高的带宽和更好的可靠性意味着一旦卡顿开始恢复,就不太可能遇到另一个卡顿。 因此,较小的水位线即可满足要求,同时能节省用户的等待时间。 我们建议通过对策略应用加法增加和乘法减少来适当地降低水位。 - 因此,在缓冲区长度减少到小于 1 帧后,水位线在卡顿之前被乘以一个小于1的系数。
- 在网络恢复后,水位线会在继续播放之前增加一个常数。
在快手应用上,我们取三组用户,每组300万用户,在这样的策略执行了18天后,我们发现,我们的自适应策略可以将 SA 5G 中的卡顿比例减少 7 个百分点。
![]()
最后,我们通过给出一些要点总结。 - 对于延迟,我们发现与4G相比,NSA和SA 5G都降低了延迟,而SA 5G更多地受益于分布式系统。
- 对于可靠性,SA 5G 提高了可靠性,但 NSA 5G 的性能与 4G 相似。 而且SA 5G虽然切换更频繁,但对水平切换的容忍度更高。
- 对于带宽,SA 5G 显示出比 4G 更高的下载速度,但 SA 5G 对蜂窝用户的密度更敏感。
- 对于能耗,我们发现SA 5G并不一定比4G更耗电。 实际上,它与5G SoC高度相关。
|