ABB
关注中国自动化产业发展的先行者!
CAIAC 2025
2025工业安全大会
OICT公益讲堂
当前位置:首页 >> 案例 >> 案例首页

案例频道

基于在网计算NACA的边缘算力负载均衡方案
  • 企业:    
  • 点击数:205     发布时间:2024-04-15 18:33:30
  • 分享到:

中国移动研究院姚柯翰,刘鹏,李志强,陆璐

1 目标和概述

1.1 目标问题

在客户边缘云场景中,云厂商会将公有云的基础设施(包括服务器、网元设备)压缩到一个体积较小的机柜中对客户输出,例如AWSoutposts边缘机柜,如图1所示。

image.png

图1 AWS outposts边缘机柜

在这种部署在客户生产现场的客户边缘云场景中,云厂商不能完全基于传统公有云的scale-out策略通过不断叠加x86NFV网元来提升网络的处理性能。在这种情况下,边缘服务提供商所能提供的算力资源非常宝贵,需要尽可能提升有效算力提供的能力。但现有边缘计算解决方案往往会面临多核CPU计算核心负载不均衡的问题,有效算力较低,且一旦为burst流量提供服务,会发生大流打爆单一计算核心的瓶颈问题,造成整体服务质量劣化,如图2所示。

image.png

图2 边缘云应用场景

1.2 解决方案

为了将机柜中有限的空间预留给租户的虚拟机,机柜中尽可能会将空间提供给服务器,可能压缩网元所消耗的机柜空间占用。在这种情况下,可编程云网关提供了一个网元压缩的可能性。可编程云网关的网元压缩体现在两个方面:

(1)数据平面功能可以通过交换芯片的高性能实现,从而将多个网元的高速处理集成到交换芯片中;

(2)可编程云网关的CPU资源可以处理因为设备表项资源受限而出现的交换芯片不命中的流量,以及NFV网元首包的处理。

利用数据平台高速处理能力协助实现CPU核心负载均衡,负载均衡可以带来两个好处:(1)系统性能更加稳定,打爆现象得到缓解;(2)可编程云网关的CPU利用率可以得到提高,即不需要为了防止出现打爆丢包的情况预留空余的CPU资源,从而进一步提升了边缘网关的集成度。

基于高性能可编程交换芯片设计的在网计算功能,解决了可编程交换芯片的速率和CPU的速率差距较大引发的系统不稳定问题,提升了系统性能及稳定性,并进一步提升了边缘网关集成度,将多种网络功能及处理能力从多台服务器集成到异构融合网关中,可实现在网计算、降本增效。

2 方案介绍

2.1 系统架构

image.png

图3 基于在网计算的边缘负载均衡系统架构图

系统架构(如图3所示)的主要设计理念如下:

(1)充分利用新型异构算力设施中的网络交换资源实现在网计算,设计面向异构算力设施的新型“Run-toCompletion”计算架构,解决通过RSS投送计算任务导致核间负载不均衡的问题,总体提升边缘算力设施的计算效率。

(2)通知响应机制,使得调度模块感知到CPU的使用率,实现新到达流量的CPU选定以及后继流量与CPU的映射绑定及维护状态一致性。

系统实现方案主要包含3个部分:

(1)设计精准CPU负载感知协议并周期性传递至交换芯片,交换芯片将负载信息更新至对应的转发表项;

(2)在可编程交换芯片设计精准负载均衡算法,根据CPU实时负载信息分配任务;

(3)设计特定的数据面过载保护算法,将burst流量进行识别标记,通过限速机制防止正在服务的CPU核心被冲击损坏。

2.2 软硬件平台

硬件平台:Tofino交换芯片,多核至强CPU核心;

软件平台:Linux操作系统/Sonic操作系统,交换芯片支持P4Runtime进行配置,CPU支持DPDK进行软件编程。

2.3 测试结果

image.png

图4 测试结果:负载均衡度优化

image.png

图5 测试结果:过载限速保障CPU核心0打爆

如图4所示,相较业界主流负载均衡算法RSS使用哈希方式随机投递,采用基于在网计算的负载均衡算法可以有效提升CPU负载均衡度,平均提升了38%。同时,如图5所示,该创新方案可以有效避免burst流量冲击CPU核心从而造成丢包以及服务中断,为提供可靠稳定的边缘服务提供了保障。

3 代表性及推广价值

3.1 技术创新

面对边缘算力负载不均衡的问题,中国移动研究院首提基于在网计算的核间调度算法,完成算法仿真评估,并基于CPU+ASIC异构可编程平台进行原型验证。结果表明,负载均衡度相较传统方式提升了38%,实现了边缘算力精细化管理,有效提升了边缘算力服务水平,后续可广泛应用于边缘计算场景。研究成果以论文形式发表在网络领域顶会ICC2023,如图6所示。

image.png

图6 学术论文发表在网络领域顶会ICC

3.2 标准推进

中国移动在国内的标准组织CCSA联合云厂商、设备厂商等多家单位共同完成了行业标准立项《可编程云网关总体技术要求》,并牵头完成了业界首个在网计算方向的行标立项《在网计算应用场景和技术需求》。该解决方案已写入标准项目的中间文稿,计划2024年完成标准项目的征求意见稿及报批。该行业标准将为后续边缘规模部署可编程边缘云融合网关提供指引。

3.3 产业应用

面向行业应用,中国移动研究院在移动信息现代产业链—算力网络子链方面牵头成立了算网一体产业发展方向的研究团队,并联合多家高校、设备及芯片厂商开展了协同攻关,打造了基于在网计算的异构可编程融合网关为产业链重要攻坚方向。

同时,中国移动研究院在ODCC上联合产业界共同发布了《P4超融合网关技术白皮书》,其不断凝聚产业共识,推进了边缘可编程融合网关的应用部署。

image.png

图7

目前,联合攻关项目基于中国移动CIFTI试验网已完成初步试验验证,下一步计划联合移动云以及省公司开展此项目的联合应用与推广。

摘自《自动化博览》2024年第二期暨《边缘计算2024专辑》

热点新闻

推荐产品

x
  • 在线反馈
1.我有以下需求:



2.详细的需求:
姓名:
单位:
电话:
邮件: