ABB
关注中国自动化产业发展的先行者!
CAIAC 2025
2025工业安全大会
OICT公益讲堂
当前位置:首页 >> 资讯 >> 行业资讯

资讯频道

面向工业互联网的在网计算加速技术
  • 点击数:1215     发布时间:2024-03-05 22:41:19
  • 分享到:
工业互联网的不断发展,对计算效率和网络传输能力同时提出了更高要求。在网计算是一种将应用处理过程卸载至网络转发节点的计算加速技术,其通过网络与应用的深度融合,实现系统加速,提升了算网资源利用率。针对工业互联网更加严格的业务需求,本文介绍了在网计算面向工业互联网的应用场景及关键技术,实现了工业互联网应用部署加速。

国移动通信有限公司研究院牟彦,姚柯翰,刘鹏,陆璐

1 引言

当前,全球科技创新进入密集活跃时期,新工业革命蓬勃发展。工业互联网是新一代信息通信技术与工业经济深度融合的关键基础设施,其打造了新型应用模式和全新工业生态。它通过人、机、物的全面互联,构建起覆盖全要素、全产业链、全价值链的新型制造与服务体系,为工业数字化、网络化、智能化转型升级提供了实现路径。

随着现代工业向智能化方向的不断发展,海量工业数据持续发往数据中心,工业设备对通信和计算资源的需求变得越来越紧迫,而算力基础设施的提升速度仍难以满足工业互联网向智能化发展的应用需求。

随着可编程芯片的出现,在网计算成为一种新的计算范式。在网计算将计算任务卸载至网络设备,以实现更高效、灵活的数据处理,其主要技术优势在于减少应用数据搬运、压缩传输数据量,以及优化通信模式。通过引入在网计算加速技术,工业互联网在网络基础设施层能够更好地支持智能机器的连接、机器与软件系统的连接、大数据分析等应用。利用网络基础设施参与数据计算和控制处理的方式可以提升系统整体运行效率,降低通信延迟,减少总体能耗。

工业互联网强调“人、机、物”的全面互联,产生大量应用数据,且多数应用需要满足低时延、高吞吐、高并发、高可靠的业务需求,因此工业互联网对算力和网络的需求十分严格。在网计算技术通过近数据处理减少数据搬运,并利用网络天然的高吞吐交换能力实现控制、计算等任务卸载,可以更好地满足工业系统对可靠性和时延的要求。工业互联网的目标是通过开放的网络平台将设备、生产元素连接起来,在网计算技术使得这些设备和元素在地理上分散的同时,仍保持高效的数据交换和处理能力,这种协同效应不仅提高了生产的效率,还为创新提供了条件。在网计算可以赋能多种工业互联网场景,包括提供数据采集、数据清洗、复杂事件驱动及控制决策等技术能力。如解决云化PLC带来的时延和抖动,利用可编程转发设备调度控制任务与网络流量,实现控制任务与专用控制器解耦以支持生产线的切换与灵活升级。

本文通过分析工业互联网对在网计算加速技术的需求场景,提出了在网计算关键技术,并通过在网计算加速了工业互联网应用部署。

2 工业互联网的在网计算加速需求

工业互联网网络是构建工业环境下人、机、物全面互联的关键基础设施,根据业务需求和数据流向,工业互联网网络又可进一步划分为工厂内网和工厂外网[1]

工业互联网内网和外网中的计算基础设施部署如图1所示。其中骨干网络与超算中心构成工厂外网,生产现场网络、生产办公网络和园区网络构成工厂内网[2]

image.png

图1  面向工业互联网的在网计算加速场景

工业互联网的计算基础设施包括部署在工业外网和内网中的中心云、边缘云、网关等。中心云主要处理非实时的大规模数据,部署在企业外网或内网;边缘云主要处理有一定实时性、安全性要求的业务,通常部署在园区网络或者生产办公网络。

2.1 园区物联网的时延敏感业务受边缘计算规模制约

园区物联网通过对智能物联网设备的信息汇总分析,实现对园区运行状态的实时感知和运行监测。智能物联设备受制于体积、功耗,常常会存在资源有限、算力不足的情况[3]。当前主流的解决方案是依靠部署在网络边缘的边缘服务器提供计算卸载服务,汇总物联网终端数据并做出相应决策。

随着物联网设备数量的快速增长,基于边缘计算的计算卸载架构也在带宽、时延及可靠性上面临巨大挑战[4]。一方面,以通用服务器为基础的边缘集群的吞吐量性能难以满足物联网场景中广泛存在的高性能计算需求[5]。另一方面,基于边缘计算的计算卸载架构在完成计算时会引入额外的处理时延和阻塞,难以支撑不断涌现的时延敏感型物联网应用(如自动驾驶、应急联动)。同时,由于边缘计算中心所在的位置限制,其规模不太可能随着数据需求的增长而无限扩展。

2.2 生产办公网络需要提高基于业务的服务保障能力

工业互联网中的场景利用XR业务(包括虚拟现实、增强现实和混合现实技术)对现实世界进行模拟、增强或交互。如在虚拟环境中进行产品设计,模拟产品的外观、功能和性能,有助于加快设计迭代速度,降低开发成本。在维护与修理环节,通过XR为工人提供远程协作和实时指导,降低维修成本,缩短停机时间。在培训与教育环节,为学员在虚拟环境中模拟实际操作,提高培训效果和安全性。

随着XR技术不断演化升级,数据流更多源异构、图像分辨率更高、应用场景更多样、用户规模更庞大,对网络下行带宽、容量、确定性时延和可靠性均提出了全新要求。业务终端的规模剧增,导致服务器算力不足,对数据通道带宽的挤占会极大影响控制信息的传输,为实现更精准的服务保障,还需要增加手段对数据流的业务信息进行探测和感知。

2.3 生产现场网络需要解决灵活配置与实时工业控制的矛盾

客户对制造业提出了定制化和个性化要求,需要生产线具备高度的灵活性,支持生产线的快速重新配置。基于中心云进行控制功能云化,可以实现生产线的快速重配和灵活性,但无法满足实时工业控制(如执行器、机械臂、传送带等的速度或扭矩控制)对低延迟和高可靠性网络的要求[6]。引入边缘云计算可以显著减少传播延迟,但边缘计算节点依赖于与远程云基础设施相同的虚拟化技术,需要依赖实时操作系统来消除CPU调度的影响。控制更新时间更短、数量更多的新型机械臂实现实时速度控制需要超快的响应时间,传统的边缘计算基础设施很难满足这一要求。

工业现场需要使用大量的控制器组装协同完成复杂的操作。工业控制器之间需要通过垂直协同(上下级控制器间的协同)和水平协同(平级控制器间的协同)共同完成特定生产工业流程。如何实现不同控制器之间的指令协同以及机械臂的动作协同,是对机械臂控制器间的交互性能提出的新的要求。

2.4 工厂内外网面临原始数据拥塞和训练数据通信瓶颈

工业互联网的关键应用之一就是使用机器学习对海量数据实施流式计算及大数据分析。物联网设备产生大量连续的数据流,工厂内网采集的原始数据如果直接通过工厂外网送往数据中心,会导致网关拥塞,损害物联网系统的可扩展性。

云数据中心内部网络在支持分布式机器学习的训练过程中,也存在分布式机器学习的中间通信流量过大造成网络拥塞和较大聚合延迟问题,从而影响分布式机器学习模型训练速度和效率,进而影响业务的部署和迭代。

3 面向工业互联网的在网计算技术架构

在网计算使用网络设备进行近数据计算,可以在高速转发过程完成应用数据处理,缩短了数据传输路径,是解决分布式应用在计算和通信瓶颈问题上的重要技术。

image.png

图2  面向工业互联网的在网计算技术架构

如图2所示,在网计算架构包含异构网元、高性能互联、在网计算通信库、分布式应用和编排管理5个核心功能层:异构网元是指在不同场景下具备在网计算能力的物理设备,是实现在网计算的基础底座;高性能互联层为服务器、在网计算网元提供可靠、高效的连接保障,可基于现有成熟协议栈,如RoCE、InfiniBand、OPC UA和Modbust等,也可以基于自定义协议栈;在网计算通信库作为在网计算架构体系的核心层,为分布式应用提供了通用的在网计算加速能力;分布式应用层包含在网计算可以服务的各种应用类型,包括以计算为特征的大规模数据采集、质量管理预测,以控制和响应为特征的AGV协同导引,以多媒体融合为特征的车间可视化等应用;在网计算编排管理层主要包括对网络设备的资源管理,以及计算任务跨网络设备运行过程的任务调度管理和编排。

在网计算架构的横向:在网计算通信库承上启下,以异构网内算力资源实现统一的在网计算服务;纵向:在网计算编排管理全栈贯通,优化应用开发模式、协同端网任务部署、统筹网内资源管理。在网计算通过“一横一纵”实现应用层和网元之间的计算通信协同,实现包括在网数据推理、在网业务感知、在网控制,以及在网数据聚合等4项面向工业互联网的加速技术。

4 面向工业互联网的在网计算加速技术

4.1 在网数据推理技术有效弥补园区物联网边缘算力不足

在网计算数据推理是由可编程转发设备实现包括决策树、SVM、朴素贝叶斯的各种分类算法,支撑网络设备在网络路径上就近返回决策处理结果。引入在网数据推理后,由网络转发设备实施数据推理计算,依据分析服务器下发的数据模型对收集到的原始数据进行推理,对原始数据进行特征提取和异常识别并将控制指令返回给终端设备。与基于分析服务器的推理(原始数据被传输到分析服务器进行推理)相比,中间层网络设备推理提前终止了终端设备发往分析服务器的原始数据流量,节省了核心网络的带宽,即减少了网络中业务流的总量,利用网络设备的高速处理能力减少了推理时间,在卸载分析服务器的算力的同时加速了数据的实时分析和控制指令的响应。

4.2 在网业务感知技术有效提升生产办公等场景下XR业务的服务质量

在网业务感知通过网络设备根据数据包载荷获取业务信息以实现业务探测功能,根据关联数据流方式实现专用承载识别及网络切片识别,提供了更精准的服务保障。在网计算技术通过网络感知业务的方式,提升网、业、端协同以及构建分布式高性能计算能力,为XR终端设备提供了高性能计算支撑。XR业务实现端云协同渲染时,需要实现边缘云和终端设备协同分配计算任务,在终端侧进行低延迟的渲染任务,在边缘云进行计算密集型的运算和图像渲染,并整合两者的计算结果。引入在网计算能力,通过网络设备增强并行分布式计算能力和聚合通信能力,随路卸载边缘云的计算任务,可以大幅提升XR的渲染能力,提供更实时的用户体验。

4.3 在网控制技术优化生产现场网络的可控性和灵活性

在网控制技术是指关键控制任务被卸载到通过远端管理的网元设备中的方法。比如,在进行工业机械臂的控制流程系统中,将工业机械臂的控制流程重新划分为延迟敏感任务和高级控制任务,将高级控制任务保留在原云/边缘数据中心的工业控制器,将工业机械臂的实时速度控制卸载到可编程转发设备。由工业控制器、在网计算网元设备和工业机械臂组成的控制系统,将较长、较远的控制环路分割成较小的环路,以处理传输延迟,实现线速计算,并确保微秒级的实时响应时间,从而解决云和边缘云机器人技术问题。这种使用网络硬件对现场实施控制的方式可以在通信过程中为应用层的低延迟实时计算开辟新的领域。

在分布式系统中,通过共识协议来实现对某个数据值或操作序列的一致性,比如锁管理系统、组播通信、一致性协调。支持在网计算的转发设备卸载一致性共识功能,可以减少工业控制器之间的协调延迟。

4.4 在网数据聚合技术可降低工厂内网和外网数据拥塞问题

在网数据聚合技术在工厂内网及工厂外网的数据中心内部有不同的实现:

在工厂内网采用在网数据聚合技术,利用可编程数据平面的改进通信协议,支持在网络级别的硬件交换机内实现数据聚合算法,根据网络状态和物联网设备使用的不同通信技术实现数据聚合功能。通过减少通过网络发送的数据包数量,减少对网络设备带宽资源的占用和服务器计算资源的消耗。

在云数据中心网络引入在网数据聚合技术,由网络交换节点卸载机器学习中的参数聚合处理,使任务总体数据传输量下降,解决通信系统中存在的带宽瓶颈,使其模型训练速度加快,业务效率提升,最终提高系统计算任务的总体性能。

5 总结与展望

工业互联网对计算和网络提出了更加严格的业务需求,通过引入在网计算可以实现系统性能的提升。本文通过分析工业互联网工厂内外多种应用场景和业务需求,针对性地提出了在网数据推理、在网业务感知、在网控制,以及在网数据聚合等4项关键技术,有效提升了工业互联网应用的计算效率、可靠性和灵活性,同时提升了算网资源的利用率。面向未来,在网计算将深度融入工业互联网算网基础设施,不断赋能更多应用场景和垂直业务。

作者简介:

牟 彦(1979-),女,工程师,现就职于中国移动通信有限公司研究院,主要研究方向为未来网络、在网计算、算力网络以及工业互联网的技术和应用。

姚柯翰(1993-),男,工程师,现就职于中国移动通信有限公司研究院,主要研究方向为算网一体前沿技术、在网计算、AI网络等。

刘 鹏(1991-),男,工程师,现就职于中国移动通信有限公司研究院,主要研究方向为下一代IP网络、确定性网络的技术和应用。

陆 璐(1979-),女,高级工程师,现就职于中国移动通信有限公司研究院,主要研究方向为移动核心网策略、演进、标准和技术研究。

参考文献:

[1] 工业互联网产业联盟(AII). 工业互联网网络连接白皮书(版本2.0)[R]. 2021.

[2] YANG Fan, SONG Wenxuan, XU Fangmin, et al. Research on the Application of Computing Force Network

Technology in Industrial Internet of Things[J]. Radio Communications Technology, 2023, 49 (1) : 63 - 71.

[3] Kaur K, Garg S, Aujla G S, et al. Edge Computing in the Industrial Internet of Things Environment: SoftwareDefined-Networks-Based Edge-Cloud Interplay[J]. IEEE Communications Magazine, 2018, 56 (2) : 44 - 51.

[4] Rafique W, Qi L, Yaqoob I, et al. Complementing loT Services through Software Defined Networking and Edge Computing: A Comprehensive Survey[J]. IEEE Communications Surveys & Tutorials, 2020, PP (99) : 1.

[5] 潘辉江. 基于网内计算的物联网计算卸载设计与研究[D]. 北京: 北京邮电大学, 2022.

[6] Sándor Laki1, Csaba Györgyi1, József Pet˝o2, et al. In-Network Velocity Control of Industrial Robot Arms[J]. NSDI, 2022.

摘自《自动化博览》2024年第二期暨《边缘计算2024专辑》

热点新闻

推荐产品

x
  • 在线反馈
1.我有以下需求:



2.详细的需求:
姓名:
单位:
电话:
邮件: