就应用的普遍而言,当今工业自动化是唯一一个仍然使用专用计算机、PLC和DCS控制系统,而不是在系统边缘使用标准计算平台进行本地控制、优化、分析和数据提炼的行业。从OT领域的发展历程来看,经典的PLC/DCS(特别是大型DCS)除了具备数据采集、实时控制和完成确定性任务, 以及一定的网络通信功能外,也具备一定的数据库、数据过滤、数据分析的功能。不过数据采集的范围还是局限于原先设定的控制对象, 充其量只能就地进行数据分析、过滤和局部优化,不可能从生产的全局视野去安排决策控制的目标。这是因为当时互联网技术还没有成熟到向工业生产推广的程度, 计算技术也不曾发展到云计算时代。然而云计算虽有算力强劲的优势, 却又有受限于通信能力(特别是广域通信) 所造成的针对大规模实时数据采集的劣势。显然,让处于严苛工业环境下的PLC/DCS大幅提高算力和存储, 并不是一种合理的成本安排和技术解决方案。由此可以得出如下的结论: 边缘计算的应运而生是随着工业互联网的时代来临, 与此同时制造业又正在经历着一场前所未有的变革这两种形势的积极推动所致。工业互联网、智能制造、工业4.0的实现,都有待制造装备在高水平上提供数字化、信息化与智能化的基础, 有待IT/OT的实质性融合。正如Gartner所预测的,“边缘计算对基础设施和运营领导者的意义在于, 到2025年75%的数据将在传统的集中数据中心或云之外创建和处理”。从技术基础上说, 随着芯片、通讯与储存技术的不断提升, 工业现场设备的硬软件能力取得了极大的提高。为了充分利用现场设备的数据资源, 产生了对边缘计算功能的迫切需求, 也使得过去难以实现的智能变成可能。就发展的顺序而言,先有云计算和互联网,然后才有云-边-端的架构生成。在工业互联网的推进过程中,OT与IT融合难的问题越发明显,一边是以IT企业领衔的工业互联网平台试图向工业应用大规模挺进,另一边是以OT企业领衔的制造系统设备信息化水平不断提升,但工业互联网平台始终无法与制造系统双向互通,实现智能算法与模型的真正落地。可以预料,边缘计算的出现和快速推广运用,将成为OT与IT融合的纽带、工业互联网落地的实际载体。
1 工业边缘计算的概述和参考架构
1980年美国普渡大学工业工程系提出计算机集成制造系统的参考模型,被国际工业和学术界奉为经典,后来发展成为ISA 95企业信息系统集成标准的基础;企业信息系统集成国际标准IEC/ISO 62264脱胎于ISA 95。迄今为止ISA 95的参考架构仍然是工业企业进行数字化转型的基础参考架构,因而在开创工业边缘计算的技术方向时,从总体视角来看它依然是基本的参考架构。图1完整地表述了将ISA 95的参考模型映射到工业云-边-端所对应的架构。从工厂的信息集成发展到企业的信息集成, 原有的5层模型增加到6层模型, 也即从企业内部的管理扩展到把企业经营活动的上下游(涵盖供应链、产品全生命周期等)都包罗进来,目的是保证企业生产和管理的全局优化。对应由顶层向底层的各个层级,它们的数据流量和时间尺度分别是:管理层为百万字节/天(Megabytes/days),运营操作层为兆字节/小时(Mbytes/hours),监控/协调层为千字节/分(Kilobytes/minutes),直接控制层为字节/秒(Bytes/seconds),设备和过程层为位/微秒(bits/microseconds)。按照对实时性能的要求可以大致将这些层级划分为两类: L4层的ERP和L3层MES划分为实时性要求低或较低、数据量大的一类,对应于工业云-边-端的架构,这一类可以迁移到云端。而L2层的SCADA和HMI、L1层的PLC/DCS以及L0层的传感器和执行器,实时性要求高、数据量低,对应于工业云-边-端的架构,这一类必须保留在生产现场,它们都是属于边缘计算节点(ECN)。
图1 ISA 95参考架构对云-边-端的映射
图2是一个典型的工业云和边缘计算架构,分为三层。顶层是工业云平台,提供涵盖设计、制造、管理和维护的各种应用程序。为了降低部署和运营成本,传统的ERP、MES、产品生命周期管理(PLM)和客户关系管理(CRM)系统都可以迁移到工业云。此外,通过边缘计算设备采集的实时数据,可以增强设备运行分析、供应链分析、能耗优化等工业云创新应用。这些服务甚至可以由第三方提供,并运行在本地云/本地数据中心上,而不是公共云上。中间层为工业边缘网关,负责算法部署、计算、组网、存储资源均衡,管理各ECN的数据集流程。边缘网关保证了快速开发以及通过模型驱动的模块化服务编排的敏捷部署,负责监控客户端、终端、物联网和云服务器之间的所有网络数据包交换事务,还可以通过修改这些数据包提供附加功能,例如当本地网络检测到新设备使用未识别的网络协议时,边缘网关需要自动配置该新协议,或者更新安全策略以保护ECN。如果发现来自底层物联网系统的攻击,边缘网关应检测并阻止其访问;反之,来自外部IT系统的攻击也应该由边缘网关来阻止。底层包含一系列分布式ECN。ECN可以执行一项或多项功能,包括具有协议转换的网络交换机、实时闭环可编程控制器、用于大数据分析的本地云和低成本传感器。这些功能可根据闭环反馈数据实时动态分配到任意ECN的组合。
在图2所示的参考模型中,工业边缘计算可以通过多种方式与工业云进行协同。这表现在:(1)工业边缘计算可以实时(毫秒级)提供本地计算、存储、网络和虚拟化资源的自我管理和平衡;还可以分发和执行工业云制定的策略,包括管理设备、资源和连接。(2)从数据角度来看,ECN主要用于数据采集,并根据预定义的规则进行初步的数据处理和分析;工业云提供从多个ECN收集的海量数据的存储、分析和挖掘。通过云与边缘之间的高效数据流动,可以降低数据驱动的产品质量跟踪和数据挖掘的成本。(3)在应用领域中,工业边缘提供执行环境、执行部署计划并监控部署的边缘应用程序的生命周期。例如,机器学习模型在工业云上训练后,再部署到ECN进行推理。对于工业云上的典型应用,如开发、测试、数字孪生等,ECN则对这些灵活、可互操作、基于组件设计和微服务化的模块进行实例化。
图2 典型的工业云和边缘计算架构
表1给出描述边缘计算和云计算范式的维度,着重揭示了将边缘计算方法应用于制造过程所面临的机遇和挑战。
表1 边缘和云的特点比较维度
作为工业云的补充,工业边缘计算提供了互操作性、实时数据处理和自优化,而这些都不是工业云的主要关注点。互操作性确保了系统到系统级数据迁移以及设备到设备级数据交换的垂直和水平集成。通过ECN的全面互操作性,可以将柔性和分布式协同运行引入产品设计、生产、管理、供应链等制造过程的整个周期。此外,通过将云边协同模式应用到新的业务中,可以实现资源的最大利用。边缘实时数据处理将减少工业云的工作量,数据采集、预处理、校准、转换可在边缘设备上实时完成,无需向工业云发送海量数据。通过工业云和 边缘计算资源的协同,可以将数据驱动优化扩展到边缘节点。采用来自工业云和分布式推理的预先训练的机器学习模型,可以满足实时约束和提升数据处理的效率。
图3是研华公司的云-边-端架构示意图,将这三层的功能都具体化了。
图3 研华公司的云-边-端三层架构及其功能表述
2 从三个视角分析工业边缘计算
在制造背景下的工业边缘计算可以理解为:这是一类常驻在临近数据物理源头的分布式边缘节点构成的系统。这些边缘节点必须运行在任意一种容器内,并且受到集中的管理。边缘节点既要与云端层级连接,又要与生产资产层级连接,还要与其它的边缘节点连接,而且边缘节点可以暂时性地离线运行。
从概念上讲,边缘计算是通过云中心平台采用分布式的方法去处理、管理和运行数据的。工业边缘计算意义上的数据处理,并不等同于就地或现场的数据处理,它还应该有如下两个特征:边缘是对中心而言,有边缘就一定有中心,因此边缘计算尽管是在离数据生成点尽可能近的地方进行数据处理,但它一定是为中心进一步的全局数据处理服务的;边缘计算采用虚拟化的软件技术,主要是容器化技术(例如Docker)。
下面从基础架构、应用和操作运行三个不同的视角来分析边缘计算节点。
(1)基础架构视角
一般边缘计算节点由一个计算节点和一个客体系统两部分组成,如图4所示。计算节点包括物理硬件、操作系统和系统管理程序;在边缘计算节点中允许运行独立的客体系统。客体系统由容器的运行时(runtime)
以及容器化软件本身组成。
图4 边缘计算节点的基础架构框图
从基础架构的视角看,边缘计算节点有两个必须具备的特性:其一是具有运行和管理容器化软件的能力,为边缘容器的运行提供轻量级的虚拟化,而不是像虚拟机那样还必须带有自己的操作系统;其二是具有上连云层级、下连生产资产层级的双向连接能力,这意味着一个符合要求的边缘基础架构需要经由各种可用的网络提供与云端直接或间接的连接性,而且还要能处理暂时的离线运行状态。与云端连接必须有足够的信息安全保证,不能简单地依赖严格的网络隔离措施,因为云平台需要与更多的构成制造系统的重要部分如用户、数据、服务和设备等进行连接。
通常边缘计算节点有两种实现方案,一种是在工厂数据中心以虚拟化的方式建立的边缘计算节点;还有就是在生产现场部署的物理边缘计算节点,近些年发展迅速的边缘可编程工业控制器、轻量级的嵌入式设备都属于这一类。利用容器的编排技术在数据中心部署边缘计算节点具有以下优点:高可用性、良好的可扩展性、降低运行成本以及没有附加的硬件和接线要求。在以下场景建议采用物理边缘计算节点:在生产单元中由于要为网络减负,进行诸如数据过滤和数据聚合等处理;为降低延迟,运行基于人工智能的控制回路;要求连接附加的外部设备;将不安全的协议转换为具有信息安全的协议。
(2)应用视角
从应用的视角描述部署在边缘节点上满足OT和IT要求的应用功能组件,而且这些功能组件作为容器化的软件需要与云-边-端的体系结构和基础架构相匹配。这就是说功能组件需要解决下面这些典型的问题:在分布式边缘环境中支持和管理标准化通信;对不同的数据源进行标准化和转换,从而将整个解决方案推向一个通用的语义建模方法;将客户的业务逻辑组件用标准化的连接模块集成;管理分布式边缘节点之间的数据存储;确定边缘节点的业务逻辑,并在边缘和云环境之间管理业务逻辑。
因此,应用程序视图需要包含多个具有一系列不同功能的组件,包括:云连接,生产资产连通性,用于边缘节点内部和分布式边缘节点之间通信的组件,数据处理和预处理,数据聚合,语义富集(semanticenrichment),具有特定业务逻辑的组件(例如边缘分析、机器学习)等。
从应用的视角来看,边缘节点上连云端,下连资产,如图5所示,为了执行其特定的应用功能需要在其内部通过消息代理/API网关对若干功能组件(如图中的数据处理功能组件、语义富集功能组件和其它边缘应用的功能组件)进行集成。功能组件的功能性一般随所使用的工业互联网或智能制造系统的规模和复杂程度(即随数据源的数量和类型、数据的容量以及应用功能和应用点的多少)而变化。
图5 从应用视角分析边缘节点举例
为了解决上述边缘节点的典型要求,需要考虑以下几点:
•在边缘应用程序和边缘节点之间创建松散耦合架构的消息代理或API网关;
•按用例的要求选择同步或者异步通信模式;
•用于远程数据采集和下达命令数据所定义的、柔性的有效载荷格式;
•用于语义富集的信息模型;
•离线场景和数据缓冲能力;
•训练复杂的机器学习模型,其中在云端训练的是算力要求高、有足够可资利用的数据流存取水平的模型,在边缘训练的主要是考虑带宽约束限制、有一定实时要求的模型。
图6为一个参考用例,生产资产连接器从PLC采集能源数据并将其转发给消息代理。消息代理确保了不 同边缘应用程序和连接器之间的消息交换。能量分析组件实现一个按用户要求定制的业务逻辑,从采集到的数据中识别异常。因此,应用程序从消息代理接收能量数据、执行分析,并将结果发布到消息代理上。云连接器将分析结果传输到企业总线。这个参考用例还描述了云连接器和生产资产连接器通过消息代理将新的参数从企业总线传输到PLC,并在PLC中更改了一个运行参数。
图6 一个参考用例(从应用视角分析)
(3)运行视角
由于制造业的应用在稳定性和自动化方面有特殊的要求,边缘节点的综合操作方法是必不可少的。这里重点讨论在边缘节点的整个生命周期中对其进行管理的重要功能。
边缘节点会经历从规划、硬软件准备、组态、运行直到退役的生命周期各个阶段。每个阶段的成功执行都有特定需求。这些需求通常可以通过附加的云服务来满足。主要的云服务支持有:边缘节点管理和编排服务、监控服务、安全服务和边缘节点参数同步。
管理和编排服务: 一般来说,这种云服务的任务是获取所连接边缘节点的当前状态或设置所需状态。
在硬软件准备阶段,该服务对新的边缘节点进行编排引导。第一步是创建数字标识,数字标识可以源自现有的资产管理系统。然后提供一个端点,边缘节点在此发起连接。为此,必须执行边缘节点的基本设置,示例操作包括安装操作系统、提供代理和提供安全凭据。该服务还可以保存和管理边缘节点的目标组态。
初始连接完成后,边缘节点提供基本的自描述特征(状态)。将节点状态与服务中的目标配置进行比较,如果发生偏差,状态更新被发送到边缘节点。状态更新可以是安全或策略更新、组态和应用程序版本更改。在图6的参考用例中,组态参数是识别异常能源消费模式的阈值。
对于每个特定的用例都要为所装的应用程序配置一定的参数。这些参数在组态阶段被推送到边缘节点用于应用程序。例如将一个组态文件加载到存储器,并在启 动时由容器获取。在操作阶段发生刷新时也是如此。
最后一个阶段是退役。在物理边缘节点上,退役是由硬件故障或升级周期引起的;这时需要更换硬件,并将退役节点的识别号及其状态转移到新设备;为了减少生产场景中的停机时间,这种重新定位必须由服务尽可能无缝地自动完成。在虚拟边缘节点上,故障失效将导致启动一个新的边缘节点和转移数字识别号。如果边缘节点可以完全退役,需从边缘节点管理服务中删除其识别号。
监控服务: 从边缘节点收集所有日志以及量测单位和量程信息。
信息既可以来自主机系统,也可以来自运行的容器应用程序。因此,边缘运行时和应用程序必须支持这种机制。
在硬软件准备阶段,边缘节点建立与监控服务的连接。通过该服务,可以将报警(例如所分配的内存容量不足)应用于传入数据的流分析。之后,报警、日志以及测量单位和量程可以在接下来的组态和操作阶段使用。它们用于确定系统的健康状况和执行事件跟踪。为了获得有意义的结果,日志消息必须具有定义好的格式。通用组件包括消息来源、严重程度、内容、UTC时间戳和相关标识,以确保更好的可跟踪性。
安全服务: 负责管理边缘节点及其应用程序的安全。
在硬软件准备阶段,边缘节点第一次连接到云服务,并互相认证它们的安全措施。在大规模安装物理边缘节点的场景下,可以提供对第一次连接有效的默认认证。安全服务的第二个任务是通过比较目标状态和当前设备状态执行安全策略。例如更新主机系统和应用程序的安全规则,再比如禁用端口。在组态阶段,安全服务通过处理与安全相关的任务(例如安装证书)连接到第三方服务,从而支持边缘应用程序组态。此外,边缘应用程序可以通过该服务以安全的方式管理其中不得泄露的内容。在运行阶段,对漏洞数据库进行持续监控,任何发现都可能导致目标状态的潜在更新。在退役阶段,将撤销边缘节点中与安全相关的内容。
边缘节点参数同步: 参数同步服务的任务是同步云服务和边缘节点之间的应用程序参数。因此主要用于操作阶段。通过设备管理服务以同步方式对云和边缘的参数刷新。作为先决条件,边缘容器运行时必须能够接收这些参数,并向容器应用程序提供。容器应用程序本身需要能够解释它们,并根据来自参数同步服务的设定值进行动态刷新。
在图6的示例中,流程专家程序对云上的可视化数据进行分析,然后在边缘节点通过参数同步服务设置新值用以减少能源消耗。
3 工业边缘计算标准化的进程
在新技术和概念的早期发展阶段都有标准化的迫切需求,边缘计算也不例外。不过目前的边缘计算在相关标准的制定方面已经落后于市场实际需求。工业是典型的需要标准化的领域,因此需要定义标准协议与规范来约束边缘计算节点的管理、边缘端数据的处理、边-云协同机制等关键问题。于是有许多官方标准机构包括ISO、IEC、IEEE、欧洲电信标准协会(ETSI)、电信行业协会(TIA)、云原生计算基金会(CNCF)、Linux基金会(LF Edge) 、工业互联网联盟(IIC)等都正在从事与边缘计算相关的标准化工作。ISO、 IEC、IEEE把注意力集中于边缘计算在智能制造和工 业互联网中应用的标准化问题,其余那些原本从事通信领域的机构,标准化的重点大部分放在边缘与云端的通信(如5G)、信息安全等方面。例如IEC/TC 65/WG 23“智能制造框架和系统架构”标准化工作组, 2021年的主要话题和任务就是搞清边缘计算对智能制造的影响,包括市场的走向和未来的要求、边缘计算的可用性及影响、智能制造对边缘计算的要求、工业边缘计算对物理安全和功能安全的影响,以及工业边缘计算对信息安全的影响等。这说明IEC已经下决心开发和制定工业边缘计算的相关标准,但尚处于起步阶段。而走在前面的IEEE在3年前就开始制定工业互联网+边缘计算体系下节点与节点间的智能管控标准。边缘计算节点除了承担计算、储存、通信功能外,还应具备任务管理、数据管理、数据分析等功能。再加上工业系统对可靠性与安全性的严格要求,不能完全依赖基于云计算的决策机制,也就是说即使在与工业云连接断开的情况下工业现场生产系统也应保证正常生产,因此也更加凸显边缘计算在工业互联网系统中的重要性。在工业互联网边缘计算框架下,工业系统可以选择边-云协同的模式,包括公有云+边缘计算系统或者私有云+边缘计算系统,当然也可以选择仅由边缘计算系统来支撑。在任意一种模式下,都需要对现有的设备节点进行管控。
从基础架构、应用和操作运行三个视角来分析边缘计算节点所提出的许多问题,都可以通过标准化的方法来解决。IEEE P2805系列标准可解决相当一部分。IEEE P2805系列标准是IEEE下属工业电子学会标准化专委会开发的与边缘计算节点相关的系列标准。目前已经获得IEEE标准委员会批准立项的共有三个部分:P2805.1边缘计算节点自我管理协议;P2805.2边缘计算节点数据采集、过滤与缓存管理协议;P2805.3边-云协作机器学习协议。三部分协议相辅相成,共同形成完整的边缘计算智能管控体系。通过为边缘计算节点定义这些标准,解决了互操作性问题,从而可为工业互联网应用带来巨大的利益。
IEEE P2805系列标准旨在解决工业边缘计算的三个挑战:(1)在生产现场内存在大量的ECN时, 如何自动管理这些节点是关键。IEEE P2805.1标准定义ECN的自我管理协议,包括ECN的识别、资源管理、备份、负载平衡和数据共享。(2)为了定义如何管理每个边缘计算节点上的数据采集,在IEEE P2805.2标准中规范用于ECN数据采集、滤波和缓冲的协议,包括如何配置数据获取和验证数据,如何定义数据预处理规则,以及如何管理ECN上的数据缓冲。(3)在获得大量可供分析的数据后,需要定义机器学习方法如何在工业云和边缘计算之间进行协作。IEEE P2805.3标准定义了用于机器学习的云-边缘协作协议,为在低功耗、低成本的嵌入式设备上应用机器学习算法提供了指导方针。此外,还涵盖了分布式机器学习模型的部署以及在线优化。如图7所示。
图7 IEEE P2805边缘节点管理标准
4 结束语
工业边缘计算是边缘计算应用中最具发展潜力和经济效益的一个领域,也是面对的应用场景最多、技术最综合最复杂、对标准化需求最迫切的领域,因此吸引了许多传统的工业自动化企业和IT企业的重视和推动。仅以IT/OT融合这一热门话题为例,为了追求这二者的融合而将设计约束引入边缘计算。通常作为设计和实现的指导,OT和IT解决方案有着不同的约束和要求。OT关注生产过程的安全性、效率、稳定性和连续性,而IT则优先考虑速度、安全性和数据分析。边缘计算必须融合OT和IT的特性,以最大限度地发挥其潜力。例如,如何利用IT系统的敏捷性,并按OT的指标确保以执行任务为关键要求的连续性,以及对时延敏感过程的高可用性。此外,还必须考虑来自不同数据源(分布在车间的各种系统中)的后端数据集成及其语义的挑战。还要从中选择那些对业务至关重要、必须在边缘进行计算的数据。
5G作为新一代的无线通信技术和正在发展中的确定性IP网络,都是加强工业边缘计算必不可少的通信工具。一些边缘网关已经配备了5G模块,如研华的5G边缘计算网关UNO-137在满足稳定的工业控制的同时,可以提供硬件加密以及最新的5G通讯; 搭配Codesys、DAQNavi、VisionNavi、Edgelink等软件,还可以使传统的工业控制在边缘侧变得更智能。
工业边缘计算节点加上智能化软件,有些人称之为边缘智能(Edge AI) 。最近一个在欧洲进行的调查结果预示着边缘智能市场呈现指数曲线的增长势头,而德国无疑是最大的市场, 其从2020年到2025年的增长率达到28%。类似的情况正在其他发达国家出现,我国也出现了蓬勃发展的苗头。但针对边缘计算乃至边缘智能的严谨的需求分析、技术研究、产品开发,以及标准化工作都十分缺失,这个问题如果不处理好,必将为整个工业互联网和智能制造系统的建设带来很大的困难。毕竟大部分数据来自底层设备,而粗放的设备联网和数据上云并不能解决最关键的那些问题。
作者简介:
彭 瑜 (1938-),男,湖南长沙人,教授级高级工程师,上海工业自动化仪表研究院教授级高工、顾问,PLCopen中国组织名誉主席。迄今为止, 已经为中国工业自动化技术的发展服务了50多年,涉及流程工业、离散制造业等领域的检测、控制、生产制造、执行管理等多个方面。
摘自《自动化博览》2022年2月刊