中国科学院沈阳自动化研究所李安顺,许驰,曾鹏
1 概述
在数字化转型浪潮下,工业互联网作为新一代信息技术与工业制造技术深度融合的产物,正重塑全球工业格局。它将互联网、大数据、人工智能等前沿技术融入工业生产全流程,为制造业智能化升级注入强大动力。然而,面向智能化升级的迫切要求,工业互联网仍面临诸多严峻挑战。
首先,在数据层面,工业场景数据海量、多源且异构。各类生产设备、传感器及管理系统产生的数据格式多样,格式涵盖结构化生产参数、半结构化日志文件和非结构化图像、视频等。不同来源数据接口协议和存储格式各异,导致数据整合、清洗与分析难度极大,数据价值难以充分挖掘。
其次,在算力层面,工业互联网涉及从云、边、端广泛部署的计算资源,各层级算力差异显著。云端计算能力强大,但数据传输延迟较高,适用于大规模非实时计算任务;边缘设备靠近数据源,能满足部分实时性需求,但受硬件条件限制,算力相对薄弱。这种算力异构与不均衡严重制约整体计算效率。
最后,在算法层面,工业生产涵盖设备故障预测、生产流程优化、供应链管理等复杂业务场景,各场景对算法要求不同,且不同算法协同困难,难以实现全局最优决策。
面向上述挑战,迫切需要开展工业互联网的云边端协同调度,如图1所示。然而,传统的优化算法及小模型机器学习,并不足以解决复杂的网络系统调度问题,成为当前研究热点。以大模型为代表的生成式人工智能,凭借强大的学习、泛化学习能力,为工业互联网云边端协同调度提供了新的思路。将网络大模型与工业互联网相结合意义重大。大模型不仅可深度分析工业互联网中的海量异构数据,挖掘潜在规律和趋势,为工业决策提供更具前瞻性和精准性的支持,还能根据业务需求和算力条件,智能优化算法选择与组合,实现高效任务调度和资源分配。其中,大模型可协调云边端算力资源,根据任务实时需求动态分配计算任务,提高整体算力利用率,降低能耗。
图1 工业互联网云边端协同
本文聚焦工业互联网云边端协同调度,综合考量数据、算力、算法异构等因素,深入探讨网络大模型的应用。首先,本文剖析了云边端协同调度的挑战,然后阐述了NetGPT、NetLLM和LAMBO等典型网络大模型及其应用,探讨了不同网络大模型的优势,最后提出了未来发展方向并分析了实施难点与解决方案。
2 基于网络大模型的云边端协同调度分析
2.1 工业互联网数据异构难题与大模型破局
在工业互联网领域,数据生态极为复杂,数据来源广泛且多样。不同设备和系统所采用的数据采集协议、格式存在巨大差异,结构化数据与非结构化数据同时存在。以汽车制造生产线为例,传感器、机器人、数控机床等设备产生的数据,要进行统一处理难度极大。在数据融合过程中,繁琐的协议转换和格式适配工作,会严重拉低数据处理的效率。同时,随着工业设备数量不断攀升,数据量呈爆发式增长态势。传统的数据处理方法以及传统AI模型,由于其自身局限性,在特征提取和学习能力上较为薄弱,已难以满足工业互联网对数据深度分析和智能决策的要求。
与之形成鲜明对比的是,网络大模型凭借其强大的特征提取和学习能力,能够高效地整合并处理多种异构数据。大模型可以快速理解和分析不同格式、不同协议的数据,减少了数据处理过程中的繁琐转换环节。这不仅提升了数据处理效率,还为云边端协同调度提供了全面、准确的数据支持,有力地推动了工业互联网智能化发展。
2.2 云边端算力异构困境下的大模型的协同赋能
在工业互联网体系里,云边端设备算力呈现出显著的异构特性。云端拥有充沛的计算资源,具备强大的运算能力。然而,由于数据传输需要经过网络链路,不可避免地存在较高的通信时延,导致其难以满足工业任务严苛的实时性要求。例如,工业生产线上毫秒级响应的设备控制与故障预警等场景。与之相对,边缘设备虽然在数据传输上具有低时延的优势,能够快速地对本地数据做出反应,但其硬件配置相对受限,算力单一且资源有限,难以独立承担复杂的计算任务,如大规模数据的深度分析与复杂模型的训练。在生产高峰期,这种云边端算力的不均衡问题愈发凸显。传统的静态资源分配策略缺乏灵活性与智能性,常导致边缘设备因任务量过载而出现任务积压,无法及时处理数据;与此同时,云端却存在大量资源闲置未被充分利用,造成资源的极大浪费,严重制约了工业生产效率的提升和智能化发展进程。
网络大模型的出现为解决这一难题提供了创新思路与有效方案。与传统机器学习小模型相比,网络大模型在结构设计和算法优化上展现出独特优势。它能够依据不同的算力条件,动态调整自身的运行模式,实现高效运行。在边缘侧,大模型可利用其轻量化的结构和高效算法,快速对海量原始数据进行预处理和初步分析,筛选出关键信息,极大地减少了向云端传输的数据量,降低了网络带宽压力和传输时延。而在云端,凭借其强大的计算能力,大模型可开展深度模型训练和复杂决策计算,挖掘数据深层价值。通过这种云边端协同的方式,网络大模型可望实现云边算力的合理分配与协同利用,有效克服了传统机器学习在应对云边算力异构问题时的局限性,为工业互联网的智能化升级提供了坚实的技术保障。
2.3 工业互联网算法困局与大模型协同优化
工业互联网体系复杂,业务场景丰富多样,其涵盖生产制造、设备维护、供应链管理等多个领域。不同场景对调度算法有着差异化的需求,例如在设备故障预测场景中,更侧重于基于历史数据和设备运行状态进行精准的故障概率推算;而在生产任务调度场景,则着重于在有限资源下,依据订单需求、生产流程等因素实现生产任务的高效分配。更为复杂的是,这些不同的算法之间存在相互干扰的可能性。
传统的调度方法,包括基于规则的调度策略以及传统机器学习所衍生的调度算法,在如此复杂的情况下暴露出诸多局限性。一方面,传统方法难以对众多不同类型算法的内在关系进行有效协调。由于其缺乏对各类算法深层次理解和动态调整能力,在实际应用中,当多个算法同时运行时,往往会出现顾此失彼的情况,无法实现系统整体的最优调度。另一方面,传统方法在面对场景变化时,缺乏自适应性和灵活性,难以快速调整算法以适应新的业务需求和约束条件。
网络大模型凭借其强大的自适应学习能力,为解决上述难题提供了新的途径。大模型能够自动学习不同算法的特点、适用条件以及它们之间潜在的相互作用关系。通过对大量历史数据和实时信息的深度挖掘与分析,大模型可以进行智能决策,在不同业务场景下精准选择最合适的算法,并实现多算法的有机融合。这种算法协同优化机制,不仅提高了云边协同调度的整体效率,还增强了调度结果的准确性和稳定性。在实际工业生产中,大模型能够显著提升生产效率、降低成本,有效克服传统方法和传统机器学习在工业互联网调度应用中的瓶颈。
3 典型网络大模型及其应用
3.1 NetGPT大模型
NetGPT是一款基于Transformer框架的网络大模型,旨在攻克网络流量建模与网络任务优化难题。在网络流量处理与网络任务执行中,传统方法面临数据、算力、算法异构的严峻挑战。数据异构方面,网络流量模式多样,不同协议下流量头部与负载语法结构差异大,加密流量增加了数据语义整合难度,且不同网络任务数据处理需求不同,加剧了复杂性。算力异构方面,传统针对特定任务构建模型,小样本任务下模型训练不充分,开发成本高且算力利用低效,不同任务算力需求和计算方式差异大,调度协同困难。算法异构方面,不同网络任务算法差异大,缺乏统一标准和接口,协同工作和整合困难,影响整体性能。
图2 NetGPT架构
图2所示是NetGPT的基本架构。处理数据异构时,采用基于十六进制的通用编码策略统一处理不同模式流量,重构词汇表保留复杂语义,同时兼顾明密文流量,实现多源异构数据语义整合。应对算力异构,预训练阶段使用多场景无标签数据集增强泛化能力以减少算力的浪费;微调阶段通过打乱头部字段等操作优化数据处理,提升单向学习性能,缓解小样本问题,提高算力利用率。针对算法异构,建立统一算法框架整合不同算法模块,实现数据和参数共享,设计标准化接口,提升算法兼容性和整体性能。
3.2 NetLLM大模型
NetLLM大模型结合大语言模型(LLMs)可解决数据、算力和算法异构问题突出。数据异构时,网络任务输入模态多样,与LLMs的纯文本输入不匹配,像ABR(自适应比特率流)任务中的网络数据就难以被LLMs处理。算力异构时,设计适配的DNN架构困难且成本高,不同任务单独建模导致算力分散,LLMs的应用更使问题加剧,CJS(集群作业调度)任务就是典型例子。算法异构让不同任务的算法协同困难,缺乏统一标准和接口,ABR与CJS任务的算法就难以协同。
图3所示是NetLLM的基本架构。处理数据异构时,其多模态编码器能把多模态数据转成LLM可处理的形式,VP(视口预测)任务借助该编码器,MAE(平均绝对误差)相比提示学习方案降低19.7%。应对算力异构,NetLLM用网络头替代默认语言建模头,提升算力效率,同时DD-LRNA(数据驱动的低秩网络适配)方案降低LLMs获取知识成本,减少训练时间和GPU内存消耗,ABR和CJS任务的训练时间分别减少51.1%和37.7%,GPU内存消耗分别降低60.9%和15.1%。针对算法异构,NetLLM构建统一框架、设计标准化接口,提升算法兼容性与整体性能。在实际应用中,NetLLM在VP、ABR、CJS任务上优势明显,分别降低MAE10.1%~36.6%、提升QoE14.5%~36.6%、减少JCT6.8%~41.3%,充分展现出其解决网络异构问题的能力。
3.3 LAMBO大模型
图4 LAMBO架构
LAMBO同样是一款基于Transformer架构的大模型,如图4所示。但是,LAMBO是专门面向边缘智能卸载的框架,旨在解决传统边缘智能卸载架构面临的异构约束、部分感知、不确定泛化和缺乏可处理性等难题,推动边缘智能领域的发展。在传统的边缘智能卸载过程中,系统面临数据、算力和算法异构的多重挑战。
针对数据异构问题,LAMBO采用输入嵌入(Input Embedding,IE)技术,将各种异构输入信息(如用户设备的信道状态、任务需求、边缘服务器资源约束等)以及任务提示(如最小延迟或最小能耗)转化为统一的归一化特征表示,从而实现复杂约束条件下的高质量特征表征。
针对算力异构问题,LAMBO设计了非对称编码器解码器(Asymmetric Encoder-Decoder,AED)架构,其中深编码器通过多层自注意力机制提取全局特征,浅解码器则利用轻量级结构生成卸载决策与资源分配结果。在动态环境中,LAMBO仅需对解码器进行微调,显著降低了计算资源需求,并支持并行计算加速,提升了资源受限场景下的推理效率。
针对算法异构问题,LAMBO通过演员-评论家学习(Actor-Critic Learning,ACL)预训练模型,使AED能够从大量无标签数据中学习多任务优化目标的通用策略。进一步,结合基于专家反馈的主动学习,LAMBO在动态环境中利用最大熵查询策略筛选高价值样本,并通过专家算法、混合整数规划或启发式算法,实现不同优化目标与动态环境的自适应跟踪,且无需全模型重训练。此外,LAMBO还引入自然语言提示(Prompts)作为任务指令,指导模型针对不同优化目标生成差异化决策。例如,“最小延迟”提示驱动模型优先优化时延敏感任务,而“最小能耗”提示则引导模型聚焦能效优化。通过预训练阶段对多提示任务的联合学习,LAMBO实现了单一模型对多目标任务的灵活适配,进一步降低了算法异构场景下的模型维护成本。
4 未来研究方向
4.1 多模态模型协同
在未来工业互联网应用中,业务复杂性使单一模型难以满足需求,多模态模型融合成为提升云边协同调度性能的关键。以智能电网为例,Transformer模型预处理电力数据,提取时间序列特征;图神经网络(GNN)模型分析电网拓扑结构;强化学习模型依据实时反馈动态调整配电策略,多模型协作互补,降低电网损耗,提高运行效率,增强电网对复杂工况的适应能力。
多模态模型融合面临着很多技术挑战。不同模态模型架构、训练及数据处理差异大,融合时易出现参数不匹配、数据接口不兼容问题;各模型优化目标不同,协同优化时参数调整相互干扰,统一优化策略制定困难。
为此,可开发统一数据接口规范与中间件,构建通用数据预处理模块,实现数据标准化转换与传递;采用分层优化与联合训练方法,利用多目标优化算法平衡模型优化目标,减少模型间干扰,提升协同优化效果,推动工业互联网发展。
4.2 大模型的云边端协同部署
大模型的云边端协同部署是推动工业互联网高效运行的核心。云端利用强大计算资源进行模型训练和复杂数据处理;边缘端凭借低时延特性,对实时性要求高的数据进行快速预处理和本地决策;终端设备负责数据采集和简单交互操作。这种协同部署可减少数据传输量,降低网络压力,提高系统响应速度和整体性能。结合5G技术的低时延特性和物联网的数据采集能力,能为大模型协同运行提供有力支撑,助力实现更高效、智能的工业生产。
然而,大模型云边端协同部署仍面临一定问题。首先,工业场景网络环境复杂,信号干扰与网络拥塞影响数据稳定及时传输。其次,云边端协同作业涉及大量敏感数据,存在泄露、篡改风险,威胁企业生产运营安全。最后,不同工业场景对云边端资源需求不同,资源分配不均衡影响系统整体性能。
针对这些问题,可采取以下策略:网络优化方面,借助5G切片技术为不同工业应用分配专属网络资源,结合边缘缓存和本地处理技术,降低网络传输压力,保障数据稳定、高效传输;数据安全层面,运用加密算法确保数据在传输与存储过程中的保密性和完整性,通过身份认证和访问控制技术杜绝非法访问,防止数据泄露;资源分配领域,开发基于实时资源监测和任务需求预测的智能调度算法,依据云边端资源使用状况和任务负载动态调整分配策略,实现资源合理配置与高效利用。
4.3 行业定制模型开发
工业互联网涉及众多行业,各行业生产流程、业务需求和数据特征独特,通用模型难以满足特定行业精准需求。开发行业定制模型成为未来工业互联网发展的重要方向。以汽车制造行业为例,结合其高精度装配要求、复杂供应链管理和严格质量控制需求,采集生产过程、零部件、质量检测等数据,利用深度学习技术构建定制模型,可在生产过程监控、质量预测、供应链优化等方面发挥重要作用,相比通用模型其性能和准确性显著提升。能源开采、电子制造、航空航天等行业也可依自身特点开发定制模型,实现工业互联网在各行业的深度应用和智能化升级。
在行业定制模型开发过程中,面临行业数据获取困难、模型泛化性与特异性难平衡、行业知识融合复杂等问题。对此,可建立数据共享与合作机制,如搭建共享平台、运用联邦学习技术;采用多阶段模型训练与优化,先训练通用基础模型再结合行业数据微调;借助知识图谱与专家系统辅助,如构建知识图谱、结合专家系统并加强团队建设提升协作效率等方式解决。
5 结论
本文全面深入地探讨了工业互联网云边端协同调度中的关键问题,以及网络大模型在解决这些问题中的创新应用和未来发展方向。通过对数据、算力、算法异构挑战的分析,本文揭示了传统方法的局限性,凸显了网络大模型的优势。NetGPT、NetLLM和LAMBO等模型在工业互联网云边端协同调度中的应用,为实现高效、智能的调度提供了新途径。同时,多模态模型融合、云边端协同部署创新和行业定制模型开发等未来方向,为工业互联网的进一步发展指明了道路。随着技术进步和工业互联网应用拓展,网络大模型在云边端协同调度中的应用将更加广泛深入,有望推动工业互联网实现更高水平的自动化和智能化。
★基金项目:国家自然科学基金资助项目(92267108,62173322);辽宁省科学技术计划资助项目(2023JH3/10200004,2022JH25/10100005);兴辽英才计划项目(XLYC2403062)。
作者简介:
李安顺(2002-),男,河南周口人,硕士研究生,现就读于中国科学院大学、中国科学院沈阳自动化研究所,研究方向为网络大模型、边缘计算。
许 驰(1987-),男,辽宁沈阳人,研究员,博士,现就职于中国科学院沈阳自动化研究所,研究方向为工业互联网、边缘计算和人工智能。
曾 鹏(1976-),男,辽宁沈阳人,研究员,博士,现任中国科学院沈阳自动化研究所副所长,研究方向为工业互联网、边缘计算。
摘自《自动化博览》2025年2月刊