1 云边端协同联邦学习关键技术
近年来,AI取得了巨大进步,较新的AI算法与用于收集、存储和处理大量数据的高成本效益和可扩展机制相结合已将我们带入AI黄金时代。人们普遍预计AI将推动许多大规模分布式领域的应用,例如自动驾驶汽车、灾难响应、精准农业等[1]。构建AI系统的主要范式是将AI任务集中在云,通过集中式单体计算在强大的计算平台上训练模型。然而在许多应用中,数据在终端设备生成和分发,将它们转移到中央服务器将违反隐私需求并受到传输限制。为了缓解这些问题, 联邦学习[2]作为一种有前途的分布式AI范式被提出,它在保护用户隐私的同时,在边缘与海量设备协作训练AI模型。
在联邦学习中,设备用自己的私有数据训练本地模型,将模型参数而不是原始数据提交给参数服务器。例如,在周期t时,每个终端设备对模型参数ωi (t)进行训练,ηt表示梯度下降步长,Fi (·)为损失函数,得到式(1):
ωi (t)=ωi (t -1) -ηt∇Fi (ωi (t -1)) (1)
在收集到足够的参数后,参数服务器将全局模型聚合并分发给设备进行下一轮本地训练,如式(2)所示:
其中|D|=∑i |Di |为终端设备的数据量之和。以上过程不断迭代,直到参数服务器通过最小化的全局损失函数F(w)达到收敛,该函数如式(3)所示:
凭借其创新的运营理念,联邦学习为多种应用场景落地提供益处。(1)数据隐私增强:随着通用数据保护条例[3]等数据隐私保护立法, 联邦学习成为构建智能和安全系统的理想解决方案。参数服务器中的训练不需要原始数据,因此将用户敏感信息泄露给第三方的可能性降到最低。(2)低延迟网络通信:由于不需要将数据传输到参数服务器,有助于减少数据卸载造成的通信延迟,同时也节省了频谱、传输功率等网络资源。(3)提高学习质量:通过设备网络中大量的计算和数据资源,联邦学习有潜力提高整个训练过程的收敛速度,并提高准确率,这可能无法通过使用数据不足和算力受限的集中式AI实现。反过来,由于其分布式学习特性,联邦学习也提高了智能网络的可伸缩性。
图1是从集中式单体计算,分布式网联计算到云边端未来泛在多层级计算的演变过程。大多数联邦学习假设云作为参数服务器, 但随着边缘计算[4] 的出现,基于边缘的联邦学习[5~6]逐渐受到关注,其中边缘服务器作为参数服务器与终端设备协作训练AI模型。基于云和基于边缘的联邦学习都采用相同的训练算法,但两者具有基本的区别。在基于云的联邦学习中,参与的终端设备可达数百万[7] ,提供AI所需的海量数据,但是通信速度慢且不可预测,使得训练过程效率低下。相反,在基于边缘的联邦学习中,计算的延迟与通信的延迟相当,在计算和通信方面有着更好的权衡,然而边缘服务器可以访问的终端设备数量有限,导致了不可避免的训练性能损失。因此,既要利用云访问大量训练样本,又要利用边缘实现快速模型更新。这促使技术向着异构、云边端协同、全面泛在智能计算演进,云边端协同的分层联邦学习技术[8]就此提出, 且获得了相对两个技术的最佳效果。与基于云的联邦学习相比,云边端协同分层联邦学习将显著减少与云的昂贵通信,并辅以高效的终端设备。边缘更新,从而显著减少本地迭代的运行时间和数量。另一方面,由于云可以访问更多的数据,云边端协同分层联邦学习也在训练中胜过基于边缘的联邦学习。相应地,在云边端协同分层联邦学习中本地终端设备模型训练过程演化过程如式(4)所示:
其中|De |=∑i ∈De |Di |为边缘服务器连接的终端设备数据量之和, τ和σ分别是边缘服务器和云的聚合频次 (σ|τ=0)。
图1 从集中式单体计算,分布式网联计算到云边端未来 泛在多层级计算的演变
2 云边端协同联邦学习应用前景
目前云边端协同在不同行业中都有应用需求,例如可以促进智慧交通中信息互联互通,帮助工业互联网完成数字化升级和智能化转型等。这些应用场景虽然解决了带宽、能耗等问题,但很少考虑隐私安全。因此,有必要引入云边端协同联邦学习技术促进在严格保护隐私的前提下训练出合适的AI模型。
2.1 “联邦学习+智慧金融”打破数据壁垒, 成为 数字化转型的关键
金融行业受到知识产权、隐私保护、数据安全等因素影响,数据无法被直接聚合进行AI模型训练。因此,借助联邦学习来训练模型成为此领域备受关注的技术手段。微众银行推出的FATE联邦学习平台[9], 平安科技推出的“蜂巢”联邦学习平台[10] ,蚂蚁金服推出的共享AI平台[11]都将联邦学习应用于银行、保险、信贷、风控等金融领域,更好地挖掘了数据价值,实现多方共赢的AI模型训练。京东数字科技集团也推出了自主研发的联邦学习平台Fedlearn[12] ,在满足数据隐私安全和监管要求的前提下,让AI系统更加高效准确地共同使用各自数据。
2.2 “联邦学习+智慧医疗”助力医疗健康智慧化,建设医疗健康新生态
目前AI技术已被广泛用于医疗保健领域,但仍面临暴露医院/病人的私人和敏感信息、分享大量数据等 问题。应用联邦学习可以使模型计算在数据源处执行,在尊重个人隐私的前提下实现大规模的精准医疗。腾讯天衍实验室结合微众银行将联邦学习与医疗深度融合[13] ,通过搭建基于联邦学习技术的大数据集中与挖掘平台,打破了数据壁垒,保护了数据隐私,并成功落地疾病预测领域,脑卒中预测准确率达80%。同时,英伟达推出了基于Clara的联邦学习新产品[14], 将患者数据保存在医疗服务机构内部,并帮助医生进行准确高速的诊断。
2.3 “联邦学习+智慧城市”推进城市建设迈上新 台阶,提升总体水平和格局
AI技术也被用于智慧城市来提供智能属性,但目前多数方案依赖于集中式学习架构,不能适应智能设备的快速扩展。应用联邦学习可以提供更有吸引力的功能,使去中心化的智能城市应用具有高隐私和低通信延迟。2019年,微众银行与特斯联结合联邦学习和城市管理的业务经验成立了“AIoT联合实验室”,助力城市管理、社区等智能化升级[15]。京东城市以联邦学习技术为本,基于城市计算和联邦学习打造了产品“数字网关” [16] ,致力于解决城市中数据孤岛、数据共享难的问题,在不同机构间创建安全、共享、智能、高效的连接。
3 云边端协同联邦学习关键挑战和未来 展望
3.1 隐私保护
云边端联邦学习虽然通过交换模型参数而不是原始数据来保护隐私数据,但在训练过程中的模型通信也会将敏感信息泄露给第三方,例如模型的反向推导。虽然已有一些提高数据隐私性的方法,但这些方法都增加了计算复杂度和计算负担。为了进一步有效地保护数据安全,需要寻找新的方法来防止模型传输过程中信息泄露。事实上,由于网络中各种设备的异构性,不同设备的隐私具有不同特点的限制,基于特定设备隐私限制,隐私保护方法的发展成为联邦学习的一个有趣和持续的方向。
3.2 系统与数据异构
作为云边端联邦网络一部分的设备,其存储、计算和通信的能力彼此之间有很大的不同。这种差异背后的原因与硬件、网络连接和电力供应有关,并且由于连接或能源的限制,每个设备都有可能不可靠。为了避免系统的异构性,可以采用异步通信技术,使迭代优化算法并行以消除掉队者。另一种方法是在每一轮中选择积极参与的设备,以确保在一个预先定义的窗口内最大限度地聚集更新。第三种方法是当失败的设备具有某些特定的数据特征时,避免设备故障导致设备采样方案的偏差。另外,算法冗余可以作为编码计算技术被引入以实现容错。
3.3 统计学异质性
如前所述,各种设备根据设备的不同使用类型,以非同分布的方式在网络上收集数据。因此,数据可能会因底层结构而有很大的不同,这些底层结构捕捉到了设备之间的连接和它们的相关分布。数据生成的模式增加了在系统建模、分析和评估中出现掉队者的机会。当从非同分布的数据中训练模型时,数据建模和训练过程中的收敛行为分析方面都会出现问题。可以考虑使用不同的指标对统计异质性进行量化,这些指标大多是在训练阶段计算的。此外,还需要研究如何改进云边端联邦优化方法中涉及的收敛技术。
3.4 通信成本
联邦网络可能由数百万远程移动终端设备组成,联邦学习模型的训练可能涉及大量交互,此外网络中的通信速度无法保证,因此为了云边端联邦学习实用化,有必要开发具有高通信效率的方法。可以考虑使用本地更新方法,允许每个通信轮中在设备上并行实现可变数量的本地更新。这将有助于减少通信的次数。其次,模型压缩机制(即稀疏化、子采样和量化)也有助于减少每次更新时通信的消息大小。第三,在运行低带宽和高延迟网络时,分布式拓扑可以作为瓶颈实例的替代解决方案。
3.5 激励机制
联邦学习会消耗参与者的大量资源,如计算、带宽资源等,还会遭受隐私泄露的威胁,因此如果没有足够的奖励,这些因素将阻碍设备参与联邦学习。同时,如果没有足够的训练数据、带宽和算力,训练性能将会迅速下降。因此,有必要建立合理的激励机制来激励更多的设备参与,贡献高质量的数据和充足的资源。未来激励机制首先应以低成本提高学习性能为目标来激励更多的参与者加入学习。其次,应该更加重视面向企业数据的云边端联邦学习,企业的决策行为与普通设备截然不同,这就需要采取全新的激励方法。此外,未来应多关注多维度指标的综合的激励机制,以实现多目标和多功能。
3.6 实例:面向云边端协同联邦学习的激励机制
在云边端架构中,设计的激励可能有不同的形式,可以采用博弈理论、拍卖理论等多种方式来实现。例如,利用博弈论为云边端协同联邦学习设计了激励机制,云和边缘服务器将通过选择不同的支付方式来激励终端设备参与训练任务。具体地,云宣布奖励作为对边缘服务器和终端设备的激励,以最大限度地提高模型的准确性,而边缘服务器充当云和终端设备之间的媒介。理性的终端设备、边缘和云都最大化其自身效用,分别决策贡献数据量x_i、给所连接设备的奖励R_l和单位数据量的奖励P如式(5)~(7)所示:
其中,p_i,q_i,θ_i分别是设备i分配的奖励比例、多维贡献和类型,c_i (·)是相应的成本函数,E(·)和U(·)分别为边缘和云的收益函数。通过将云边端协同的层次结构映射到由效用函数相互关联的子对策中,充分把握了协同架构中各个参与者之间的内在利益关系,揭示了利益相关者对数据资源分配的依赖关系,最大化了个人效用。这种基于激励的模型参数共享过程将持续下去直到收敛,并达到了用低成本换取高性能的效果。如图2所示。
图2 面向云边端协同联邦学习的激励机制
4 总结
随着大数据和AI的发展,计算形式完成了从集中式单体计算到分布式网联计算的跃迁,并正在朝着异构、协同、全面泛在智能计算演进。云边端协同联邦学习作为一种新兴的技术方法,引发了学术界和产业界的极大关注。因此,本文介绍了近年来联邦学习技术的发展,说明了其在云边端协同领域的典型应用,强调了一些克服其应用的关键挑战并展望了一些有趣的发展方向。总的来说,面向未来泛在智能的云边端协同联邦学习将会广泛应用于各行各业,不断地、深刻地改变人们的生产生活。例如近来热度高、将有机会改变互联网形态的元宇宙,云边端协同联邦学习可以为其提供无限滋长的技术土壤,成为元宇宙最重要的基础设施之一,并对元宇宙的最终形态和融合起到决定性作用。
作者简介:
赵云凤(1997-),女,河北人,现就读于天津大学智 能与计算学部,研究方向为边缘计算、分布式机器学 习和博弈论等。 王晓飞(1982-),男,河北人,教授,现就职于天 津大学智能与计算学部,主要研究方向是边缘智能理 论、边缘计算系统架构、云边协同算法等。
仇 超(1988-),女,河北人,博士,现就职于天津 大学智能与计算学部,研究方向为边缘网络人工智能 资源优化及区块链共识算法。 刘志成(1992-),男,安徽人,现就读于天津大学智 能与计算学部,研究方向为边缘计算、多智能体学习 和博弈论等。 谭靖超(1994-),男,天津人,现就读于天津大学智 能与计算学部,研究方向为边缘计算、5G移动边缘网 络和云边端网络架构等。 邓 辉(1982-),男,河北人,现就读于天津大学智 能与计算学部,研究方向为边缘计算、算力网络、数 字城市和边云超网络架构等。
参考文献:
[1] Goodfellow I, Bengio Y, Courville A. Deep Learning[M]. The MIT Press, 2016.
[2] Mcmahan H B, Moore E, D Ramage, et al. Communication-Efficient Learning of Deep Networks from DecentralizedData[J]. 2016.
[3] Goddard, Michelle. The EU General Data Protection Regulation (GDPR): European regulation that has a globalimpact[J]. International Journal of Market Research, 2017, 59 (6) : 703.
[4] Mao Y, You C, Zhang J, et al. A Survey on Mobile Edge Computing: The Communication Perspective[J]. IEEECommunications Surveys & Tutorials, 2017, (99) : 1.
[5] Wang S, Tuor T, Salonidis T, et al. Adaptive Federated Learning in Resource Constrained Edge Computing Systems[J].IEEE Journal on Selected Areas in Communications, 2019 : 1.
[6] Tran N H, Bao W, Zomaya A, et al. Federated Learning over Wireless Networks: Optimization Model Design andAnalysis[C]. IEEE INFOCOM 2019 - IEEE Conference on Computer Communications, 2019.
[7] Bonawitz K, Eichner H, Grieskamp W, et al. Towards Federated Learning at Scale: System Design[J]. 2019.
[8] Liu L, Zhang J, Song S H, et al. Client-Edge-Cloud Hierarchical Federated Learning[C]. ICC 2020 - 2020 IEEEInternational Conference on Communications (ICC), 2020.
[9] 微众银行开源 FATE[EB/OL]. (2019-02-01) [2021-10-30].
[10] 平安科技"蜂巢"联邦智能平台入选2020网络技术应用试点示范名单[EB/OL]. (2020-12-04) [2021-10-30].
[11] 蚂蚁金服发布隐私保护白皮书[EB/OL]. (2018-08-23) [2021-10-30].
[12] 京东数科推出自研联邦学习平台Fedlearn, 助力数据安全保护并大幅提升学习效率[EB/OL]. (2020-10-12) [2021-10-30].
[13] 腾讯天衍实验室联合微众银行研发医疗联邦学习 AI利器让脑卒中预测准确率达80%[EB/OL]. (2020-04-14) [2021-10-30].
[14] NVIDIA Clara推联邦学习, 保护患者数据[EB/OL]. (2019-12-04) [2021-10-30].
[15] 微众银行与特斯联成立AIoT联合实验室, 助力智慧安防多场景智能化升级[EB/OL]. (2019-12-25) [2021-10-30].
[16] 微众、腾讯、华为、京东、平安、VMware头部企业云集, 聚焦AI联邦学习最新应用落地[EB/OL]. (2019-11-04)[2021-10-30]
摘自《自动化博览》2022年2月刊