在数字化发展进程中,边缘智能(Edge Intelligence)已成为驱动各行业变革的关键力量。作为融合了边缘计算与人工智能,兼具近端处理与智能分析优势的创新技术,边缘智能不但能实现低延迟、高实时决策,还能够降低带宽需求并强化隐私安全,同时能够完成和物理世界的交互,被广泛应用于自动驾驶、智能制造、智能城市、远程医疗、视频监控等多个领域。本文将深度聚焦边缘智能发展现状、技术突破、落地瓶颈等话题,共同探讨如何更好赋能各行业数字化、智能化转型。
边缘智能为何备受关注?
根据Market.US的研究,全球边缘智能市场规模预计将从2023年的191亿美元增长至2032年的1400+亿美元,年复合年增长率(CAGR)接近26%。而Precedence Research的数据则显示,边缘计算市场在2032年可能达到3.61万亿美元,CAGR达到了30.4%。
尽管数字的差异反映了不同研究机构对“边缘”的定义,以及对通用计算、AI计算边界划分的不同,但由此展现出的共同趋势是明确的——算力下沉与场景化部署已成为不可逆的潮流,而且都给出了高达30%左右的年复合增长率。
“在历经多年云端高性能、超大规模模型的创新实践和充分验证后,如今的我们正见证着精准、高效、快速的AI模型从云端走向智能手机、汽车等边缘设备终端。”Imagination产品管理副总裁Dennis Laudick指出,企业和用户选择在边缘端而非云端处理AI任务的原因是多种多样的——从保护生物特征、位置信息、财务数据等敏感信息,到确保无网络连接时仍能提供可靠、即时响应的服务。
Imagination产品管理副总裁Dennis Laudick
与此同时,边缘硬件也正突破性能瓶颈,在设备体积与功耗的严格限制下(多数边缘设备依赖电池供电)实现所需的AI算力。据Counterpoint Research预测,到2028年,54%的移动边缘设备将具备AI处理能力。
芯科科技(Silicon Labs)方面的看法是,近年来,边缘智能作为一种边缘计算与人工智能的融合技术,能够在边缘设备上进行数据处理和智能决策,成为诸多行业追求高效智能操作、降低数据处理延迟、减少带宽消耗和增强隐私保护的重要手段,为工业、商业、医疗、家庭应用等诸多行业带来了新的发展机遇和变革。
尤其是边缘智能通过网络边缘进行数据处理和分析,能够实时响应各种业务需求,为行业数字化转型提供了强大的技术支持。例如,在工业智能制造领域,边缘智能可以帮助企业实现设备状态的实时监控和故障预测,提高生产效率和产品质量。在医疗等需要实时处理和快速响应的应用场景中,边缘智能通过将数据处理任务从云端转移到离数据源更近的边缘设备上,可以显著降低数据传输延迟,提高数据处理效率。
XMOS亚太区市场和销售负责人牟涛表示,在功能上,边缘智能一方面使设备能够在本地处理数据,减少数据传输延迟和泄漏风险,实现低延迟、快速响应且保护隐私的边缘AI处理;另一方面,作为大型智算中心或云网络的智能数据接口,通过AI对传感器数据进行组织等预处理,并在AI系统处理后转换数据格式以确保可靠运行。
XMOS亚太区市场和销售负责人牟涛
因此,与那些装备精良、耗费靡多的智算中心中强大的GPU和NPU不同,边缘智能系统对功耗、成本和芯片占板面积等因素要求甚严,因而高效率处理器或者SoC产品是边缘智能否取得成功的第一个关键因素。
落地普及程度差异明显
尽管边缘智能正经历从“单点突破”到“系统重构”的质变阶段,但不可否认的是,边缘智能在不同国家、不同行业的应用普及程度还存在比较明显的差异。
爱芯元智创始人、董事长仇肖莘博士以辅助驾驶为例做了更进一步的解释。她指出,在国际上,欧美在基础算法创新和芯片架构上领先,比如特斯拉通过自研芯片实现边缘训练和部署闭环。而中国在场景落地和工程化创新上更具优势,比如中国车企会通过场景闭环快速迭代量产方案。其更深层的影响在于:边缘智能正在重构行业价值链——制造业的“检测-维护-优化”全流程闭环、城市治理从“事后响应”到“预测干预”的范式转移,本质上是通过智能将数据转化为生产力要素的进程。
爱芯元智创始人、董事长仇肖莘博士
整体而言,中国目前处于从技术验证进入规模化应用阶段,边缘智能可以更好的完成物理世界的数字化、智能化,从而提高行业的效率,并进一步完成成果自动化交付。例如辅助驾驶已经进入到标配阶段;边缘智能可以分析路口实时数据,优化信号灯设置,降低拥堵率。在生产领域,边缘智能可以实时分析设备的运行数据,进行预测性维护,提前预警故障,减少停机时间。或者是在生产时进行缺陷检测,缩短质检周期,降低错误漏检率。
而边缘智能之所以会在不同行业产生显著的普及速度差异,仇肖莘博士认为是其核心驱动力在场景需求刚性、技术经济性和数据敏感性等方面的不同,“智慧城市、辅助驾驶、家庭数据中心和具身智能等前沿应用,就明显更适于边缘智能的普及”。
比如家用或工业机器人往往需要快速响应,尤其后者甚至需要毫秒级响应,边缘智能直接在设备端处理数据,避免云端延迟;而工厂生产数据(如工艺参数)敏感,边缘计算可减少外传风险;同时,高频传感器数据(如振动、温度)本地处理,环境的always on主动感知分析,能够降低带宽、云存储成本和云服务成本。
仇肖莘博士以家庭数据中心举例,其作为“神经中枢”可以是边缘+具身智能的融合,可以协调服务机器人、智能家电等终端,比如冰箱边缘AI识别食材存量→具身机器人自主下单采购;家庭监护边缘系统触发警报→监护机器人前往查看,等等。
相应地,相较于边缘智能所具备的低延迟、隐私保护、离线可用性等优势,某些行业因业务特性、技术限制或经济因素,边缘智能推进较慢,云计算占据着主导地位。如银行、保险等金融行业,其数据需长期存档并接受监管审查,反欺诈、风险评估等任务依赖千亿参数模型,边缘智能的存储和算力都有待发展。
“但必须明确的一点是,边缘计算不等于廉价的云计算。”仇肖莘博士指出,“边缘侧需要‘生于边缘,且专为边缘设计’的全新计算架构。”这一趋势判断在爱芯元智的技术战略上得到充分体现,其自研的爱芯通元NPU架构被定义为“原生支持边端智能”的AI时代专用处理器。
“边缘AI的发展速度很快,尤其是近一年来,关注度明显提高,但仍处于市场萌芽阶段。”英飞凌科技大中华区消费、计算与通讯业务市场总监彭祖年认为,边缘AI在提高实时响应能力、节约功耗、以及摆脱对网络依赖等方面展现出的能力,大幅提升了很多产品的用户体验。
英飞凌科技大中华区消费、计算与通讯业务市场总监彭祖年
从发展趋势来看,目前边缘AI相对来说还比较依赖于大模型的开发经验,主要是将大模型通过裁剪、蒸馏等技术小型化到边缘主控芯片上运行。因此,视觉和语音识别等应用接纳速度就比较快,那些没有现成模型可借鉴的细分场景,就需要较长的技术积累和开发周期。而未来的AI模型一定会以嵌入式场景为基础,强调高效和实时性,因此针对嵌入式场景的模型训练是值得重点关注的。
交谈中,Dennis也提到了汽车行业。作为边缘智能技术应用最广泛的领域之一,如今每辆汽车都搭载了不同层级的本地人工智能系统——从简单的摄像头画面去畸变与拼接(用于全景影像功能),到更为复杂的无干预自动驾驶技术(通过环境感知算法和路径规划算法实现)。
“汽车行业之所以能快速拥抱这项技术,不仅因为该领域的人工智能应用场景和商业模式清晰(制造商可为搭载更先进ADAS功能的车辆设置更高溢价),更得益于车载大容量电池能为高性能边缘AI系统提供充足电力支持。”他说。
相比之下,智能手机等市场仍在探索适合边缘AI的商业模式。虽然部分企业通过AI图像编辑工具实现了差异化竞争,但移动设备的性能局限要求处理技术必须实现更高能效——即便运行轻量化模型也需突破算力瓶颈。
芯科科技对《电子工程专辑》表示,边缘智能技术在不同行业的应用普及程度存在一些差异,主要与技术适配性、行业需求紧迫性、基础设施成熟度等因素影响有关。在他们看来,边缘AI/ML将更广泛应用于商业、工业和家庭,包括传感器数据处理(用于异常检测)、预测性维护、音频模式识别(用于改进玻璃破碎检测)、简单命令词识别,以及视觉应用(使用低分辨率摄像头进行在场检测或人数统计)等等。
牟涛的观点与上述受访人基本一致。他认为,边缘智能的发展不仅需要AI技术创新的拉动,同时还需要传统行业在实现数字化和网络化之后,积极探索用AI技术来再一次实现转型升级的推动力。所以许多已经从数字化中获得巨大收益的行业,往往成为带动新一轮边缘智能发展的重要领域,如安装量巨大的物联网领域、走向“新四化”的汽车行业、以及数字消费电子设备领域。
例如,智能家居、智能手机、笔记本电脑、平板电脑、可穿戴设备、智能音箱、智能相机和智能电视等带有AI功能的新兴消费电子产品在迅速增长,它们在传统CPU以外,还在主控SoC中集成了GPU和/或NPU等AI加速器,使其能够低能耗地运行各种AI模型,带来了全新的用户体验和设备生产力。同时,它能够在本地处理隐私信息,无需将敏感数据上传至云端以保护用户个人隐私。
在汽车和工业应用中也是如此,一方面这些系统的开发者正在通过添加各种传感器和环境感知手段来收集巨量的数据,并利用GPU或NPU从这些数据中通过各种机器学习或者其他AI模型和算法,形成高价值的智能化解决方案,去实现车辆的智能驾驶,或者生产出人类都无法快速分辨和判断的新产品,并对设备进行智能化管理。
“大模型+边缘计算”打开新空间
仇肖莘博士将硬件和算法列为重点。一方面,硬件要重点关注异构计算硬件在运行AI算法方面效率的提升,功耗的降低,总体而言就是不断降低边缘智能的落地成本,从而能够让边缘智能覆盖尽量多的场景,让AI更普惠。另一方面,软件应该重点关注模型的压缩技术,即如何将云侧模型的能力,以小模型、低成本的方式在边缘侧更好、更智能的运行起来。
而DeepSeek大模型的横空出世,更是为边缘智能带来了“能力下沉”和“场景适配”的双重机遇。最初,DeepSeek曾是云端计算的标杆,但正如众多基础模型的发展轨迹一样,如今也推出了能够适配边缘设备的轻量化版本——DeepSeek-VL2系列模型在性能上足以与现有开源密集型及混合专家(MoE)模型比肩。
在DeepSeek的加持下,大模型的通用认知能力通过知识蒸馏、模型压缩等技术,不但实现了AI智能的普及教育,也赋能边缘侧实现了更精准的细粒度感知和复杂决策,激发出大量的边缘智能需求,而且DeepSeek MoE架构也给边缘智能降低硬件成本提供了崭新的思路。
同时,这一演进还印证了AI领域仍能通过软件创新实现重大突破:当开发者社区获得兼具灵活架构与强劲性能的硬件支持时,他们能以惊人速度针对特定市场或设备需求定制新模型,DeepSeek的蜕变正是这种“算法-硬件协同进化”的生动范例。毫不夸张地说,“大模型+边缘计算”的技术范式正在打开新的价值空间。
“正如DeepSeek等突破性技术所展现的那样,当前阶段人工智能在准确性、性能和能效方面的重大飞跃,主要源自软件领域的创新。”Dennis认为这一规律在边缘计算领域与云计算领域同样适用——要让先进算法在市场广泛普及并将其价值带给全球用户,技术生态圈最关键的使命,就是确保边缘设备具备足够的灵活性和可编程性,以承载最前沿的模型技术。
他认为这意味着边缘硬件不能仅依赖NPU等过度专用化的处理器来满足所有AI需求。这类处理器虽能高效运行已知算法并实现高性能,却难以适配新型模型架构。反观GPU技术,不仅能让边缘设备持续受益于软件创新,更为硬件设计师和软件开发者在AI性能与可编程性之间提供了理想平衡,这种优势将长期延续。
然而在牟涛看来,尽管从具体的技术路径和实现方式来看,用于图形处理和AI训练的GPU芯片,以及多用于在边缘设备上实现AI推理的NPU芯片,或者搭载GPU或者NPU的各种SoC,是当前最为常见的。但对于边缘AI应用,除了需要有足够的算力,还需要兼顾媒体类型、运行功耗、实时性和其他系统需求,因此带有针对边缘AI应用的微架构(micro-architecture)以及相应开发工具的边缘AI芯片,将会在未来边缘智能快速发展的过程中异军突起。
例如,采用“软件定义系统设计+微架构AI加速”的AI SoC,就是未来的关键发展方向之一,因为它们能够以更灵活的方式在广泛场景中通过AI处理音频、图像和视频等多种媒体信息。也就是说,整体平台更加灵活、能够通过架构创新实现特定性能的边缘AI芯片,将有助于行业在资源受限的边缘环境中部署AI功能时,避免局限于依赖某一类特定的功能特性。
芯科科技方面指出,边缘智能的发展离不开物联网、5G、人工智能、边缘计算硬件等技术的有力支撑。在未来技术研发方向上,首先要重点关注边缘智能与云计算的协同技术。边缘智能适用于需要在设备上完成快速决策、低延迟或保护数据隐私的任务。云计算更适合大规模数据存储、复杂分析和模型训练,是对边缘智能的补充,因为在设备层面无法完成的更高级别的处理,可以在云上处理后被传回到边缘设备。
其次是安全与隐私保护技术,随着边缘智能应用的不断扩大,数据安全和隐私保护问题日益凸显。数据加密传输、设备身份认证、隐私保护计算等技术,确保边缘设备和数据的安全性,是接下来重要的技术研发方向。
边缘智能,走向开源、开放
牟涛对此表达了支持的态度。在他看来,开源和开放确实是推动边缘智能未来发展的重要手段之一,面对千差万别的边缘智能场景和应用,不可能仅靠少数应用开发企业就能开发出所有商业化的模型和工具,也需要大量的开源模型和算法来支持边缘智能尽快地落地。
“这可以支持众多企业和开发者能够迅速而低投入启动项目,并‘站在巨人的肩膀上’去开发边缘智能应用,且不会对隐私构成威胁——在边缘部署AI模型意味着仅共享所需的元数据,而非可能在云端被滥用的原始数据。“牟涛说。
仇肖莘博士指出,开源、开放既是边缘智能发展的核心路径,也是其发展的重要助力,这与爱芯元智提出的“普惠AI”的使命高度契合。边缘智能领域在落地实操中,只有开源开放基础模型能力的提升,才能让边缘智能的能力快速提高。同时,通过硬件级的安全隔离,企业、家庭、个人均可在本地硬件中完成数据闭环,有效杜绝了潜在的隐私数据泄露问题,天然具备强隐私保护特性。
Dennis则补充说,人工智能领域将始终呈现开源模型与专有模型并存的格局。而科技行业现在亟需协同推进的一个关键方向,就是制定开放标准以实现AI软件在不同设备和硬件间的可移植性。目前已有诸多实践范例,例如面向边缘设备运行AI模型的开源库LiteRT,以及UXL基金会推出的异构计算标准oneAPI。
因为软件虽然是打造优质智能体验的核心要素,但其快速攀升的开发成本已成为多个市场的隐忧。促进AI工作负载可移植的开放标准,将成为降低软件开发成本、推动边缘智能规模化落地的基石。
在隐私与数据安全方面,边缘智能具备天然优势。由于边缘AI在本地设备端运行,健康数据、财务信息等敏感内容无需上传至云端。这种架构有效规避了云端AI在隐私保护方面的不确定性风险,为用户数据筑起安全屏障。
彭祖年对开源、开放的适用领域做了进一步细化。他强调指出,开源、开放通常指代的是模型本身,而不是数据——无论是用于模型训练的数据,还是用户使用时的本地数据,都是要受到保护的。因此英飞凌在PSOC Edge AI MCU设计之初就加入了支持高阶信息安全认证的安全硬件,以保护数据不被侵犯和窃取,大大降低用户隐私数据的泄露和遭滥用的风险。
鱼和熊掌能否兼得?
随着边缘智能应用场景的不断丰富,人们一方面希望实现跨场景的数据共享与融合,以挖掘更大的价值。另一方面,又想降低边缘智能技术在各行业应用中的成本。如何解决好这两方面的问题,成为人们关心的重点。
Dennis认为这些发展机遇并非相互排斥,而是可以并行推进。对于广告、保险等应用场景,数据共享能帮助第三方洞察用户行为,从而释放商业价值。当然,与第三方共享数据并非必须选项——重视数据安全的企业完全可以通过私有云部署高性能AI算法:这类方案能够聚合企业内多终端数据,在私有服务器上进行处理,最终为决策者提供统一的数据视图。
设备端数据处理则开辟了另一个重要市场。在互联网连接不稳定、需要极速响应、或要求数据完全不离设备(如智能手表)的场景中,低成本的边缘智能技术将推动智能化应用的普及。
当然,某些情况下云端与边缘的界限会存在重叠——当AI任务既可在边缘处理也能上云时,应用开发者需要权衡两者带来的用户体验与成本效益。毕竟,云计算服务可从来不是免费的!
人工智能技术向边缘和端侧快速扩散,被牟涛视作2025及今后非常重要的趋势之一。“算力下沉”只是这种新发展的一个方面,在端侧或者边缘不仅需要算力、成本和功耗的平衡。更关键之处在于,嵌入式系统需要实现模型、组件与场景的深度集成并具备高灵活性,同时让更多熟悉特定场景的开发者能够通过优化的解决方案满足市场需求。
“这两方面的核心,是平衡好数据价值密度与部署经济性之间的关系跨场景的融合,能够让智能感知更加的充分、提升数据价值密度,提高边缘智能部署投入的ROI,即使单体的边缘智能成本上升,但是总体TCO仍保持下降。由此可见,两者并不矛盾。”仇肖莘博士进一步表示,“未来边缘计算的行业标准不再由算力峰值主导,而是由场景性能指标定义,没有场景深度的企业将面对挑战”。
实现跨场景的数据共享与融合离不开无线连接技术,作为该领域的领先公司,芯科科技凭借在物联网无线连接领域的优势,为边缘设备提供更稳定、高效的连接方案,降低边缘设备的能耗,延长续航时间,减少部署和维护成本。诸如在医疗领域,通过人工智能软件,从医疗信息系统等静态数据集(如电子病历)中汇总数据,然后将其与实时数据相结合,以显示身体状况,实现个性化的医疗。
从“场景适配”到“能力重构”
仇肖莘博士预测,未来3-5年,是边缘智能规模化落地的时间,边缘智能将经历从“场景适配”到“能力重构”的质变。随着异构计算范式逐渐成熟、“动态感知——决策”在边缘测的闭环、以及隐私计算原生架构等技术方面的演进,边缘计算将在智慧城市、智能驾驶、智慧制造、智慧家具等方面实现颠覆性的规模化落地,“事实上,边缘智能的发展将彻底重构人机交互、产业效率和社会治理的底层逻辑”。
可以预见,边缘智能将逐步摆脱“云计算附属”的定位,成为重构物理世界运行规则的基础设施。当城市管网、农机设备、能源装置等实体通过边缘节点获得自主进化能力时,人类社会的生产力革新将进入“环境智能”驱动的新纪元。
“将AI模型部署在MCU这类小系统上不失为一种两全其美的方法。MCU对系统资源需求少,实时性强,而随着MCU级别的NPU的成熟,本地的推理能力不断提升,就可以支持小系统上的AI算力。”在彭祖年看来,未来3-5年里,“边缘AI是一条两位数增长的快车道”,会出现越来越多的细分市场,尤其是在AI结合低功耗领域,是“相当有希望的方向”。
Dennis则坚信边缘硬件系统设计即将迎来一个激动人心的新阶段。众所周知,边缘AI的未来发展需要高效能、高性能且具备足够灵活性以适应未来工作负载的硬件解决方案。以往需要图形处理能力的边缘系统设计者或许不再需要额外配置NPU芯片,一些性能更强、面积更小的GPU即可满足全部需求。
牟涛认为,目前几乎所有曾经由传统数字芯片控制的市场都在向智能化转型,因此智能化以及其带来的对存储、通信和网络芯片的需求,是当前全球半导体市场最大的增长动力。例如即使在非常传统的音频技术领域,采用边缘智能技术也可以取得可观的市场成绩。
芯科科技目前正专注于开发具有内置机器学习功能的低功耗、小尺寸产品,以便直接在设备上处理数据。尤其是考虑到机器学习可以用于具有传感器、麦克风和摄像头的嵌入式系统中,以分析时间序列、音频模式(包括语音命令)和图像(用于物体检测和指纹读取)等数据。
这样做的好处是显而易见的。首先,边缘智能减少了延迟,在本地处理数据意味着能够做出更快的决策和采取实时行动,这对于需要实时响应的任务或安全关键型应用尤为重要。即使在出现网络问题或管理限制的情况下,边缘智能也能确保本地处理系统正常运行。
其次,由于敏感数据保留在设备上,因此只传输推理结果/元数据。这就降低了入侵和黑客攻击的风险,从而增强了安全性和隐私性,并保护了知识产权。最后,通过从云端卸载处理过程,边缘智能本身具有更低的功耗,并延长设备电池的续航时间。
结语
随着物联网技术的不断成熟,越来越多的设备能够连接到网络并生成数据,这些数据需要在边缘进行实时处理和分析,从而推动了边缘智能的发展。与此同时,AI模型、AI加速器为边缘智能提供了更强大的计算能力,能够支持复杂的AI算法和大规模的数据处理,使得边缘智能的应用场景正从工业领域逐步拓展到包括智能家居、可穿戴设备、智能医疗等在内的消费领域,前景十分广阔。
来源:电子工程专辑