2025年12月18日,大晓机器人正式发布行业首创的ACE具身研发范式、首个开源且商业应用的开悟世界模型3.0(Kairos 3.0)、让具身本体拥有自主空间智能的具身超级大脑模组A1。

01 具身智能:从“以机器为中心”转向“以人为中心”的研发
商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚表示,“以人为中心(Human-centric)”的ACE范式根本性地革新了具身智能研发路径,并且开悟世界模型3.0为机器人装上“超级大脑”。
“以机器为中心”的研发范式,其根本局限在于将机器人本体及其硬件参数置于研发流程的核心,本质上是用极高的资源消耗,换取有限且僵化的“智能”。
ACE研发范式颠覆传统逻辑,将人类与物理世界的互动规律作为核心研究起点,以环境式数据采集为引擎,构建了一套从“环境式数据采集—开悟世界模型3.0—具身交互”的全链路技术体系。环境式数据采集可实现一年千万小时的数据收集,开悟世界模型3.0则不断放大真实数据价值,使其达到上亿小时数据规模的效果。
王晓刚说:“世界模型的数据采集分为几个层次,不是一上来就采用人的行为数据,而是在底层注入了很多物理规律。模型里有思维链。当让机器人摆放字母时,如果没有理解物理规律,它们是摆放不了的,这也是以往VLA(视觉语言对齐)训练方法的短板。”
ACE范式核心技术之一是环境式数据采集技术,通过跨视角多模态设备,融合视觉、触觉、语音、力学规律等多维度数据,以物理级建模与全场景覆盖的创新设计,为具身智能模型训练提供“人—物—场”全要素精准数据支撑。
环境式数据采集技术以人为中心构建全要素采集体系,整合第一视角与第三视角视频、力触觉信息、运动轨迹、语音等多模态数据,构建基于物理基础的3D资产库,全面覆盖具身模型训练所需的各类交互信息,实现了多视角协同、长程任务覆盖与全维度信息捕捉的跨越式升级。

王晓刚表示:“相较于遥操数据采集或仿真数据,环境式数据采集的成本显著降低。”在硬件成本方面,遥操模式需购置几十万台机器人设备,而环境式采集采用AI眼镜等现有传感器,无须额外投入高价机器人;且随着规模化应用推进,传感器成本会进一步下降,原因在于当前机器人尚未形成规模化,成本难以降低。在人力成本方面,遥操采集需专门雇佣人员在实验室操作,环境式采集则可在正常工作、生活场景中开展,工作人员佩戴设备即可一边完成本职工作一边采集数据,无须额外投入人力,效率实现数倍提升。
这种低成本模式具备极强的可复制性,例如在闪购仓场景中,工作人员正常工作即可同步采集数据,这也是数据规模能从10万小时快速提升两个数量级至1000万小时的关键原因,类比特斯拉通过量产车辆,让司机边开车边反馈数据,无须专门组建采集车队,就能实现大规模数据积累。
环境式采集的数据质量核心优势在于“真实性与场景完整性”——数据源于真实工作生活场景,能完整还原实际操作中的各类细节与变量,避免了仿真数据的理想化偏差和遥操数据的场景局限性。尽管未给出具体百分比提升,但从应用价值来看,真实场景数据更能反映实际需求,为模型训练提供更精准、更可靠的支撑,其质量优势远非人工设计的仿真数据或局限于实验室的遥操数据可比。
02 开悟世界模型3.0的开源策略
作为首个“多模态理解—生成—预测”的世界模型,开悟世界模型3.0通过视觉、3D轨迹、触觉、摩擦力等多维度信息输入,深度理解真实世界的物理规律与人类行为的底层逻辑,让模型能形成“知其然,知其所以然”的思维链。

基于多模态信息的深度融合,模型可生成长时动态交互场景视频,在场景内实现各元素精准可控;并具备跨本体一键生成、多本体泛化、预测万千演化路径等特性,为具身智能提供高保真、可泛化的虚拟训练环境。

基于上述优势,大晓机器人打造了开悟具身智能世界模型产品平台,并于12月18日正式发布。开悟具身智能世界模型产品平台集成“文生世界、像驱世界、迹塑世界”等多模态生成能力,内置支持11大类、54细类,累计328个标签,覆盖115个垂类具身场景,开发者只需输入简单指令,就能快速生成可视化的任务模拟内容,并可一键分享,大幅降低具身智能的开发门槛。
王晓刚介绍,世界模型3.0实行“云服务产品+开源生态”双轨模式。在云服务平台上,用户可通过网页访问,创作、分享视频、机械臂参数等各类机器人相关数据,形成“创作—共享”的生态闭环。平台通过提供算力、存储等服务实现商业化变现,凭借成熟的产品化设计,吸引有数据创作、共享需求的用户付费使用。
开源则是通过生态共建反哺商业化。通过降低适配门槛,方便开发者进行软硬件适配,助力技术快速普及,同时收集更多用户反馈,推动模型快速迭代。当前国产化芯片成为主流趋势,开源模型能吸引芯片厂商适配,模型影响力越大,对芯片公司的价值越高,进而形成“模型—芯片”的协同生态,提升自身行业话语权;开源还能吸引更多用户参与数据创作,用户上传的初始照片、任务指令等数据,为世界模型提供丰富的场景素材,解决数据“无中生有”的问题,进一步强化模型核心竞争力。
这种模式既通过云服务实现短期商业化收益,又借助开源构建长期生态壁垒,实现了商业价值与技术影响力的双赢。
开源的重要性对芯片公司同样重要。王晓刚提到,大晓机器人跟不同芯片公司合作时,因为各公司的顶层架构软件都不一样,形成了很大壁垒。“如果大家能够基于开源的影响力,一起开发、联合优化,效率会大大提升,壁垒会降低很多。”
03 机器人产业发展尚在早期,有期待但要依规律而行
王晓刚坦言,目前机器人的开发处于行业发展初期,虽然产品形态相对明确,但市场规模仍较为有限,有在企业展厅做展示的,也有做研发的平台,在起步阶段,主要是起到普及作用,让公众了解机器人什么能做、什么不能做。“这与人工智能发展早期是一样的。新技术推出的第一步是做POC,先拿着玩一玩,再量产,一旦价值被验证后就可以实现规模化。目前还处于用户体验与价值验证的初期环节。”
在对行业现有机器人的拆解中,大晓机器人团队发现,硬件本身存在很多缺陷。比如传感器的视野范围狭窄,机器狗加载现有的传感器,能够看到的范围非常窄,过马路时不知道选择哪一条,也看不到红绿灯。机器狗也有跟随的功能,视野范围现在都是120°,如果超出这个范围,机器狗就无法跟随。大晓机器人做的是360°的UWB信号,主人往任何地方走,它都能跟上,所以硬件首先要满足场景功能上的需求,拥有空间自主能力。
从大众的期待来看,人们一直在期待通用型的机器人。王晓刚说:“这是渐进的过程,一个机器人能把不同领域的事情做好目前不太可能,但是在一个领域里尽可能地通用化就很了不起,能够产生巨大的价值。”机器人可以在底层共享知识,比如对世界的理解、思维链等,世界模型的能力可以让每个垂直领域的机器人都受益。工业机器人基于物理模型以及多年的规则积累和特定任务,可靠性高,但是通用性差一些,在一些柔性产线,需要机器人具备一定通用化的能力,这就是今天机器人发展的机会所在。
目前,大晓机器人的方案还会持续迭代,不断降低成本。王晓刚说,目前还要寻找更便宜的国产化芯片,降低功耗,“软硬一体的设计要跟场景紧密结合。”
04 四大关键要素决定机器人产业大规模应用时间
贝恩公司在《全球人形机器人产业趋势洞察》中,将人形机器人功能的核心模块分为以下几部分:跟大脑决策相关的智能模块,跟人类五官相关的感知模块,跟物理世界外部环境交互、期望能够实现高精度模拟人类动作的操控模块以及电池动力模块。
贝恩公司董事经理赵天辰认为:“从技术角度,以达到人类平均水平为目标,人形机器人在智能和感知模块还需要大概3年的时间。操控和电池模块,需要5—10年的时间。”
在智能模块中,利用通用人工智能大模型的机器人,基础推理能力已经超过人类水平,但实际场景结合任务要求和外部场景感知,实现低错误率和自主决策还是低于人类水平。在感知模块,动态识别延迟以及跟人类物理场景互动及时性,距离人类还有差距。在操控模块,人形机器人在关节自由度和灵活度已经接近和超过人类水平,但在实际运动过程中,运动稳定性、任务执行过程中低错误率远远低于人类水平。在电池动力模块,主流的全球头部人形机器人单块电池使用时间,还远远没有达到期望的8小时甚至更高水平,未来在能量密度提升或换电技术上有望进一步突破。
人形机器人下一步大规模部署会发生在什么时间,什么行业?贝恩公司大中华区高科技业务主席成鑫说,取决于四个关键方面。
第一,投资产出。现在机器人成本较高,全球领先的型号制作成本至少在5万美元以上,还没有算日常维护、运营的成本,这个成本显然是没有竞争力的,不管放在什么环境之下。所以首先看整体研发制造的成本在何时能达到合理水平。
第二,技术成熟度。在智能、感知、操作、动力等方面,还要突破一些技术。成鑫认为,目前没有无法逾越的技术障碍,更多是时间问题。“解决这些问题都有成本,比如操控部分,灵巧手的自由度方向有25—30个,但现在机器人能做到5个7个就不错了,说明它能做的范围还是比较有限,以此类推在智能感知领域、动力领域都有很多问题。”
第三,需求迫切性。有些行业并不一定非得要用机器人,主要还是在劳动力比较短缺、任务比较危险的领域。这样的行业到底有多少是一个比较大的问题。现在很多行业业务模式也在变,未来5—10年是否像现在一样还未可知。
第四,风险承受力。成鑫说:“企业能否接受机器人,还存在安全、隐私和数据问题,以及人类的自然心理问题。在护理、养老场景,如果护工变成机器人,大家心理上能够接受吗?”
上述要件都决定了机器人能不能,以及在什么时候、哪些领域进行普及。成鑫建议,看机器人产业发展时,可以围绕上述四个方面去观察。
来源:商学院






资讯频道