文章 | 第 6782 期 约 2065 字 阅读约 20 分钟
在全球具身智能领域,世界模型的发展正从“生成好看”迈向“真能干活”的关键阶段。近期,在权威评测基准WorldArena榜单中,由清华大学陈建宇团队与斯坦福大学Chelsea Finn团队联合研发的Ctrl-World世界模型交出了一份惊艳答卷:在具身任务能力上斩获全球第一,并在视频生成质量上排名全球第二,综合表现超越了谷歌、英伟达等国际顶尖模型。这一成就不仅标志着中国团队在具身智能前沿领域的突破,更揭示了世界模型向高实用性演进的新方向。 WorldArena之所以成为行业公认的权威榜单,源于其“全面、硬核、具引领性”的定位。该基准由清华大学牵头,联合普林斯顿大学、新加坡国立大学、北京大学、香港大学、中科院、上海交通大学、中国科学技术大学等8所全球顶尖学术机构共同研发,聚焦具身世界模型的核心需求,设计了涵盖16大核心指标与3大真实应用任务的全方位评测体系。评测维度包括视觉质量、运动质量、内容一致性、物理贴合度、3D准确性、可控性等,并直接模拟数据引擎、策略评估、动作规划等真实机器人应用场景,确保模型不仅“看起来真实”,更“真正可用”。此次评测吸引了谷歌、英伟达、阿里、字节、智谱、智元、斯坦福大学等全球14款顶级模型同台竞技,结果堪称行业技术发展的“风向标”。 在WorldArena的评测中,Ctrl-World在EWMScore综合指标上表现卓越,具体体现为两大维度的高分: 具身任务能力全球第一:在主体一致性、轨迹精度、深度准确性、策略评估一致性四大核心维度上均位列榜首。其中,主体一致性得分0.8411(全球第一),确保了生成视频中物体的身份、外观与时序稳定,为机器人作业提供了高保真的“数字孪生”对象;轨迹精度得分0.4766(全球第一),意味着生成的机械臂运动轨迹与真实物理轨迹高度吻合;深度准确性得分0.9300(全球第一梯队),展现了对三维空间结构的精准把握;策略评估一致性Pearson相关系数高达0.986,近乎完美复刻真实物理模拟器的评估结果,使虚拟测试可直接替代昂贵真实环境。 视频生成质量全球第二:在视频生成综合评分中,Ctrl-World以59.70分排名第二,仅次于阿里Wan 2.6(61.86分),但超越了谷歌Veo 3.1(58.87分)和英伟达Cosmos-Predict 2.5等模型。这体现了其在生成高质量视频的同时,保持了卓越的物理合理性与实用价值。 Ctrl-World的领先并非偶然,其背后是一系列创新技术设计: 1.动作条件化(Action-Conditioned)架构:与许多文本条件化模型不同,Ctrl-World采用显式动作建模,直接将机器人动作参数(如关节角度、末端执行器位姿)作为生成条件。这强制模型学习“执行动作→产生状态”的因果物理链,避免了常见物体穿透、隔空吸附等物理错误,从而在交互质量、轨迹精度等指标上实现突破。 2.物理引擎约束嵌入:在训练过程中,Ctrl-World嵌入了物理引擎监督,将牛顿力学定律内化为生成硬约束。这使得生成内容严格遵守质量、摩擦、碰撞等物理守恒律,因此其策略评估相关性高达0.986,远高于英伟达Cosmos-Predict 2.5的0.483,确保了虚拟环境与真实动态的高度一致。 3.多视图联合与视频预测模型:为提升空间认知能力,Ctrl-World融合多视图联合预测,隐式建模深度图与点云结构。这不仅助力其在深度准确性上达到0.9300的顶级水平,也使其在“堆叠积木”等需要精确三维感知的任务中表现优异。 Ctrl-World的评测优势直接转化为实际应用价值。在策略评估任务中,其0.986的相关性意味着开发者可用它高效测试机器人策略,大幅降低研发成本;在动作规划中,高轨迹精度与深度准确性确保了机械臂能精准完成“调整瓶子”、“点击铃铛”等操作,避免抓空或碰撞;在数据引擎任务中,其生成数据的物理合理性使合成视频能有效训练真实机器人策略,解决了“虚拟数据训练,真实世界失效”的行业痛点。 Ctrl-World在WorldArena的登顶,标志着具身世界模型的发展重点已从视觉保真度转向功能实用性。通过以物理规律为根、空间认知为骨,Ctrl-World证明了在机器人仿真、策略训练等场景中的巨大潜力。随着WorldArena等评测体系持续推动行业创新,具身智能有望加速迈向高可靠性、低成本落地的未来。 星动纪元是一家成立于2023年8月、由清华大学交叉信息研究院孵化的具身智能与人形机器人公司,也是清华大学唯一直接持股的人形机器人企业。公司定位为“原生通用具身智能体定义者”,坚持“具身大脑+人形本体”软硬一体化全栈自研。 公司核心产品包括星动L7全尺寸工业人形机器人、星动Q5服务机器人以及星动XHAND 1五指灵巧手。其自研的ERA-42端到端VLA具身大模型,是全球仅有的四款可实现全尺寸双足人形机器人全身及五指灵巧手精准控制的系统之一,与特斯拉Grok、英伟达GR00T等并列。 成立仅两年多,星动纪元已完成近10亿元A+轮融资,累计融资超18亿元,估值近90亿元,成为全球人形机器人赛道最年轻的超级独角兽之一。其商业化进展迅速,2025年订单总额突破5亿元,海外业务占比达50%,产品已进入北美、欧洲等核心市场,全球市值TOP10的科技公司中有9家是其客户。 来源:深观启元 关于我们 地址:北京市海淀区学院南路86号





资讯频道