复杂具身任务的长时序推理与分层决策方法综述
- 作者:
- 点击数:2476 发布时间:2026-02-10 13:24:06
- 分享到:
面向机器人操作与导航等复杂具身任务,长时序推理与分层决策需要兼顾语义规划、技能复用与连续控制,并在稀疏回报与物理不确定性条件下保持闭环鲁棒性。本文以任务层、技能层与控制层的分层视角为主线,系统综述分层强化学习与技能先验、潜在世界模型与序列建模,以及面向多模态观测的表征学习与技能库构建等经典路径。在此基础上,总结大语言模型在任务分解、技能调用与计划修复中的作用,并梳理视觉、语言与动作基础模型及扩散与流匹配策略在大规模数据驱动统一策略建模中的进展。最后,面向真实部署讨论跨任务泛化、长期记忆与预测耦合、实时算力与安全对齐、评测与数据闭环等关键问题,并给出融合式系统架构的研究展望。