具身智能数据需求能否压缩到最小,有公司已经在探索了

发布时间:2026-06-21 作者:科技不焦虑 阅读:954 字数:2833

当前主流机器人训练高度依赖强化学习,在海量仿真和真实测试中让机器人学会控制身体。这种训练范式对于数据的体量和质量都提出了极高的要求,即便是一个简单的搬运动作,传统强化学习也需要近万条数据样本。

而近日,一家来自深圳的具身智能公司——揽月动力,却提出了一套解决方案。在他们的训练框架下,简单动作的训练样本仅需几十条,而复杂动作也可以通过拆解,将训练样本的需求压缩至原来的十分之一到二十分之一。

成立于2024年的揽月动力,是一家专注于强交互、复杂操作机器人研发的具身智能公司,创始团队核心成员覆盖工程、商业与产业背景。首席科学家王雪峰博士现任北京大学先进制造与机器人学院助理教授,在机器人控制与非线性动力学领域发表国际期刊论文30余篇,获IEEE/ASME会议最佳论文奖。2025年11月,揽月动力完成数千万元天使轮融资,投资方为银河通用机器人、泸州老窖金舵资本、建银国际(上市公司金力永磁合作基金)、L2F光源创业者基金。

揽月动力的创新范式引发了行业的深层思考:具身模型的训练,是否能突破“题海战术”的桎梏?

解题公式

传统强化学习的数据黑洞,根源是两个叠加的死结。

一是任务本身的复杂度。操作任务的状态空间维度极高,环境参数的微小扰动就会让已有数据失效,每个场景、每个环境参数的变化几乎都需要独立采集。

二是力控数据在操作任务中不可或缺,偏偏采集成本又极高。力是物理交互的核心变量,但它是一个 "隐性变量"。要获得真实的力反馈,只能靠六维力传感器和精密伺服系统,成本远超视频和仿真采集。

揽月动力给出的答案是:约化模型(Reduced-Order Model)。

简单理解:把机器人复杂的多体运动系统降阶降维,将高维变量——关节、连杆、惯量、接触力、驱动力矩——降维成更基础的物理参数:加速度、减速度、角度、力矩、重心变化,再通过数学方式抽取关键特征,建立低阶动力学方程。这不是让机器人"背题",而是让机器人先掌握"解题公式"。

揽月动力先用约化模型建立动作的物理框架,让机器人掌握动作大方向;再用强化学习校正姿态偏差、精度损失和场景差异等。其直接效果就是对于训练数据的需求量急剧缩减。

在同等工业动作训练标准下、大负载人形轮足机器人场景,揽月动力所需训练数据较行业均值降低60%-75%,整体算力消耗相较行业通用方案减少55%-70%。

“约化模型的核心价值不是用更多数据暴力拟合物理世界,而是用物理规律减少对数据的强依赖。”揽月动力对钛媒体表示。

边动边校正

约化模型的另一个重要的价值在于实现了"高频力控"。

大模型在数字世界已经很强,但在物理世界面前,它的能力边界非常清晰。

首先是延迟。 主流大模型的推理时延动辄百毫秒到秒级,足够生成一段优雅的文字回答,但对物理世界来说远远不够。机器人抓取一个易碎工件时,手指传感器感知到滑移的那一刻,留给系统做出反应的时间窗口只有几毫秒——大模型还没推理完,工件已经掉在地上。

其次是闭环。 大模型是开环系统——输入信息、推理、输出结果,没有真正的物理反馈。而物理世界的每一次操作,本质上都是连续校正的过程:力大了要减、滑了要握紧、工件变形了要重新调整角度。这种"感知—判断—执行—再感知"的毫秒级闭环,是大模型的架构层面就无法承载的。

第三是物理表征的缺失。 大模型理解"杯子""桌子"这些语义概念,但它不理解杯子被握住时手指上的压力分布,不理解纸箱被压扁时形变的方向,更不理解一块磁铁吸附到金属表面瞬间的力矩变化。这些信息根本不在它的训练数据里。

第四是错误代价。 大模型的"幻觉"在数字世界只是一个错误答案,但在物理世界,一次力的估算错误就可能意味着工件报废、设备损坏,甚至安全事故。
这正是约化模型不可替代的位置:它不是给机器人"想清楚再动",而是让机器人"边动边校正"。

在工业现场,约化模型把每一次接触、每一次受力、每一次姿态偏差都映射到底层物理参数,配合关节传感器实时调整力矩输出——这种自校正能力,是大模型架构层面给不了的。

在机器人控制系统中,频率不是一个参数,而是能力边界。高层大脑通常几十赫兹(任务规划级别);中层全身协同控制需要几百赫兹;底层关节力控和实时反馈,往往需要每秒上千次。

具身智能数据需求能否压缩到最小,有公司已经在探索了

揽月动力约化模型的中层全身控制输出频率可达1000Hz——机器人每秒能进行上千次力学计算与动作修正。高频力控它意味着每一次接触都能被实时感知,每一次偏差都能被毫秒级修正。匹配上六维力传感器等硬件反馈,得以实现机器人在搬运、推门、上下料、码垛等工业任务中保持动作稳定。

世界模型的物理底座

世界模型的目标,是让机器人不仅看懂任务,还能理解世界如何变化并预测下一步状态。但一个容易被忽略的问题是:世界模型生成的虚拟数据,不天然保证物理正确。

如果这些数据不符合真实接触力学、关节力矩和重心约束,虚拟数据越多,训练反而越偏离真实世界。

约化模型的价值在这里被放大。它可以成为世界模型和机器人本体之间的"物理翻译器":把世界模型生成的数据映射到可对照、可验证的物理参数体系,物理上合理的数据保留,不合理的过滤掉,再进入小脑控制和机器人预训练。

从这个意义看,揽月动力真正想成为的,是Physical AI技术栈中最底层的那块基座——大模型负责理解任务,世界模型负责预测环境,约化模型回答最后也是最关键的问题:这个动作,在真实物理世界里到底能不能稳定执行?

不讲“万能机器人”

纯轮式机器人稳定、负载强,但在复杂工厂环境中缺乏主动姿态能力,面对弯腰、推门、搬箱等全身协同动作,能力边界明显。全尺寸双足人形热度高,但能耗高、稳定性难、控制复杂,工业现场仍面临诸多挑战。

双轮足是两者之间的折中——相比纯轮式,它能主动调整重心,姿态控制能力更强;相比双足,能耗更低,稳定性更强,量产难度更可控。

揽月动力的L1系列面向工业搬运、码垛、上下料、物流分拣等高重复性力控任务,负载能力从25kg级向更高负载版本迭代,目标是用更低成本、更强稳定性进入真实工厂。

而揽月动力的落地路径,也围绕工业和物流两条主线展开。

在制造业场景,公司已围绕汽车零部件、磁材加工等场景推进样机验证和产线替代,任务包括弹簧箱搬运、码垛、上下料、磁铁块上料等;在物流场景,机器人进入仓库验证,面向分拣、搬运等高重复性岗位替代。

这些场景有一个共同特征:动作对稳定性、负载能力、连续作业和ROI有明确要求。而这正是大模型直接给不出答案,必须靠物理智能解决的领域。 工人能把磁铁块稳稳放进料槽,靠的不是"看懂图纸",而是手感、力反馈和肌肉记忆——机器人复现这套能力,靠的也不是更大的语言模型,而是约化模型驱动的实时校正能力。

揽月动力不急于讲一个"万能机器人"的故事,而是先把小脑力控和双轮足本体放进真实工业场景中验证。只要能够在这些场景中完成稳定交付,就可以获得客户反馈和持续迭代数据,再逐步扩展到更复杂的精细操作和人机协同,最终走进人类生活场景。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

本文为本站原创内容,如需转载请注明出处。

本文永久地址:https://mip.ace6239.store/article/15589.html

文章观点仅供学习交流参考。

代表作品