机器人行业事件点评报告:FIGURE超预期推出VLA大模型HELIX 产业趋势或迎来加速向上

2025-02-23 11:15:07 和讯  方正证券李鲁靖/王昊哲
  事件:Figure 推出自研的通用端到端VLA 大模型Helix,使机器人具备类似人类的推理能力,在无需事前代码/培训的情况下,仅通过自然语言提示即可拾取绝大多数家用品。在演示视频中,两个Figure 02 机器人在不事前代码/培训基础上,根据人类自然语言指令,将从未见过的物件收纳至合适位置(例如将易腐果汁放入冰箱),过程中机器人A 将果汁递给离冰箱更近的B,最终“自觉”关闭冰箱门、抽屉等,共同协作完成任务。
  Helix 是首个能够输出高频率连续控制整个仿人上半身的VLA 模型,也是首个能在两台机器人上同时操作的VLA 模型。根据Figure 创始人,配备Helix 的机器人可通过自然语言提示拾取几乎所有小型家居用品,包括数千种它们从未见过的物品。与以往不同,Helix 使用单一组神经网络权重来学习所有行为以及跨机器人交互(无需任何特定任务的微调)。另外,Helix是首个完全在嵌入式低功耗GPU 上运行的VLA 模型,可立即投入商用。
  Helix 内置双系统,协同运行带来速度与泛化的良好兼顾。Helix 由双系统组成:系统2 基于在互联网规模数据上预训练的7B 参数开源VLM 模型,以7-9Hz 频率运行,用于场景理解和语言理解,输出潜在语义表征;系统1 是80M 参数的交叉注意力Transformer,以200Hz 频率运行,用于处理底层控制,将潜在语义表征转化为精确的连续机器人动作,包括所需的手腕姿势、手指屈曲和外展控制以及躯干和头部方向目标。Figure 研究团队在动作空间中附加了一个合成的 “任务完成百分比 ”动作,使Helix 能够预测自己的终止条件,从而更容易地对多个任务进行排序。该解耦架构下,系统2“慢慢思考”高级目标,系统1“快速思考”执行和调整动作,每个系统都能在其最佳时间尺度上运行,让Helix 兼顾速度与泛化能力。
  Helix 模型寓示着机器人在软件端的重大突破,人形产业趋势或提速在即。
  Figure 团队收集了约500 小时的高质量多机器人远程操作数据,与传统VLA数据集相比,该数据规模非常小。另外,团队利用自动标注VLM 生成自然语言指令。Helix 的训练过程是完全端到端,通过标准回归损失将原始像素和文本命令映射到连续动作,并且引入了时间偏移来模拟实际部署中的推理延迟,确保模型在真实场景中的稳定性。此外,Helix 直接输出高维动作空间的连续控制,避免了先前VLA 方法中使用的复杂动作标记化方案。Helix颠覆了以往对于大模型进化方法的认知,它代表着一种新型的规模化法则(Scaling Law),并且具有极强的泛化能力。Helix 以200Hz 频率协调35自由度的动作,将手指运动、末端执行器轨迹、头部注视、躯干姿势等全部控制,打通机器人【接受指令-任务规划-直接输出运控指令-执行任务】的作业链路,并可互相协作、即刻商业运行。我们认为这是机器人在软件端的重大突破,产业趋势或持续提速。
  投资建议:建议关注Figure 链相关企业:旭升集团(结构件+新业务拓展)、领益智造(结构件、声学模组等)、银轮股份(执行器)、兆威机电(灵巧手)、鸣志电器(微电机)、绿的谐波(减速器)、长盈精密(轴承)。建议关注2C 场景的1X 链-中坚科技,触觉传感器重要标的福莱新材、汉威科技等。
  风险提示:人形机器人终端应用落地不及预期,人形机器人核心部件降本进程不及预期,机器人大小脑训练进程不及预期
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:张晓波 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读