人形机器人系列之八:人形机器人究竟需要怎样的AI模型?

2023-09-25 08:20:04 和讯  广发证券代川/孙柏阳
  实现任务级交互将成为解决人形机器人通用化难题的关键。当前人形机器人行业面临着高需求、低渗透率、商业化落地难的发展瓶颈,其核心原因在于机器人通用化水平不达预期。按照机器人控制层级的划分,通用化能力的提升需要机器人能够拥有高层级的自主规划能力。因此,如何让人形机器人独立完成高层级规划,实现任务级交互,将成为决定人形机器人能否实现商业化落地的关键。
  多模态大模型的发展为实现人形机器人任务级交互带来曙光。大语言模型在常识理解、任务拆分、逻辑推理、自然语言交流方面的能力已经为人形机器人带来了出色的人机交互能力。不仅如此,随着科技巨头的入局,融合了视觉、语言等多模态数据的大模型正不断涌现,两条技术路线下均有成果产出,有望进一步提高人形机器人的通用化水平。
  大模型赋能机器人感知模块,进一步加速下游应用领域突破。大模型不仅为人形机器人带来决策能力的提高,在感知模块也正引领机器视觉训练新范式。Meta 发布的SAM 模型首次将大模型引入机器视觉领域,依靠AI 算法自动实现图像/视频标注,大大降低了上游训练成本和难度,有望加速机器视觉在下游机器人应用领域的突破。
  实时性问题是大模型的主要难点,运控问题上基础模型更有优势。虽然大模型在高层级规划问题上展现出了杰出的性能,但其依旧存在实时性差等局限,不适用于底层精细的运动控制;在此领域,参数量更少、响应速度更快的基础模型具有相对优势。
  大模型or 基础模型,人形机器人究竟需要怎样的模型?短期来看,人形机器人需要的是可以优化特定场景应用的基础模型+大模型,两者各司其职、相互补充;长期来看,随着算力提升和模型结构持续优化,新一代高效率大模型的出现和应用才能真正实现人形机器人通用化。
  风险提示。技术迭代速度不及预期、安全隐私法规影响、道德风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读