机械行业周报:具身智能是AI的终极形态 持续关注人形机器人产业链

2024-03-07 18:15:07 和讯  上海证券刘阳东/吴婷婷
行情回顾
过去一周(2024.2.26-2024.3.1),中信机械行业上涨5.16%,表现处于中上游,在所有一级行业中涨跌幅排名第6。具体来看,工程机械上涨1.83%,通用设备上涨5.53%,专用设备上涨6.14%,仪器仪表上涨3.04%,金属制品上涨1.37%,运输设备上涨6.84%。
主要观点
具身智能具备由“大脑”“小脑”“脑干”组成的完整人脑结构以及可实现行动的机器身体:具身智能概念在1950 年首次被提出,指能够与环境交互感知,具备自主规划、决策、行动、执行能力的机器人或虚拟环境中的仿真人,是 AI 的终级形态。具身智能具备自主感知、认知、理解、推理、行动等类人或高于人类的能力,具备由“大脑”“小脑”“脑干”组成的完整人脑结构以及可实现行动的机器身体,其中,“大脑”部分负责对场景进行认知、理解、推断、分析,“小脑”部分开展柔性控制、协同控制、交互控制、灵巧操作等技能学习,“脑干”部分则承担能源调配、环境感知、信号分析与计算等工作。随着时代的发展和科技的进步,具身智能的概念被不断迭代和更新,尚未形成定论,但通识的理解是具有身体的智能技术,即为智能技术赋予行动能力。具身智能的实现依赖于 AI 领域的计算机视觉技术、多模态感知融合技术、自然语言处理技术、因果推断技术、移动导航与规划技术等。区别于离线智能,具身智能要求机器人具备高度自主化且可进行感知、理解与决策的“脑”,具有稳定、安全、运动自然的机器人“身体”。此外,机器人还要具备在执行人类高级指令及与环境交互过程中进行在线学习、更新“脑”和“身体”的能力。
具身智能的四个关键要素:本体、智能体、数据、学习和进化架构。
根据智元机器人稚晖君的公开发文,可以知晓具身智能的关键要素,第一是本体,作为实际的执行者,是在物理或者虚拟世界进行感知和任务执行的机构。本体通常是具有物理实体的机器人,可以有多种形态。本体的能力边界会限制智能体的能力发挥,所以,具有广泛适应性的机器人本体是非常必要的。本体具备环境感知能力、运动能力和操作执行能力,是连接数字世界和物理世界的载体。具身智能的第二个要素是智能体,是具身于本体之上的智能核心,负责感知、理解、决策、控制等的核心工作。智能体可以感知复杂环境,理解环境所包含的语义信息,能够和环境进行交互;可以理解具体任务,并且根据环境的变化和目标状态做出决策,进而控制本体完成任务。随着深度学习的发展,现代智能体通常由深度网络模型驱动,尤其是随着大语言模型(LLM)的发展,结合视觉等多种传感器的复杂多模态模型,已经开始成为新一代智能体的趋势。具身智能的第三个要素是数据,为了适应复杂环境和任务的泛化性,智能体规模变的越来越大,而大规模的模型对于海量数据更为渴求,而针对具身智能的场景则更为复杂多样,这造成了多变的环境和任务,以及围绕着复杂任务链的规划决策控制数据。尤其是针对行业场景的高质量数据,将是未来具身智能成功应用落地的关键支撑。具身智能的第四个要素是学习和进化架构。智能体通过和物理世界(虚拟的或真实的)的交互,来适应新环境、学习新知识并强化出新的解决问题方法。采用虚拟仿真环境进行部分学习是合理的设计,但真实环境的复杂度通常超过仿真环境,如 何耦合仿真和真实世界,进行高效率的迁移(Sim2Real),也是架构设计的关键。
实现优质的具身智能需解决算法、工程技术、数据、场景和复杂软硬件等诸多挑战。根据智元机器人稚晖君的公开发文,实现优质的具身智能需具备以下方面:首先,要有强大的通用本体平台。如何解决硬件的关键零部件技术突破,形成具有优秀运动能力和操作能力的平台级通用机器人产品,将具身本体的可靠性、成本和通用能力做到平衡,是一个巨大的挑战。从基础的电机、减速器、控制器到灵巧手等各部分,都需要持续进行技术突破,才能够满足大规模商用的落地需求。同时,考虑到通用能力,人形机器人被认为是具身智能的终极形态。这方面的研发,也将持续成为热点和核心挑战。其次,需要设计强大的智能体系统。作为具身智能的核心,具备复杂环境感知认知能力的智能体,将需要解决诸多挑战,包括:物理3D 环境精确感知、任务编排与执行、强大的通识能力、多级语义推理能力、人机口语多轮交互能力、long-term 记忆能力、个性化情感关怀能力、强大的任务泛化与自学迁移能力等。同时,具身智能要求实时感知和决策能力,以适应复杂和变化的环境。这要求高速的数据采集、传输和处理,以及实时的决策反应,尤其是LLM 所消耗的算力规模巨大,对于资源有限的机器人处理系统将形成巨大的数据量、AI 计算能力和低延迟的挑战。再者,高质量的行业数据将成为巨大挑战。现实场景的复杂多变,使得现阶段缺乏足够的场景数据来训练一个完全通用的大模型,进而让智能体自我进化。而且,耦合的本体,需要实际部署到真实环境中,才能够采集数据,这也是和非具身智能的明显不同。比如,在工厂作业中,由于机器人本体并未参与到实际业务,则很多实际运行数据就无法采集,而大量的人类操作数据虽然可以弥补部分不足,但仍然需要实际业务的数据。当然,通过大模型的涌现能力和思维链能力,部分任务可以零样本学习到,但对于关键业务,要求成功率,则仍然需要高质量的垂域数据。同时,通过层次化的智能体设计,将不同任务限定到特定领域,则是一个解决泛化和成功率的有效尝试。最后,通过虚拟和真实的交互,持续学习和进化的能力,则是具身智能演进的重要技术途径。亿万年的生物演化过程,造就了形态丰富的生命形式。而学习新任务来适应环境的变化,则是持续改进的动力。形态适配环境合适的智能体,则可以快速的学习到解决问题能力,进而更好的适应变化。但是,由于形态的变化空间无穷巨大,搜索所有可能的选择在有限的计算资源情况下变的几乎不可能。本体的自由度设计,也会物理上约束智能体的任务执行能力,进而限制了控制器的学习效果。在复杂环境、形态演化和任务的可学习性之间,存在着未可知的隐式关系,如何快速学习到合理的规划和决策能力,则成为具身智能的重要一环。我们认为,具身智能是AI 的终极形态,人形机器人是具身智能的终极形态,建议关注人形机器人产业链:1)总成:拓普集团、三花智控;2)传感器:东华测试、汉威科技等。3)减速器:
绿的谐波、双环传动、中大力德等;4)丝杠:恒立液压、贝斯特等;5)电机:鸣志电器等;5)装备:秦川机床、华辰装备、日发精机等。
风险提示
宏观经济下行风险、下游需求不及预期、原材料价格波动等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读