核心观点
7 月28 日,Google Deepmind 发布机器人大模型RT-2,理解能力和泛化能力显著提升。在视觉语言模型(VLM)的基础上,RT-2 增加了机器动作(action)的模态,将视觉、语言、机器人操作融合到一个模型中,使其可以从网络和机器人数据中学习,并将这些知识转化为机器人控制的通用指令,实现对机器人的动作控制。在模型RT-1 的基础上,RT-2 表现出了更好的泛化能力,在机器人数据的语义和视觉理解上有所提升,同时能够进行多阶段语义推理。具身智能模型通过丰富的数据集实现了性能的提升,并且在与语言大模型的结合下实现了知识和逻辑推理能力的增强。机器人是大模型与真实世界的重要媒介,随着机器人应用场景的进一步开发,机器人与物理世界交互产生的大规模多模态数据正向促进了大模型技术进步,形成良好的数据飞轮效应,具身智能模型未来具备变革各行业生产生活的巨大商业价值。
产业要闻
【软银:“日本版GPT”开发成功,预计2024 年后推出相应生成式AI 产品】
【阿里云开源通义千问70 亿参数模型,免费、可商用】
【IBM 与NASA 合作共同开源地理空间AI 基础模型,助力气候科学领域发展】
持续关注:
GPU:英伟达、超威半导体、海光信息等;
FPGA:安路科技-U 等;
SoC:高通、全志科技等;
自然语言处理:科大讯飞等;
计算机视觉:商汤-W、格灵深瞳-U 等;
自动驾驶:德赛西威、中科创达、均胜电子、光庭信息;智慧交通:千方科技、万集科技;
AI+工业:中控技术、华大九天、广立微、概伦电子等。
风险提示:北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论