智通财经APP获悉,华泰证券(601688)发布研报称, AI Agent是一种能够感知环境、进行决策和执行动作的智能实体,市场对Agent+终端的研究聚焦于硬件层面,但软件算法及生态领域的研究也十分重要。从AI Agent的进展看,在理论研究中发现通过CoT(思维链)、ReAct(推理+行动)等方式能够完成部分的任务规划,且长期看通过AI Agent或有望进一步走向整体智能;在实践中,通过将AI助手嵌入工作流也已打造出基于特定数据、场景的Agent产品雏形。随着底层大模型能力的提升,Agent+工作流的工程化实践深入,AI Agent能力有望进一步提升,或将推动AI商业化进程加速。
LLM推动AI Agent进入新阶段,AI应用商业化或加速
AI Agent是一种能够感知环境、进行决策和执行动作的智能实体,从发展历程看,经历了用逻辑规则和符号封装知识、快速响应环境、基于强化学习等发展阶段。随着大语言模型(LLM)的快速发展,AI Agent在感知、记忆、规划、行动等模块方面的能力均得到了进一步的提升。我们认为LLM推动AI Agent进入了新阶段,与LLM结合的AI Agent在智能化程度、自主性方面有进一步提升的潜力,通过与终端的进一步结合,有望推动AI应用商业化加速。
AI Agent能力提升:感知/规划/记忆模块强化或工程化优化
从AI Agent的研究看, AI Agent的要素基本上可以分为感知、定义、记忆、规划、行动五类模块。从AI Agent的能力提升路径看,主要包括:1)单个模块的持续强化:感知模块的模态持续丰富、记忆模块增长上下文或提供更加丰富的数据来源、规划模块中通过CoT或ReAct等方式提升推理能力、行动模块补充第三方插件;2)系统性方式优化:如通过将AI各个模块作为整体发挥作用,利用不同环境之间交互获取的跨模态数据,在物理和虚拟世界中运行等。综上,在底层模型升级+工程化方法改进的共同推进下AI Agent的性能有望持续提升。
Agent自动解决固定范式的问题,关注Agent Workflow
基于LLM的Agent实践已经取得一定的成果,从AutoGPT、GPTs、Devin等案例中可以看出,当前Agent将LLM应用于信息检索、工具学习、任务分解、垂直知识学习、人机交互等场景,实现了能力的突破。一方面LLM相比传统NLP在处理文本信息中的效率有所提升,另一方面特定数据训练赋予LLM较好的解决垂类问题的能力,基于此当前LLM对于固定范式下解决问题已经能够实现较好的自动化。我们认为通过Agent Workflow的方式,能够更好的实现AI Agent与具体任务的结合,或将推动LLM技术在更复杂的应用场景中进一步提升效率。
Agent改变人机交互方式,关注软硬件产业机遇
AI+终端实现了安全性与个性化的结合,为Agent落地打下良好基础。AI Agent有望改变人机交互的方式,落地方式包括AIPC、AI手机等。终端掌握了重要的交互入口,据Apple WWDC,Siri用户每天发出的语音请求数量高达15亿次,大量的交互为Agent提供了丰富的场景载体;此外通过压缩模型到适合端侧大小的模型,使用优化算法加速推理,实现在端侧落地。对比Agent的技术架构,往往也需要基础模型和小模型的共同支撑,我们认为端侧模型技术的发展(模型压缩等技术)有助于Agent落地于终端。
相关公司梳理
从AI Agent的进展看,在理论研究中发现通过CoT(思维链)、ReAct(推理+行动)等方式能够完成部分的任务规划,且长期看通过AI Agent或有望进一步走向整体智能;在实践中,通过将AI助手嵌入工作流也已打造出基于特定数据、场景的Agent产品雏形,我们认为随着:1)底层大模型能力的提升;2)Agent+工作流的工程化实践深入,AI Agent能力有望进一步提升,或将推动AI商业化进程加速。重点关注公司:1)协同办公厂商;2)垂直应用厂商;3)终端厂商。具体公司名单,请见研报原文。
风险提示:模型能力进步不及预期;安全性风险;本研报中涉及到未上市公司和未覆盖个股内容,均系对齐客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
王丹 07-16 13:10
王丹 07-16 13:00
王丹 07-16 11:50
王丹 07-16 11:15
王丹 07-16 11:00
王丹 07-16 10:35
王丹 07-16 09:55
张晓波 07-16 10:13
最新评论