Agent 泛化:Agent 进入实际落地阶段,OpenClaw 引领渗透加速。早在2025 年底,火山引擎就已提出预言:AI Agent 将在2026 年爆发,有望带来国内大模型市场的十倍增长。而2026 年初,OpenClaw 的出现,成为了AI Agent 普及化加速的重要催化。OpenClaw 作为一款可在用户自有设备上运行的个人AI Agent 助手,一经推出便全球爆火,以OpenRouter平台上OpenClaw 的Token 消耗量为例,一个月间Token 消耗量便翻4倍以上。AI Agent 的落地应用正在持续加速,而这一趋势导致全球Token消耗量飙升。
需求爆发:任务密度与复杂度提升,Token 消耗迎来指数级跃升。由于Agent 天然多工具调用+长上下文+多流程工作的特性,AI Agent 的Token消耗量较大,随着智能体运行规模与任务复杂度的同步提升,活跃智能体的Token 消耗进入高速增长期。中国整体日均Token 消耗2024 年初为1000 亿,2025 年中突破30 万亿,2026 年2 月主流大模型合计日均Token消耗已到180 万亿级别。根据IDC 预测,中国活跃智能体数量将在2031年突破3.5 亿,智能体Token 消耗将迎来年均超30 倍的指数级跃升。
供给缺口:推理算力缺口显现,成本体验权衡驱动产业升级。在Token 消耗量骤增的情况下,一众主流模型厂商纷纷出现算力缺口,算力需求进一步加大,月之暗面已公开表示缺卡并寻求算力支持;而智谱则在资源紧张的情况下,对coding plan 采取了每日限售措施。智能体的核心开销集中在推理阶段,推理负载占比预计从2024 年的65%提升至2028 年的73%。
Token 消耗和算力需求不是简单的线性关系,需权衡延迟和吞吐,一方面需要追求平衡经济性和用户体验之间的平衡,另一方面需要增加算力硬件扩展最优边界。通过统筹模型能力、交互速度与Token 成本的三元平衡,持续推进算力芯片、架构精简及超节点协同优化,有望显著加速AI Agent产业化落地,并驱动算力产业链性能、能效与综合成本的全面升级。
投资建议:AI Agent 从试点进入规模化落地期,OpenClaw 的爆发式渗透验证商业可行性,Agent 渗透率和复杂度提升驱动Token 消耗激增,催生刚性算力需求。主流厂商已现缺“ 缺卡 、缺“ 限售 现象,算力供需错配加剧,从技术层面和经济层面驱动算力产业链的升级。随着国内市场Token 消耗量爆发,国产算力有望凭借成本优势及生态完善,在基础设施层逐步占据主导。建议关注:①国产算力:海光信息、寒武纪、摩尔线程、沐曦股份等;②超节点:中科曙光、浪潮信息等。
风险提示:AI 技术迭代不及预期的风险,Agent 产业落地不及预期的风险,宏观经济波动的风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘畅 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论