科技行业动态点评:从TOKEN角度 测算AI算力需求

2025-07-01 18:30:06 和讯  华泰证券谢春生
  推理算力需求增长或快于算力单位成本下降
  总算力支出受到算力需求与成本的共同影响。随AI 应用用户数量的不断增长及Agent 的渗透不断提升,推理端算力需求不断上升;同时,由于硬件的迭代与infra 算法的不断改进,模型推理的单位成本不断下降,模型推理价格目前已下降到2023 年初的1/100 以下,目前市场对未来推理端算力支出节奏存在分歧。本报告旨在提供一个推理算力需求从用户渗透到Token 调用、再到硬件支出的分析框架,我们通过对Google 与微软(OpenAI)未来Token 调用量、算力总需求和未来硬件支出节奏的测算,得出结论:推理算力需求增长速度快于单位算力成本的降低。我们持续看好推理端算力需求的加速增长。
  海内外大厂Token 调用量增长迅速,推理算力需求快速增长海外CSP 厂商来看,根据25 年5 月Google I/O 大会数据,Google 的Token月均调用量从24 年4 月的9.7 万亿增长至25 年4 月的480 万亿,增长50倍。根据微软FY25Q3 电话会数据,Azure AI 基础设施在25 年一季度处理了超100 万亿Token,较去年同期增长5 倍,其中3 月份单月Token 调用量达50 万亿。国内互联网大厂来看,25 年5 月字节火山引擎Token 日均调用量为16.4 万亿(月均508T),是24 年5 月的137 倍。我们认为,海内外大厂Token 调用量已出现明显加速拐点,推理端算力需求快速增长。
  考虑到单位算力成本下降后,Google 算力支出仍有望高增AI 搜索的渗透是Google Token 调用量增长的主要驱动,通过对AIOverview、AI Mode、Gemini 2C 应用和其他推理需求的测算,我们预测Google 25 年第二季度Token 总量有望达到2009 万亿,环比增长223%,相较于24Q2 的71 万亿Token 增长接近30 倍。单位算力成本 = 单位价格/ 算力,受软件算法优化与新版本芯片的部署影响,单位算力成本呈现下降趋势,根据我们测算,4/5/6 月单位算力成本分别环比下降14%/13%/13%,下降幅度小于4/5/6 月算力需求提升的环比增速56%/38%/32%。根据我们测算结果,Google 25 年二季度推理算力开支仍有望环比增长100%以上。
  用户使用量与Deep Research 的渗透有望驱动微软算力需求高增微软Token 调用量的提升主要源于OpenAI ChatGPT 网页的访问量上升及Deep Research 功能的渗透。考虑到以上两因素的影响,在我们的预测框架下,微软25 年第二季度的总Token 调用量有望达到205 万亿,环比增长约100%。算力成本角度,算法优化带来模型浮点运算利用率的提升,即同样数量的芯片能带来更多的有效算力。根据我们测算,考虑到算法优化带来的算力成本下降后,微软年底的推理算力卡需求量仍约为3 月的两倍有余,我们预测微软的算力硬件需求仍将维持高速增长。
  风险提示:宏观经济波动;技术落地不及预期;本研报中涉及到未上市公司和未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王治强 HF013)

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读