计算机行业专题研究:计算需求演进 超节点成为AI基础设施共识

2025-09-24 13:10:03 和讯  国海证券刘熹
  本篇报告解决了以下核心问题:1、超节点的演进与特征;2、AI 算力需求空间与趋势;3、国产芯片加速推进超节点布局。
  计算需求演进,超节点成为AI 基建共识
  计算基础设施需求转向搭建高带宽、低时延、持续数据供给的均衡系统。钦奇拉法则(Chinchilla Law)在规模定律(Scaling Law)基础上进一步要求参数与数据按比例协同扩展,即对高带宽、低时延的数据传输能力提出了刚性要求。而面对AI 算力需求迅速增长,单芯片性能提升幅度却在逐年收窄。在此背景下,基础设施的挑战从过去的“纯算力”问题,升级为“算力×数据供给×系统编排”的综合性工程难题。
  超高带宽互联与内存统一编址是超节点的基础技术特征。(1)超大带宽和超低时延互联:超节点借助高效的互联协议打破传统架构限制,支持更大规模AI 处理器的高效协同,实现更大范围、更高流量的数据传输,从而突破系统性能。(2)内存统一编址:超节点内所有互联设备的内存地址需全局唯一,基于全局内存可实现任意设备间的灵活访问。这使得大模型训练中频繁的参数同步操作,无需经过传统的“序列化-网络传输-反序列化”流程,直接通过内存语义通信完成,提升小包数据传输及离散随机访存通信效率。
  多级缓存池化、资源灵活配比以及高可靠性是未来产品能力持续优化的方向。(1)资源池化:将分散的计算、存储、网络资源抽象为统一逻辑资源池,以集中化管控的方式消除资源孤岛,实现动态弹性调度。(2)资源灵活配比:通过资源池化与软件定义架构的深度融合,将CPU、NPU、内存、存储等物理资源解耦为可独立调度的资源池,根据任务特征自动调整各类型资源的配比比例。(3)高可靠性:稳定性是决定系统计算效率及成本的重要指标之一,最大程度保障训练任务不中断,训练数据和和结果不丢失。
  未来五年全球AI 资本开支3-4 万亿美元,AI 推理需求将远超训练英伟达预计未来五年全球AI 资本支出将达3-4 万亿美元。下游互联网、主权国家、原生AI 厂商、AI 推理等环节需求持续增长。
  (1)CSP:谷歌将2025 年CapEx 预期从750 亿美元上调至850亿美元,主要用于AI 基础设施建设;微软Q2 的CapEx 为242 亿美元,预计Q3 的CapEx 将超300 亿美元;Meta 调整2025 年CapEx 区间为660-720 亿美元, 并表示2026 年CapEx 仍将显著增长; 甲骨文FY2026Q1 的Capex 为85.02 亿美元,同比增长269.17%,预计2026财年CapEx 将达约350 亿美元;阿里巴巴-W 在2025Q2 财报电话会上重申三年3800 亿元人民币AI 资本开支计划。
  (2)主权AI、推理AI 需求正在崛起。腾讯表示,大模型产业重心从训练到推理的转变,已成行业共识。甲骨文也强调,AI 推理市场将“远大于”AI 训练市场,为了在AI 推理市场占据主导地位。另外,主权AI 正在崛起,英伟达认为今年有望实现200 亿美元的主权AI 收入,鸿海预计未来五年主权AI 领域投资有望超1 万亿美元。
  国产芯片加速推进超节点布局
  华为以开创的超节点互联技术,引领AI 基础设施新范式。2025 年3月,华为正式推出满配384 颗Ascend 910C 芯片的Atlas 900 超节点CloudMatrix384。2025 年9 月18 日,华为发布满配8192 颗Ascend950DT 芯片的Atlas 950 超节点以及满配15488 颗Ascend 960 芯片的Atlas 960 超节点;并发布Atlas 950 SuperCluster 50 万卡集群和Atlas960 SuperCluster 百万卡集群;同时,开放面向超节点的互联协议——灵衢2.0 技术规范;还推出全球首个通用计算超节点TaiShan 950 超节点。
  中科曙光发布国内首个基于AI 计算开放架构设计的曙光AI 超集群系统。中科曙光2025 年9 月5 日发布国内首个基于AI 计算开放架构设计的产品——曙光AI 超集群系统。除了紧耦合设计,该集群系统还支持多品牌AI 加速卡以及兼容CUDA 等主流软件生态,为用户提供更多开放性选择,大幅降低硬件成本和软件开发适配成本。
  浪潮信息发布面向万亿参数大模型的超节点AI 服务器“ 元脑SD200”。根据元脑服务器公众号,8 月7 日,浪潮信息发布面向万亿参数大模型的超节点AI 服务器“元脑SD200”。该产品基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现64 路本土GPU 芯片高速互连;通过创新远端GPU 虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8 倍,单机可以提供最大4TB 显存和64TB 内存,为万亿参数、超长序列大模型提供充足键值缓存空间。
  沐曦股份发布多种超节点形态。目前,沐曦已联合上百家合作伙伴构建起覆盖芯片设计、制造封测、系统集成到数据中心的完整产业生态,推出40 余款标准机架式服务器、近10 款工作站/一体机,并创新多种超节点形态:包括光互连超节点(16-64x GPU)、耀龙3D Mesh 超节点(32/64x GPU)、Shanghai Cube 国产高密度液冷整机柜(128x GPU)以及高密度液冷算力POD。
  曦智科技发布国内首个光互连光交换GPU 超节点光跃LightSphere X。曦智科技今年7 月发布了国内首个光互连光交换GPU超节点光跃LightSphere X,并联合壁仞科技、中兴通讯首次进行示范应用,即将于上海仪电国产超节点算力集群落地。
  行业评级及投资策略:随着超节点概念的逐步成熟,其内涵从最初聚焦于硬件互联,逐渐深化为软硬件一体化的全栈协同设计。我们认为,随着基础模型竞赛的持续推进,推理需求的不断深化,围绕超节点的软硬件技术将持续演进,能突破物理极限、定义行业标准、实现算力智能调度与高可靠运维的企业将成为超节点时代的主导者。我们看好国产芯片超节点的发展突破,维持对计算机行业“推荐”评级。
  重点关注个股:1)AI 处理器:海光信息、寒武纪; 2)CPU:海光信息、中国长城(飞腾信息)、龙芯中科;3)服务器整机:工业富联、中科曙光、浪潮信息、华勤技术、紫光股份、中国长城、软通动力、神州数码、烽火通信。4)核心部件:①光模块:新易盛、天孚通信、中际旭创、光迅科技、华工科技;②散热:曙光数创、飞荣达、英维克、申菱环境、高澜股份;③铜连接:沃尔核材、华丰科技;5)算力租赁:协创数据、宏景科技、有方科技、盈峰环境、智微智能、鸿博股份、安诺其;6)IDC:奥飞数据、光环新网、大位科技、云赛智联、数据港、科华数据、世纪互联、万国数据。
  风险提示:宏观经济影响下游需求、大模型产业发展不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:董萍萍 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读