通信周跟踪:再论昇腾CLOUDMATRIX384创新性 算力板块迎来业绩情绪双击

2025-07-04 18:15:14 和讯  山西证券高宇洋/张天/赵天宇
  投资要点
  行业动向:
  1)近期华为联合硅基流动发布Cloudmatrix384(以下简称CM384)技术论文,软硬协同实现推理效率大幅提升
  1.1 全对等互联UB 总线架构充分利用内存池概念,将通信时延影响下降到最低。CM384 中384 个NPU 和192 个CPU 均通过UB 交换机连接,节点间通信性能接近节点内通信性能,从而可令384 卡拥有全局可寻址的计算和内存能力,从而促使统一的资源池化和高效的工作负载安排。UB 网络采用clos 架构设计,16 个机架中的L1/L2 层交换机形成二层无阻塞网络,确保任意两个NPU/CPU 间通信带宽恒定。CM384 还引入了AIV 直连机制,可以通过UB 网络写入远程NPU内存,跳过SDMA 中转,使得NPU 启动延迟大幅下降。
  1.2 CM384 集成三个独特但互补的网络平面,可以适配细粒度的工作任务调配。其中一个是UB 平面,全拓扑架构连接384 个NPU 和192 个CPU,每台NPU提供392GB/s 的单向带宽,UB 能够实现高效细粒度并行策略例如TP 和EP,并且能快速点对点访问池化内存,对于高效缓存模型权重和键值权重至关重要。第二个是RDMA 平面,采用融合RDMA(RoCE)技术,每个NPU 提供400Gbps带宽,关键功能包括推理中prefill 和decoder NPU 间高速传输KV cache、RDMA分布式训练推理。第三个是VPC 平面,通过高速网卡将CM384 连接到更广泛的数据中心网络,每个节点400Gbps 单向带宽,VPC 负责处理管理和控制平面操作、访问持久化存储以及来自CPU 驻留工作负载的外部服务通信。
  1.3 CANN 软件栈深度优化,华为云运行deepseek 效率超H800。华为云基础设施软件栈包括了MatrixResource(资源分配管家)、MatrixLink(网络通信管家)、MatrixCompute(逻辑节点管家)、MatrixContainer(容器部署管家)以及ModelArts(AI 全流程管家)。华为通过CANN 软件栈充当中间软件层,实现高级AI 框架与昇腾NPU 低级硬件接口的高效集成,使昇腾开发者能够以最小的代码更改利用昇腾硬件,对标CUDA+GPU 实现接近峰值的设备性能。根据论文实测数据在DeepSeekR1 Prefill 阶段,在同样的batchsize 下,H800 的每卡每TFLOPS tokens吞吐为3.96,而CM384 为4.45;decode 阶段H800 为1.17,CM384 为1.29。
  1.4 从未来昇腾演进方向看投资机会。论文认为,统一VPC 和RDMA 平面、更大规模的超节点、CPU 的物理分解和池化是昇腾集群未来进化的主要方向。我们认为,CM384 创新二层交换超节点架构带来了高速铜连接模组纯增量和光模块的大幅新增需求,下一代产品单卡带宽有望继续大幅增长,高速连接器差分对需求增加、光模块400G 有望升级800G。同时超节点规模的进一步扩大将会给MPO  高密度布线和OCS 交换机带来确定性机会,尤其是OCS 交换机在处理千卡规模超节点时成为业内公认技术路线,谷歌的TPU 部署已具备成功经验。同时,CPU的物理分解和池化可能将NPU 机柜密度进一步提升有利于液冷和高功率电源的渗透。
  2)算力板块Q2 业绩展望乐观,市场情绪缓和下市场迎来重要做多窗口在上周举办的GTC 巴黎峰会上,英伟达宣布,法国、意大利、英国等区域技术与云供应商Domyn、Mistral AI、Nebius、Nscale 将为主权AI 部署超过3000EFLOPS 的Blackwell 系统。在德国,英伟达正为欧洲制造商如西门子打造全球首个工业AI 云,将由DGX B200 系统和搭载1 万个GPU 的RTX PRO 服务器提供支持,这些工业AI 云将运行工业设计仿真、工业自动运维、数字孪生、自动驾驶和机器人训练等。随着特朗普政府废除“AI 出口分级政策”,主权AI 以及各行业垂类应用成为接棒北美投资的重要市场。
  我们建议关注ORACLE、xAI、mistral 等算力产业链;同时我们认为,AI 下沉市场部署刚刚开始,建议重视边缘计算和端侧设备机会,比如基于CX8 PCIE交换机的推理服务器、DGX Spark AI 盒子等在产业链的映射标的。
  3)东山精密公告拟收购索尔思光电,光模块主力上市公司再添新成员。
  根据芯智讯援引《经济日报》报道,鸿海最新一代GB300 服务器已在测试中,下半年有望出货,由于与GB200 架构相似,鸿海预期GB300 量产爬坡更为顺利,今年云端网络业绩将逐季成长。而另一家系统厂商广达GB200 机柜第二季度已放量出货,GB300 正在测试与客户验证阶段,预计9 月出货,CSP 大厂对GB300需求火热,下半年AI 服务器出货量大预期大幅增长。英伟达系统厂商出货反馈显示,算力链相关的光模块、铜连接、PCB 等有望实现逐季环比业绩增长,而各类大模型应用API 调用量屡创新高也打消了投资人对2026 年市场需求的顾虑。
  我们认为,光模块和铜连接作为AI 芯片的超线性增长配套成长属性依旧强劲,建议同时把握业绩释放和新技术事件催化(如CPO OCS)双重投资机会。
  建议关注:昇腾产业链:华丰科技、华工科技、光迅科技、光库科技、英维克、兴森科技、生益电子、南亚新材;光模块:中际旭创、新易盛、天孚通信、联特科技、腾景科技、东山精密;铜连接:沃尔核材、鼎通科技、奕东电子、鑫科材料、新亚电子、兆龙互连。
  市场整体:本周(2025.6.23-2025.6.27)市场整体上涨,创业板指数涨5.69%,申万通信指数涨5.53%,深圳成指涨3.73%,科创板指数涨3.17%,沪深300 涨1.95%,上证综指涨1.91%。细分板块中,周涨幅最高的前三板块为IDC(+8.70%)、光模块(+7.92%)、设备商(+7.65%)。从个股情况看,和而泰、光迅科技、光环新网、新易盛、三旺通信涨幅领先,涨幅分别为+16.77%、+12.84%、+12.26%、+11.97%、+11.61%。中国电信、中国移动、博创科技、东土科技、宝信软件跌幅居前,跌幅分别为-1.90%、-1.68%、-0.90%、+1.78%、+2.18%。
  风险提示:
  海外算力需求不及预期,国内运营商和互联网投资不及预期,市场竞争激烈导致价格下降超出预期,外部制裁升级。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘畅 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读