计算机行业点评报告:华为升腾384超节点亮相 国产算力打开新格局

2025-07-30 10:10:05 和讯  银河证券吴砚靖/胡天昊
  事件:北京时间7月26日至28日,2025世界人工智能大会(WAIC)暨人工智能全球治理高级别会议在上海举办,本次大会展览面积首次突破7万平方米,800余家企业亮相,3000余项产品展出,涵盖40余款大模型、50余款 AI终端产品、60余款智能机器人以及80余款重磅新品,规模创历史之最。
  华为异腾384超节点真机首次亮相,性能对标英伟达GB200NVL72。本次大会华为昇腾384超节点即Atlas900A3SuperPoD首次亮相,其共由16 个单元(机柜)组成,其中12个单元(机柜)负责计算,4个单元(机柜)负责统信,通过高速互联总线,突破互联瓶颈,共同组成一台计算机。其中搭载 384题异腾910C,总共48组服务器,每个机柜包含4个服务器节点,在性能上可以对标英伟达GB200NVL72,根据SemiAnalysis数据,1)算力:昇腾 384超节点但集群BF16稠密算力300PF1opPS,约是英伟达GB200NVL72(BF16算力180PFlops)的1.7倍;2)内存和内存带宽:异腾384超节点内存49.2TB,约是英伟达GB200NVL72(13.8TB)的3.6倍,内存带宽为 1229TB/s,约是英伟达GB200NVL72(576TB/s)的2.1倍。
  通过总线技术解决通信瓶颈,国产算力有望加速渗透。本次华为异腾384超节点基于总线技术实现384个NPU之间的低时延互联,解决了集群内部计算、存储等各资源之前通信的瓶颈问题,具备三大优势:1)超大带宽:超节点内任意两个AI处理器之前通信带宽相较传统架构提升15倍,超节点内单跳时延降低10倍;2)超低时延:异腾384超节点Atlas900SuperPoD是业界唯一突破Decode时延15ms的方案,满足实时深度思考下的用户体验需求;3)超强性能:经过实际测试,在异腾超节点集群上,LLaMA3等干亿稠密模型训练性能可达传统集群的2.5倍以上。在通信占比更高的Qwen、 DeepSeek等多模态、MoE模型上,可以达到3倍以上的提升。根据 SemiAnalysis数据,在系统能效方面,华为单个超节点的性能是英伟达 GB200NVL72的4倍,算力能效比是英伟达的2.3倍,带宽能效比为1.8倍。我们认为,整体来看华为凭借其在通信领域的根基与优势,通过算力、存储、通信等多方面优化,某种程度上或将减少集群中算力损耗,实现算力资源的高效调度,通过系统工程及结构弥补了单卡性能不如英伟达芯片的劣势,为我国国产算力发展提供了新思路,国产算力有望加速渗透迎来黄金期。
  投资建议:我们认为华为异腾384超节点通过系统工程及结构的优化,弥补单点算力的不及英伟达芯片的劣势,为国产算力发展提供了全新思路和方向,打开国产算力新局面,国产算力产业链有望迎来催化并加速渗透,市场空间广阔,建议关注: 1)
  国产算力芯片及硬件:申科曙光、海光信息、龙芯申科、寒武纪、锐捷网络、中国长城、神州数码、拓维信息、华勤技术、泰嘉股份、华丰科技、麦格米特、英维克、曙光数创、软通动力;2)
  数据中心及算力租赁:润泽科技、光环新网、大位科技、城地香江、海南华铁;
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:张晓波 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读