前沿科技双周谈系列4:国内外GPU互联进展不断 AI角逐“又一城”

2024-12-22 15:40:05 和讯  招商证券梁程加/孙嘉擎/朱彦霖
  本篇报告深度分析了AI 大模型进入超万亿参数时代后GPU 互联由传统8 卡向超节点发展的必要性与经济效益,同时深度梳理当前国内外主流厂商GPU 互联的多种模式,并测算主流厂商Switch 拓扑中GPU 与交换芯片的配比情况。随着除NVLink 外的其他国内外GPU 互联标准相继落地,有望为产业链主体打开全新增量空间。
  AI 大模型向超万亿参数方向发展,Scale-up 网络侧流量增长带动GPU 互联方式演进。当前智算网络互联主要分为Scale-up 网络Scale-out 网络,GPU互联属于Scale-up 网络,致力于提升单个算力节点性能,对于高带宽与低时延诉求较高。当前AI 大模型向超万亿参数方向发展,传统Cube Mesh 与FullConnection 拓扑在P2P 性能上存在局限,GPU 互联方案演进势在必行。主流厂商一般通过引入Switch 芯片的方式进行多卡互联。同时,NVIDIA、腾讯侧验证结果均显示多卡超节点互联在训推层面皆具备良好性能与成本效益。
  当前业界主流的GPU 互联方式主要包含PCIe 通用方案、GPU 厂商私有协议(NVLink、ICI Link 等)、开放组织(UALink、OISA、ETH-X、ALS)与RDMA 方案四类,重点方案方面:
  1)PCIe 方案属于通用方案,当前主要引入PCIe Switch 连接多个GPU,但PCIe 传输速率与CPU 性能消耗成为系统性能提升瓶颈。
  2)NVLink 方案持续保持引领,NVLink 与NVSwitch 不断迭代,GPU 与NVSwicth 芯片配比在1:0.25(Blackwell)~1:0.75(V100、A100)区间波动。
  3)开放组织中AMD、中国移动、腾讯与阿里云等国内外头部厂商积极联合产业链上的GPU 厂商、交换芯片厂商、服务器整机商与终端用户,推进GPU互联标准与软硬件研发设计,中国移动OISA、腾讯ETH-X 当前版本交换芯片配套高于同等容量交换芯片Scale-out 网络侧配比,有望为产业链主体打开全新增量空间。
  投资建议:国内外GPU 互联进展不断,AI 角逐“又一城”。伴随着AI ScalingLaw 带动组网规模持续扩大,引入Switch 芯片、多卡GPU 互联成为满足高带宽、低时延要求的必由之路。当前,国内外厂商GPU 互联进展迅速,国外NVLink 保持领先,AMD 等成立UALink 向NVIDIA 私有互联协议发起挑战;国内头部厂商(中国移动、腾讯与阿里)积极联合GPU 厂商、交换芯片厂商、服务机整机商等产业链主体加快推进GPU 互联标准制定。建议关注:1)交换芯片产业链:【盛科通信】;2)ICT 设备商:【紫光股份】、【中兴通讯】、【浪潮信息】(计算机组覆盖)、【锐捷网络】、【华勤技术】;3)光模块厂商:【光迅科技】等。
  风险提示:宏观经济超预期扰动、贸易摩擦加剧、云厂商资本开支不及预期、技术研发不及预期等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:贺翀 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读