电子行业AI的进击时刻25:英伟达发布VERARUBINPOD平台

2026-03-18 19:55:04 和讯  广发证券王亮/耿正/焦鼎/张大伟
  核心观点:
  英伟达发布Vera Rubin POD 平台。根据英伟达官网,2026 年3 月16 日,英伟达在GTC 展示Vera RubinPOD,包括5 个专为Agentic AI 工作负载打造的全新机架级系统。由于Agentic 工作负载对高吞吐量、极低延迟的推理、密集的CPU 沙箱和庞大的上下文内存存储提出更高要求,英伟达此次重点加强针对Agent 应用在集群化算力和推理算力产品线的竞争力。Vera Rubin POD 主要分为两种机架:(1)MGX NVL 机架:即VeraRubin NVL72,机架内部通过NVLink 互连,承担核心GPU 计算任务;(2)MGX ETL 机架:包括Groq3 LPX机架、Vera CPU 机架、BlueField-4 STX 存储机架和Spectrum-6 SPX 网络机架,这些机架均通过Spectrum-X 以太网或Groq3 LPU 的芯片直接互连进行协同。按照官网示意图测算,一个Vera Rubin 1152 SuperPOD 由16 个Vera Rubin NVL72 机架、2 个Vera CPU 机架、10 个Groq 3 LPX 机架、2 个BlueField-4 STX 存储机架以及10 个Spectrum-6 SPX 网络机架组成,体现其围绕Agentic AI 所构建的异构协同系统架构。
  Groq3 LPX 机架用于加速decoding。Groq3 LPX 机架集成256 个LPU 处理器,配备128 GB 片上SRAM 和640TB/s 的带宽。在Vera Rubin NVL72 与LPX 的组合架构中,GPU 主要负责Prefill 以及Decode 阶段中的Attention 计算,LPU 则负责加速Decode 阶段的FFN 计算,对每层每个输出token 的解码过程进行加速,并通过定制化Spectrum-X 互连与Vera Rubin 机架协同。根据英伟达官网披露,在每用户400 TPS 的条件下,Vera Rubin NVL72 与LPX 的组合相比NVIDIA GB200 NVL72,每兆瓦可实现高达35 倍的TPS 提升,在提升系统整体产出的同时,也更适配低时延、强交互的Agent 应用场景。
  Vera CPU 机架承担RL/Agent 沙箱环境支撑。Vera CPU 机架集成256 个Vera CPU,采用高密度液冷设计,单个机架可支持超过22500 个并发强化学习(RL)或代理沙箱环境,用于对Vera Rubin NVL72 与LPX 输出结果进行测试、执行与验证。
  投资建议。AI 的进击时刻,模型创新与CAPEX 筑基,AI 产业链协同发展;AI 推理驱动存储周期持续向上,扩产与升级同发力。建议关注产业链核心受益标的。
  风险提示。AI 产业发展以及需求不及预期;AI 服务器出货量不及预期,国产厂商技术和产品进展不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:郭健东 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读