电子行业AI的进击时刻25：英伟达发布VERARUBINPOD平台

2026-03-18 19:55:04 和讯广发证券王亮/耿正/焦鼎/张大伟

　　核心观点：
　　英伟达发布Vera Rubin POD 平台。根据英伟达官网，2026 年3 月16 日，英伟达在GTC 展示Vera RubinPOD，包括5 个专为Agentic AI 工作负载打造的全新机架级系统。由于Agentic 工作负载对高吞吐量、极低延迟的推理、密集的CPU 沙箱和庞大的上下文内存存储提出更高要求，英伟达此次重点加强针对Agent 应用在集群化算力和推理算力产品线的竞争力。Vera Rubin POD 主要分为两种机架：（1）MGX NVL 机架：即VeraRubin NVL72，机架内部通过NVLink 互连，承担核心GPU 计算任务；（2）MGX ETL 机架：包括Groq3 LPX机架、Vera CPU 机架、BlueField-4 STX 存储机架和Spectrum-6 SPX 网络机架，这些机架均通过Spectrum-X 以太网或Groq3 LPU 的芯片直接互连进行协同。按照官网示意图测算，一个Vera Rubin 1152 SuperPOD 由16 个Vera Rubin NVL72 机架、2 个Vera CPU 机架、10 个Groq 3 LPX 机架、2 个BlueField-4 STX 存储机架以及10 个Spectrum-6 SPX 网络机架组成，体现其围绕Agentic AI 所构建的异构协同系统架构。
　　Groq3 LPX 机架用于加速decoding。Groq3 LPX 机架集成256 个LPU 处理器，配备128 GB 片上SRAM 和640TB/s 的带宽。在Vera Rubin NVL72 与LPX 的组合架构中，GPU 主要负责Prefill 以及Decode 阶段中的Attention 计算，LPU 则负责加速Decode 阶段的FFN 计算，对每层每个输出token 的解码过程进行加速，并通过定制化Spectrum-X 互连与Vera Rubin 机架协同。根据英伟达官网披露，在每用户400 TPS 的条件下，Vera Rubin NVL72 与LPX 的组合相比NVIDIA GB200 NVL72，每兆瓦可实现高达35 倍的TPS 提升，在提升系统整体产出的同时，也更适配低时延、强交互的Agent 应用场景。
　　Vera CPU 机架承担RL/Agent 沙箱环境支撑。Vera CPU 机架集成256 个Vera CPU，采用高密度液冷设计，单个机架可支持超过22500 个并发强化学习（RL）或代理沙箱环境，用于对Vera Rubin NVL72 与LPX 输出结果进行测试、执行与验证。
　　投资建议。AI 的进击时刻，模型创新与CAPEX 筑基，AI 产业链协同发展；AI 推理驱动存储周期持续向上，扩产与升级同发力。建议关注产业链核心受益标的。
　　风险提示。AI 产业发展以及需求不及预期；AI 服务器出货量不及预期，国产厂商技术和产品进展不及预期。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：郭健东）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约