通信行业:英伟达引领AI基建时代 LPU拓展推理边界

2026-03-19 16:50:07 和讯  银河证券赵良毕/洪烨
  事件:2026年3月17日凌晨,英伟达2026年GTC大会拉开幕,创始人兼CEO黄仁勋发表主题演讲,会上正式推出全新AI超算平台VeraRubin,集成VeraCPU、RubinGPU、NVLink6交换机、BlueField-4DPU、Spectrum-6以太网交换机、ConnectX-9超级网卡,以及新纳入的Groq3LPU共7款芯片。
  营收指引上调彰显算力高景气,LPU拓展推理边界。黄仁勋给予英伟达2025-2027年在AI算力芯片方面的累计营业收入指引为至少1万亿美元,较2025年GTC大会对2025-2026年的预测翻倍。过去三年AI产业的三个里程碑式产品分别为ChatGPT开启AIGC时代、o1推理模型将复杂问题分解为可处理步骤、ClaudeCode革新软件工程,单个工作负载的计算量提升约1万倍,整体使用量提升约100倍,彰显算力高景气。作为Blackwell的接力者,Rubin架构将于2026年下半年量产,全面转场台积电3nm工艺,单GPU在NVFP4精度下的训练算力达35PF1ops、推理算力达50PF1ops,其规模化训练与推理能效较Blackwell1分别提升3.5倍与5倍。由于电力限制,固定功率下每瓦的Token吞吐量直接决定生产成本,英伟达通过从芯片、硬件、软件、生态的协同设计,在训练大型MoE模型时Rubin所需GPU数量仅为Blackwell的1/4,同时每瓦推理Token吞吐量提升10倍,在1GW的IDC内,Token生成速率可达7亿/秒。2025年12月英伟达斥资约200亿美元与Groq达成技术、人才、运营方面的授权协议,其创始人兼CEOJonathanRoSS(前谷歌TPU项目核心成员)加入英伟达负责LPU的技术整合,LPU采用基于SRAM的片上存储显著降低时延,顺应当下AIAgent、物理AI等即时处理应用趋势,且与CUDA生态高度契合,将作为“Token加速器”集成至VeraRubin平台专攻解码,拓展推理边界,以保障在每百万Token150美元以上的超高速层AI服务中的性能输出,对其他CSP大厂自研ASIC芯片抢占推理市场份额的举动做出有力回击,目前由三星代工的GroqLP30芯片已进入量产阶段,预计2026Q3出货,同时Groq3LPX机架上的LPU密度自64个增加至256个后,出货量预期也随之大幅上修。
  液冷确定性加强,Feynman、太空算力未来可期。VeraRubin采用100%液冷设计,使用45C温水冷却,移除繁杂缆线,安装时间从2天缩短至2小时,黄仁勋还预测传统IDC中液冷渗透率会超过50%,AIDC最终会到达100%,而VeraRubin升级到NVL144后将抬高单机柜液冷组件价值量。
  Rubin的下一代架构Feynman亦同步问世,采用台积电1.6nmA16制程,挑战物理极限,首度引入芯片级光互联,较Rubin带宽密度提升10倍、传输能耗下降90%。同时英伟达还将目光投向太空计算,Space-1VeraRubin模块专为尺寸、重量、功率受限的环境设计,可为轨道IDC、地理空间智能、自主空间操作提供边缘AI推理服务,较H100实现25倍的性能飞跃。
  投资建议:英伟达AI全栈技术精进下开启基建时代,算力军备竞赛趋势延续,未来Token吞吐量迎指数级增长拉升推理需求,进一步打开产业链相关赛道空间,建议关注:(1)光模块与CPO:中际旭创、新易盛、天孚通信、光迅科技、华工科技等;(2)光芯片:仕佳光子、源杰科技、长光华芯等;(3)液冷:英维克、阿莱德等;(4)太空算力:普天科技、通宇通讯等。
  风险提示:AI技术选代过快的风险;AI硬件产能释放缓慢的风险;下游CSP大厂Capex不及预期的风险;中美科技摩擦加剧的风险等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘静 HZ010)

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读