【英伟达最强 AI 芯片 Blackwell 延期发货,引发连锁反应】
英伟达最强 AI 芯片 Blackwell 因设计缺陷,发货时间推迟至少三个月。 台积电工程师在为其量产做准备时发现缺陷,导致生产良率下降。 这一问题影响了 Meta、谷歌、微软等科技大厂的 AI 训练进程和数据中心建设。 Blackwell 芯片大量出货预计要到明年第一季度。【英伟达应对 Blackwell 芯片延期发货】
英伟达正与台积电进行测试芯片生产运行,以解决难题。 目前的弥补措施是延长 Hopper 系列芯片发货量,加速生产 Blackwell GPU。【Blackwell 芯片延期对大模型开发商等造成重大打击】
Meta、微软、谷歌等为训 AI 重金订购 Blackwell 芯片。 谷歌订单成本远超 100 亿美元,今年在芯片等方面支出预计约 500 亿美元。 微软订单规模近几周增加 20%,原计划向 OpenAI 提供服务器的时间推迟。【Blackwell 芯片延期实属罕见】
台积电原计划量产和发货时间均被打乱。 早在 2020 年英伟达旗舰 GPU 早期版本也曾延迟,但此次情况不同。 芯片设计缺陷在量产前被发现,台积电停止生产线并重新设计的情况也不多见。【英伟达推出重制版应对挑战】
英伟达紧急开发全新系统及组件架构,如 MGXGB200AUltraNVL36。 这对数十家上下游供应商产生重大影响,复杂系统带来诸多问题。 真正影响出货的核心是 Blackwell 架构的设计本身,台积电产能也不足。 英伟达集中产能,取消部分产品,推出替代产品 B200A。【MGXGB200AUltraNVL36 架构及特点】
MGXGB200ANVL36SKU 是风冷 40kW/机架服务器,配备 36 个 GPU。 每个机架包含计算托盘和 NVSwitch 托盘,与其他产品存在差异。 现有的数据中心运营商可轻松部署,但存在一些通信和带宽问题。【部署 MGXGB200ANVL36 的挑战】
GB200ANVL36 热管理挑战大,定制后端 NIC 困难。 可能会有 x86+B200ANVL36 版本,但热管理难度大。 GB200ANVL36 风冷系统是卖点,但散热片和风扇要求高,效率低。【取消 GB200ANVL64 的原因】
英伟达曾尝试设计空气冷却的 NVL64 机架,但经分析不可行。 存在热交换、散热功率、端口空置等诸多问题,设计和交付难度大。 保留热备份时,其优势不再,不如 NVL36×2 或 NVL72。【对供应链的影响】
GB200NVL72/36x2 出货量或减少推迟,Hopper 出货量将增加。 GPU 订单下半年将转移,影响 ODM 和组件供应商的出货和收入计划。王治强 08-05 16:06
王治强 08-05 15:36
王治强 08-05 15:51
王治强 08-03 19:33
贺翀 08-03 13:33
贺翀 08-03 11:33
最新评论