投资要点:
本周海外算力板块受情绪影响较大。本周(0805-0807)英伟达-7.79%,主要由于Blackwell 芯片因设计缺陷推迟上市。国内算力板块出现较大回调,海光信息-8.12%,龙芯中科-6.24%,寒武纪-6.36%,主要受市场对于英伟达芯片推迟的担忧情绪影响。我们认为,市场需求仍然存在,市场担忧情绪释放,算力链有望迎来新的增长机会。本周英特尔-11.03%,已经连续四周下跌,或因业绩未达市场预期,叠加大幅裁员影响。
一、英伟达Blackwell 架构GPU 设计缺陷引发链式效应
英伟达下一代基于Blackwell 架构的AI GPU 因设计缺陷问题推迟上市。8 月3 日,据The Information 报道,Blackwell 系列中最先进的AI 芯片B200 的上市时间可能推迟三个月或更长。台积电工程师为量产进行准备时,在连接两个Blackwell GPU 的裸晶上发现了设计缺陷,这一缺陷会导致芯片良率或产量降低,通常做法是停止量产。台积电原计划在今年Q3大量生产Blackwell,并于Q4 向英伟达大量交付。目前,B200 芯片可能推迟至24Q4 量产,出货可能推延至25Q1 或更晚,商用上线可能要等到25Q2。
据Keybanc Capital Markets 估算,Blackwell 芯片为英伟达数据中心带来的收入将从2024 年的475 亿美元,提升到2025 年超2000 亿美元。英伟达回应,Blackwell 样品已经开始送出,生产正按计划在2024 年下半年增加到大规模生产,并补充说,市场对其现有的Hopper 芯片的需求仍然非常强劲。
Blackwell 芯片延迟上市可能会影响Meta、谷歌和微软等的AI 训练进程和数据中心建设。谷歌已经订购超40 万个GB200,外加服务器硬件,订单成本远超100 亿美元。今年谷歌已经在芯片和其他设备财产上,支出预计约为500 亿美元,比去年增长了超过50%。另外,Meta 提交了至少100亿美元的订单,而微软订单规模近几周增加了20%。知情人士透露,微软计划到2025 年第一季度,为OpenAI 准备5.5 万-6.5 万个GB200 芯片。而且,微软管理层原计划在25 年1 月,向OpenAI 提供Blackwell 驱动的服务器。
二、关注大模型运行算力需求,持续重视国产算力需求释放
中国移动7994 台AI 服务器集采结果落地,关注运营商侧国产替代进程。8 月6 日,中国移动发布了2024 年至2025 年新型智算中心采购中标结果。本次共集采7994 台AI 服务器,共计191 亿元,中标份额为昆仑技术21.05%,华鲲振宇17.54%,宝德15.79%,百信14.04%,长江12.28%,神州鲲泰10.53%,湘江鲲鹏8.77%。若以单台服务器8 卡计算,我们预计大约可对应6.4 万张算力卡。此前,移动23-24 年招标采购AI 服务器计划已达到2454 台,与本次招标量合计已超过万台。
关注CPU 通用服务器在模型推理侧的更多机会。浪潮信息在2U 四路的NF8260G7 服务器上成功运行了千亿参数的源2.0 大模型。运行过程中,服务器仅使用了4 颗英特尔6448H 芯片,算力达到430TOPS(INT8)或215TFLOPS(BF16),无需GPU 或其他任何额外的AI 加速卡。通用服务器相比于AI 加速芯片来说拥有更低的部署和推理成本,内存容量远大于GPU 芯片的显存容量,同时通用服务器之间通信效率更高。这项技术突破降低了AI 部署成本,并允许传统行业利用现有硬件运行AI 模型。
轻量级开源模型降低计算要求,或对移动AI 和边缘计算产生重大影响。8 月1 日,谷歌开源端侧小模型Gemma 2 2B 版本,可以在Google Colab的T4 GPU 免费层上运行,在大模型竞技场LMSYS Chatbot Arena 中仅凭20 亿参数就跑赢了GPT-3.5-Turbo。8 月6 日,智谱AI 宣布将与清影同源的视频生成模型——CogVideoX 开源。CogVideoX-2B 的提示词上限为226 token,视频长度为6s,帧率为8 帧/s,视频分辨率为720*480。
CogVideoX-2B 在FP-16 精度下的推理仅需18GB 显存,微调只需要40GB显存,这意味着单张4090 显卡即可进行推理,而单张A6000 显卡即可完成微调。
三、AI 大模型跟踪
可灵访问量值得期待,讯飞星火App 下载量持续攀升。据similarweb最新数据(0726-0801):(1)OpenAI 本周访问量有所上升。上周OpenAI发布SearchGPT 并推出GPT-4o 高级语音模式,本周访问量相应回升。(2)腾讯混元近三周表现不佳,与其他国产文本模型差距扩大。8 月7 日,腾讯混元元宝上线长文精读能力,期待后续访问量表现。(3)Runway 访问量本周有所上升。7 月31 日,Runway 推出了Gen-3 Alpha 的Turbo 版本,比原来Gen-3 Alpha 生成视频的速度快7 倍。(4)可灵访问量七月以来超300 万。7 月25 日,可灵全面开放注册,网页版集成了文生图、文生视频以及不久后将支持的视频编辑能力,成为发布即可用的一站式视觉内容创作平台。可灵AI 的三大亮点功能,包括高画质版、首尾帧控制和相机镜头控制。据七麦数据(0801-0806),讯飞星火APP 热度不减,本周下载量超360 万。8 月6 日,通义App 推出角色扮演功能,可以广泛应用于影视动画制作、创意短视频以及电商直播等场景。
建议关注
国产算力链:寒武纪、海光信息、龙芯中科、盛科通信等。
数据中心硬件:中际旭创、工业富联、新易盛、天孚通信、沃尔核材、英维克、沪电股份、胜宏科技。
风险提示
技术发展及落地不及预期;下游终端出货不及预期;下游需求不及预期;市场竞争加剧风险;地缘政治风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论