1.DeepSeek 是否会抑制算力增长?短期抑制 VS 长期爆发我们认为 DeepSeek 本质是对现有 AI 算法的效率优化,短期可能导致训练需求下降,但随着模型普及和应用场景扩展,长期推理需求将显著增长,这种趋势类似于"蒸汽机降低煤耗但提升煤炭总用量"的历史现象。
2.DeepSeek 是否会改变 AI 算力的增长范式:目前不会AI 算力大致分为 1)用于研发前沿模型相关的探索性算力(AGI 方向),2)面向消费者的应用性算力(现有模型推理)。目前北美四大 AI 公司主要通过扩大 GPU 集群规模的方式探索下一代大模型。只要这个探索工作还在继续产生正向回报,AI 算力的增长范式短期或不会发生变化。
3. DeepSeek 会改变市场投资逻辑吗?软件有望跑赢硬件我们认识到,1)未来大模型竞争中,"算法效率"的重要性或上升, 投资重点可能从"算力军备"转向"算法效率"。2)开源协议使中小开发者能基于前沿模型二次开发,创造更多创新机会。投资角度,看好美股软件表现好于硬件。
4.芯片市场格局是否会改变?高端 GPU 用途受限,ASIC 占比或提升DeepSeek 的成功显示即使不使用最先进的 GPU,也可以开发满足一般消费者需求的大模型。这可能意味着,英伟达的 Blackwell/Rubin 等最先进的GPU 的用途,可能会局限在探索下一代超大规模模型(Frontier Model)上。
5.DeepSeek 真的那么便宜吗?可能没有
DeepSeek 在其 V3 技术报告中估计其训练成本只有 557.6 万美元,根据SemiAnalysis 分析,这只包含预训练阶段的部分成本,而加上 GPU 算力投资,研发、数据收集等其他重要成本或远大于这个数字。
6.DeepSeek 到底有哪些创新?混合专家 MoE,强化学习,蒸馏等主要创新包括模型架构(混合专家 MoE,MLA)、训练方法(纯强化学习)、蒸馏优化和推理效率提升等,显著提升了 AI 算法效率和性能。
7.DeepSeek 会带动中国科技资产价值重估吗?有可能目前(2025/2/3),恒生科技指数 12 月前向 PE 20.0 倍,远低于纳斯达克的35.4 倍。DeepSeek 的成功可能提高中国 AI 公司估值预期。
8.DeepSeek 会推动端侧智能发展吗?有可能,但需要时间DeepSeek 的高性价比模型有利于模型在智能手机和汽车等智能设备上落地,我们认为智能硬件迭代不会一蹴而就,模型能力提升只是其中一环。
9.DeepSeek 会导致美国提升出口管制压力吗?可能会我们注意到 DeepSeek 发布后,美国媒体进一步限制中国发展 AI 声音抬头。
建议关注后续:1)高端 AI 芯片出口管制,2)前沿模型的开源限制,3)模型回传限制,4)数据获取限制等风险。
10.DeepSeek 会改变开源软件生态吗?会
目前基础大模型的开发,主要集中在 OpenAI、Google、Anthropic、阿里,字节、百度的科技巨头手中。DeepSeek 这次的成功丰富了 AI 开源生态,也为中小开发者依托开源生态实现快速发展提供了一条发展路径。
风险提示:中美贸易摩擦升级风险,宏观下行风险,创新品渗透不及预期风险。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:郭健东 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论