科技行业动态点评：DEEPSEEK的创新是否会削弱英伟达的优势地位？

2025-02-10 12:50:07 和讯华泰证券黄乐平/陈旭东

　　DeepSeek 的创新是否会削弱英伟达的优势地位？
　　1/20，DeepSeek-R1 的发布引发科技行业关注。截至2/8，已经有16 家国产AI 芯片企业陆续宣布完成对DeepSeek 模型的适配或上架服务。我们认为：
　　1）DeepSeek 提出的基于混合专家(MoE)的新架构大幅度降低了AI 推理系统的硬件要求。2）DeepSeek 采用的利用底层硬件指令语言PTX 使用GPU 的方法为绕开英伟达通过CUDA 构建的垄断提供了一条路径，3）国内AI 芯片企业快速适配的行动充分展示了中国AI 产业链的技术实力和协同效应。
　　16 家国产AI 芯片企业宣布完成DeepSeek 适配
根据智东西报道，截至2/8，16家国产AI芯片企业陆续宣布完成对DeepSeek模型的适配或上架服务。这些企业包括华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、灵汐科技、鲲云科技、希姆计算、算能、清微智能和芯动力。其中华为昇腾能够提供持平全球高端GPU 部署模型的效果，燧原科技已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署。这一系列快速适配的行动充分展示了中国AI 产业链的技术实力和协同效应。产业链相关公司包括：AI 芯片（海光、云天励飞），晶圆代工（中芯、华虹），服务器（联想、浪潮），数据中心和云服务（万国数据、世纪互联、金山云）。
　　创新#1：MoE 模型大幅降低AI 推理系统成本
　　我们认为，DeepSeek 提出的基于混合专家(MoE)的新架构和FP8 混合精度训练等先进技术，大幅度降低了每个专家模型所需要的GPU 的性能要求。
　　在价格约120 万人民币的HGX H20 服务器系统上就能够完整实现媲美OpenAI 最新模型的功能。同时，DeepSeek 提供了多个简化版本，能够在包括通用PC 服务器（预计价格：约10 万人民币），台式PC（约3万人民币），笔记本（约2 万人民币）的平台上运行，为端侧智能的发展提供契机。
　　创新#2：底层硬件指令语言PTX 可能绕开英伟达在CUDA 垄断
包括OpenAI，Meta 在内大部分AI 大模型企业都采用英伟达提供的通用编程架构CUDA（Compute Unified Devices Architectured）访问GPU。CUDA的优势是不用考虑GPU 硬件细节，易于上手和使用，但只支持英伟达自己的GPU。DeepSeek 采用的利用底层硬件指令语言PTX 使用GPU 的方法为绕开英伟达通过CUDA 构建的垄断提供了一条路径。国内芯片企业也在积极优化自身产品，例如昆仑芯的P800 显卡对MoE 架构的支持性较好，单机8 卡即可运行671B 参数模型。这些因素共同促进了DeepSeek 在国产AI 芯片上的快速适配。
　　风险提示：贸易摩擦风险，半导体周期波动。本研报中涉及到未上市公司或未覆盖个股内容，均系对其客观公开信息的整理，并不代表本研究团队对该公司、该股票的推荐或覆盖。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王治强 HF013）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约