科技行业动态点评:DEEPSEEK的创新是否会削弱英伟达的优势地位?

2025-02-10 12:50:07 和讯  华泰证券黄乐平/陈旭东
  DeepSeek 的创新是否会削弱英伟达的优势地位?
  1/20,DeepSeek-R1 的发布引发科技行业关注。截至2/8,已经有16 家国产AI 芯片企业陆续宣布完成对DeepSeek 模型的适配或上架服务。我们认为:
  1)DeepSeek 提出的基于混合专家(MoE)的新架构大幅度降低了AI 推理系统的硬件要求。2)DeepSeek 采用的利用底层硬件指令语言PTX 使用GPU 的方法为绕开英伟达通过CUDA 构建的垄断提供了一条路径,3)国内AI 芯片企业快速适配的行动充分展示了中国AI 产业链的技术实力和协同效应。
  16 家国产AI 芯片企业宣布完成DeepSeek 适配
根据智东西报道,截至2/8,16家国产AI芯片企业陆续宣布完成对DeepSeek模型的适配或上架服务。这些企业包括华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、灵汐科技、鲲云科技、希姆计算、算能、清微智能和芯动力。其中华为昇腾能够提供持平全球高端GPU 部署模型的效果,燧原科技已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署。这一系列快速适配的行动充分展示了中国AI 产业链的技术实力和协同效应。产业链相关公司包括:AI 芯片(海光、云天励飞),晶圆代工(中芯、华虹),服务器(联想、浪潮),数据中心和云服务(万国数据、世纪互联、金山云)。
  创新#1:MoE 模型大幅降低AI 推理系统成本
  我们认为,DeepSeek 提出的基于混合专家(MoE)的新架构和FP8 混合精度训练等先进技术,大幅度降低了每个专家模型所需要的GPU 的性能要求。
  在价格约120 万人民币的HGX H20 服务器系统上就能够完整实现媲美OpenAI 最新模型的功能。同时,DeepSeek 提供了多个简化版本,能够在包括通用PC 服务器(预计价格:约10 万人民币),台式PC(约3万人民币),笔记本(约2 万人民币)的平台上运行,为端侧智能的发展提供契机。
  创新#2:底层硬件指令语言PTX 可能绕开英伟达在CUDA 垄断
包括OpenAI,Meta 在内大部分AI 大模型企业都采用英伟达提供的通用编程架构CUDA(Compute Unified Devices Architectured)访问GPU。CUDA的优势是不用考虑GPU 硬件细节,易于上手和使用,但只支持英伟达自己的GPU。DeepSeek 采用的利用底层硬件指令语言PTX 使用GPU 的方法为绕开英伟达通过CUDA 构建的垄断提供了一条路径。国内芯片企业也在积极优化自身产品,例如昆仑芯的P800 显卡对MoE 架构的支持性较好,单机8 卡即可运行671B 参数模型。这些因素共同促进了DeepSeek 在国产AI 芯片上的快速适配。
  风险提示:贸易摩擦风险,半导体周期波动。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王治强 HF013)

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读