计算机行业:DEEPSEEK提振国产大模型信心 有望促进AI行业发展

2025-02-06 16:25:08 和讯  东兴证券刘蒙/张永嘉
  事件:
  (1)2024 年12 月底,DeepSeek-V3 正式发布,DeepSeek-V3 为自研 MoE模型,671B 参数,激活37B,在14.8T token 上进行了预训练;(2)2025 年1 月底,DeepSeek-R1 发布,性能对标 OpenAI o1 正式版。
  点评:
  算法+工程创新提升DeepSeek-V3 模型效率,后训练阶段使用强化学习技术增强R1 推理能力。(1)模型表现优异,DeepSeek-V3 多项评测成绩超越了Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲;DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1 正式版;(2)推理效率提升,通过算法和工程上的创新,DeepSeek-V3 的生成吐字速度从 20 TPS 提高至 60 TPS,相比 V2.5 模型实现了 3 倍的提升,使用体验更加流畅;(3)成本大幅降低,DeepSeek-V3和R1 在web 端和APP 端可免费试用,调用API 方面,DeepSeek-V3 模型 API服务定价调整为每百万输入 tokens 0.5 元(缓存命中)/ 2 元(缓存未命中),每百万输出 tokens 8 元;DeepSeek-R1 API 服务定价为每百万输入 tokens1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。
  推理与多模态为大模型趋势,成本降低有利于大模型产品商业化落地进程。我们在《计算机行业2025 年投资展望:信创、AI 应用构投资主线,新质生产力领域具结构机会》(2024 年12 月31 日)报告中指出,多模态、复杂推理能力提升仍为大模型迭代趋势,DeepSeek-R1 低成本推出更是加速市场对大模型推理能力提升的认知及需求,有望促进大模型产品商业化落地进程。据AI 产品榜统计,DeepSeek 应用(APP)日活跃用户 DAU 第 5 天超过 ChatGPT,第 15 天是 ChatGPT 的 2 倍,达 259 万日活跃用户,成为全球增速最快的 AI 原生应用。R1 的推出及爆火验证了市场对大模型能力提升及成本下降的敏感度依然较高,从整个AI 市场来看,成本下降带来的用户量提升的弹性较大,有望促进整个行业商业化落地进展提速。
  投资建议:DeepSeek-V3 及R1 的推出提振国产大模型信心,验证大模型发展趋势,有望促进大模型商业化落地进程,(1)基础设施供应商如中科曙光、浪潮信息(通信组覆盖)等;(2)已发布通用大模型或积极探索AI 行业应用落地的科大讯飞、昆仑万维、三六零、拓尔思等公司,以及(3)具备AI 应用落地场景的相关标的,如金山办公、福昕软件等公司有望受益。
  风险提示:大模型产品迭代不及预期、科技摩擦加剧影响行业发展、AI 产 品化商业化落地不及预期风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:郭健东 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

    推荐阅读