大模型行业专题报告：一文读懂DEEPSEEK

2025-02-04 12:45:05 和讯浙商证券刘雯蜀/郑毅/叶光亮/陶韫琦

DeepSeek 是坚持技术创新的中国大模型，中国模型出圈。
DeepSeek 成立于2023 年7 月，由知名量化资管巨头幻方量化创立，其掌门人梁文锋是DeepSeek 的创始人，在暗涌专访中，梁文峰谈到：“这一波浪潮里，我们的出发点，就不是趁机赚一笔，而是走到技术的前沿，去推动整个生态发展。”根据2 月3 日AI 产品榜数据，DeepSeek APP 上线20 天日活超2000 万。根据Appfigures 的数据显示（不包括中国的第三方应用商店），DeepSeek App 于1 月26日登上苹果AppStore 全球下载榜榜首。根据Sensor Tower 的研究，该应用在谷歌Play 商店美国区下载排行榜中位居榜首。Sensor Tower 数据显示，DeepSeek 在发布的前18 天内累计下载量达1600 万次。
DeepSeek 是搅动全球模型市场的一条鲶鱼，带来性能、价格、开源三重冲击。
1）性能比肩国际顶尖模型：DeepSeek R1 在数学、代码、自然语言推理等任务上的性能可比肩OpenAI o1 模型正式版。在AIME 2024 数学基准测试中，DeepSeek R1 得分率为79.8%，OpenAI o1 的得分率为79.2%；在MATH-500 基准测试中，DeepSeek R1 得分率为97.3%，OpenAI o1 的得分率为96.4%。
2）低成本颠覆市场格局：DeepSeek V3 整个训练过程仅用了不到280 万个GPU小时，相比之下，Llama 3 405B 的训练时长是3080 万GPU 小时。DeepSeek-V3的训练成本仅为约557.6 万美元，而GPT-4 等模型的训练成本则高达数亿美元。
DeepSeek API 服务定价远低于OpenAI，以输出为例，每百万输出tokens 16 元（约2.2 美元），GPT - o1 每百万输出tokens 60 美元。
3）践行开源理念：DeepSeek-V3 和推理模型DeepSeek-R1 均开源，R1 同步开源了其模型权重，并允许用户利用模型输出，通过模型蒸馏等方式训练其他模型。
Meta 首席科学家杨立昆（Yann Lecun）对DeepSeek 评论“开源模型正在超越专有模型”。
ToB 端应用、AI 端侧应用将最受益于大模型的开源趋势、成本降低、迭代加速。
春节期间，华为云、微软、英伟达、AWS 等厂商均已上线DeepSeek 的模型服务。大模型是应用软件的基础设施之一，随着基础设施的能力提升和成本下降，我们将看到应用侧的百花齐放。除了DeepSeek，豆包、Qwen、Kimi 等近2 月都在快速升级迭代，月活提升，成本降低。我们认为，首先现有的B 端应用将最先迎来AI Agent，B 端应用有成熟的数据、场景，例如客服、营销类场景会较快布局活跃有效的智能代理服务。其次，随着低参数模型性能翻倍，将更适用于追求低能耗的端侧AI 创新产品。
相关标的
AI 应用：金山办公、科大讯飞、焦点科技、彩讯股份、泛微网络、鼎捷数智、汉得信息、致远互联等。港股：迈富时、金蝶国际、明源云等AI 端侧：中科创达、虹软科技、中兴通讯、润欣科技、乐鑫科技、兆易创新、移远通信、恒玄科技；
风险提示产品研发不及预期、市场需求不及预期、大模型商业落地不及预期。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：刘畅）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约