事件描述:
1 月20 日,DeepSeek R1 模型正式发布,在数学、代码、自然语言推理等任务上的性能比肩OpenAI o1 正式版,目前已在网页端、APP 端和API 全面上线。DeepSeek 在开源DeepSeek R1 Zero 和DeepSeek R1 两个660B 模型的同时,蒸馏并开源了6 个小模型,其中32B 和70B 模型在多项能力上实现了对标OpenAI o1 mini 的效果。
事件点评:
DeepSeek R1 和V3 模型在强化学习、MoE 架构、MTP、PTX 编程等多个维度进行全方位优化,整体性能对齐国际顶尖大模型。DeepSeek 模型优异的性能主要得益于其团队在多个维度进行系统性优化,其中,1)强化学习:DeepSeek R1 模型直接从V3 基础模型实施强化学习训练,成为首个无监督微调的强化学习训练模型,在激发模型自我学习能力的同时降低数据标注的成本;2)MoE:相比于GShard 等传统MoE 架构,DeepSeek MoE 专家粒度更细,其拥有256 个路由专家和1 个共享专家,能够大幅提升模型性能;3)MTP:即多token 预测,通过提前预测部分输出token,DeepSeek 模型效率得到显著提升;4)PTX 编程:DeepSeek 开创性地采用类似汇编语言的英伟达并行线程执行(PTX)编程,而非完全依赖CUDA,PTX 作为一种非常接近底层硬件的指令集架构,使DeepSeek 团队能够实现更细粒度的优化操作。此外,DeepSeek 还支持FP8 精度训练、使用多头潜在注意力机制等实现高效训练和推理。
对应用的影响:模型性能提升叠加调用成本下降,AI 应用发展有望加速。凭借架构创新和工程优化,DeepSeek 用更少的数据和更低的成本就研发出性能比肩OpenAI o1 的模型,目前包括国内的百度、腾讯及海外的微软、亚马逊等在内的大型CSP 均已接入DeepSeek 模型,通过其云平台向AI 应用开发者及用户输出模型能力。同时,DeepSeek R1 的使用成本大幅低于o1 模型,DeepSeek R1 API 的服务定价为每百万输入tokens 1 元(缓存命中)/4元(缓存未命中)、每百万输出tokens 16 元,而o1 的输入价格为每百万tokens55 元(缓存命中)/110 元(缓存未命中),输出价格为每百万tokens 438 元。
基于DeepSeek 等低成本的高性能模型,上层AI 应用的开发及落地有望加速,根据AI 产品榜数据,DeepSeek APP 上线20 天日活突破2000 万,已成为全球增速最快的AI 应用,同时,部分初创公司已开始从OpenAI 模型向DeepSeek 切换,其中,企业级AI 代理开发商SuperFocus 将从GPT-4o 等模型转向DeepSeek。
对算力的影响:推理算力需求有望爆发,国产芯片厂商将充分受益。在训练端,虽然DeepSeek V3 论文中公布的557.6 万美元训练成本仅考虑了正式训练阶段,不包括与此前架构、算法和数据研究及消融实验相关的成本,但我们认为,基于DeepSeek 的算法创新和工程优化效果显著,其总训练成本仍将显著低于其他主流模型,而这将推动中小型大模型厂商沿着DeepSeek的路径再次大力投入模型研发,从而助推训练算力需求持续增长;在推理端,DeepSeek 有望促进AI 应用发展提速,进而显著刺激推理算力需求。由于AI推理对单个集群的算力要求远低于训练,而更关注推理效率和性价比,ASIC以及国产芯片有望逐步抢占英伟达GPU 的份额,目前华为昇腾、海光信息、寒武纪、昆仑芯等国产AI 芯片第一梯队厂商正加速追赶英伟达,其中,昇腾910B 已基本可对标A100,成为国内互联网厂商国产训练芯片的首选,而寒武纪、海光信息、昆仑芯新一代主力产品思元590、深算三号、昆仑芯3代未来有望对H20 形成替代。
投资建议:DeepSeek 在保持高性能的同时降低使用成本,将加速AI 应用发展,进而推动推理算力需求快速增长,同时,基于DeepSeek 蒸馏的小模型将加快模型在端侧场景的落地,因此重点关注1)各领域的头部AI 应用厂商,包括金山办公、汉得信息、彩讯股份、万兴科技、三六零、新致软件、泛微网络、能科科技、润达医疗等;2)国产算力芯片厂商,包括海光信息、寒武纪等;3)AI 服务器厂商,包括四川长虹、神州数码、拓维信息、浪潮信息、中科曙光、华勤技术等;4)算力云厂商,包括青云科技、优刻得等;5)端侧硬件厂商,包括美格智能、移远通信、广和通、乐鑫科技、中科蓝讯、恒玄科技等。
风险提示:AI 产品落地不及预期,行业竞争加剧风险,技术研发进展不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘畅 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论