DeepSeek-V3 奠定模型高效训练基础,R1 通过大规模强化学习使开源模型推理能力追平o1。开源模型直接带来AI 产业模型能力普遍提升,同时低廉的使用成本搭配卓越的性能倒逼OpenAI 降低GPT 使用成本、加速模型迭代,促进产业生态繁荣。大模型能力普遍提升首先利好AI 应用开发,尤其小模型易于在端侧落地,长期看DeepSeek 带来的应是算力层面的杰文斯悖论,整体AI 应用生态繁荣应将带来推理算力的更大需求。
DeepSeek-V3 奠定模型高效基础,R1 通过大规模强化学习使开源模型推理能力追平o1。DeepSeek-V3 通过算法创新和工程优化大幅提升模型效率,从而降低成本,提高性价比。DeepSeek-V3 为了实现高效的推理和经济的训练,沿用了V2 即提出的MLA 和DeepSeekMoE,同时通过MTP、FP8 精度训练、并行优化等方法进一步提升效率。在V3 基础上,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1 正式版,还蒸馏了6 个小模型开源给社区,其中32B 和70B 模型在多项能力上实现了对标OpenAI o1-mini 的效果。
算法的改进和优化带来模型能力提高的同时成本降低,持续提升模型性价比,推动AI 生态繁荣。DeepSeek-R1 在Web 和App 端可完全免费使用,模型均开源,多领域性能比肩OpenAI o1,API 服务定价为每百万输入tokens 1元(缓存命中)/ 4 元(缓存未命中),每百万输出tokens 16 元,OpenAI-o3价格仍约为R1 的八倍。当前V3 及R1 模型已迅速集成进海内外各大云平台中,直接拉高模型能力下限,促进AI 应用开发提速升级。
OpenAI 快速跟进,AI 行业迭代速度加快。1 月31 日,OpenAI 推出了全新推理模型o3-mini,并首次向免费用户开放推理模型,o3-mini 是OpenAI 推理系列中最新、成本效益最高的模型,现在已在ChatGPT 和API 中上线。2月2 日,OpenAI 推出面向深度研究领域的智能体产品deep research,能够针对复杂任务在互联网上开展多步骤调研,并在几十分钟内完成人类需耗费数小时才能完成的工作,深度研究功能专为金融、科学、政策、工程等领域的高强度知识工作者设计。
投资建议:1)云厂商加速接入DeepSeek,低廉的使用成本搭配卓越的性能倒逼OpenAI 降低GPT 使用成本。此外,DeepSeek 开源模式有望快速提升其他大模型综合实力,大模型能力普遍提升首先利好AI 应用开发。重点关注有垂类优势的头部AI 应用厂商以及AI Agent 最有落地场景的企业级服务软件:金山办公、用友网络、金蝶国际、泛微网络、合合信息、同花顺、万兴科技、福昕软件、彩讯股份。2)AI 模型更易在端侧落地,软件Agent 情绪有望延伸至硬件,关注端侧AI 机器人、眼镜、玩具、手机、PC 等方向。3)长期看,DeepSeek 带来的应是算力层面的杰文斯悖论,整体AI 应用生态繁荣带来推理算力的更大需求,建议关注金山云、宝信软件(通信)、数据港、寒武纪、海光信息、中科曙光。
风险提示:AI 应用研发进度不及预期、地缘政治风险、AI 芯片研发不及预期、技术创新不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘静 HZ010)
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论