传媒行业:DEEPSEEK获全球关注 国产AI持续繁荣

2025-02-04 08:00:06 和讯  国联证券姚蕾/丁子然
  DeepSeek 接连发布V3、R1 系列模型,性能比肩OpenAI2024 年12 月26 日,国产AI 厂商DeepSeek 发布V3 大模型,以极低的训练成本(557.6 万美元),实现性能对标GPT-4o。2025 年1 月20 日,DeepSeek 发布R1系列大模型(包括R1 和R1-Zero),同样在数学、代码和自然语言推理等任务上比肩OpenAI o1 正式版,引起全球AI 产业、科研界的广泛关注。
  技术层面:纯强化学习路径,助力“顿悟”式认知突破技术层面,DeepSeek-R1 系列模型主要在几个方面实现突破:1)强化学习(RL)有效性凸显:R1-Zero 选择了仅依靠强化学习(RL),而除去传统AI 推理能力训练过程中的SFT(监督微调)和思维链(COT),同样能够激发模型的推理能力;2)“顿悟”现象的出现:R1 系列模型在处理复杂问题时,会在一段时间后实现“顿悟”式的认知突破,推动R1-Zero 在AIME 数学竞赛、编程竞赛平台Codeforces 上均实现优异水平。这或将意味着AI 复杂推理、自主学习能力的进一步提升。
  效率层面:极高性价比,引起全球关注
  DeepSeek 系列模型发布后,引起全球AI 产研界、科技巨头的广泛关注,微软、Meta、Deepmind、Anthropic 等管理层对其性能及训练效率给予高度评价。其主要原因在于极高的“性价比”:在性能逼近全球顶尖模型的同时,V3 训练成本557.6万美元,仅为Meta Llama3 的约1%。据The Information 报道,Meta 已成立4 个专门小组研究DeepSeek 的工作原理,用以改进Llama 模型。
  应用层面:坚持模型开源,应用登顶多国下载榜在低成本、高性能之外,R1 系列模型坚持开源模式,选择了最开放的许可证和用户协议、明确可“模型蒸馏”,同时发布了详细的技术报告。API 服务方面,定价为每百万输入tokens1 元(缓存命中)/4 元(缓存未命中),每百万输出tokens16元,其中输出价格仅为OpenAI o1 的3%。C 端应用方面,DeepSeek 于1 月15 日推出移动端应用,1 月27 日同时登顶中美地区iOS 下载榜。据AI 产品榜数据,DeepSeek App 上线20 天日活已超过2000 万。
  投资建议:维持强于大市
  我们认为,模型角度看,从大语言模型类的豆包、DeepSeek,到视频生成类的海螺、可灵、Vidu、Pixverse,以及3D 生成类的VAST、混元,国产AI 与海外OpenAI等头部企业的差距已逐步缩小,且在部分领域实现突破。应用角度看,DeepSeek背后的国产AI 模型能力提升、调用成本降低以及开源的趋势,有望推动AI 应用生态持续繁荣。建议关注AI 模型&应用布局较早的企业:恺英网络、昆仑万维、巨人网络、盛天网络、奥飞娱乐、上海电影、中文在线、美图公司。
  风险提示:技术发展缓慢,AI 应用落地缓慢,政策监管趋严的风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:贺翀 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

    推荐阅读