DeepSeek 是坚持技术创新的中国大模型,中国模型出圈。
DeepSeek 成立于2023 年7 月,由知名量化资管巨头幻方量化创立,其掌门人梁文锋是DeepSeek 的创始人,在暗涌专访中,梁文峰谈到:“这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”根据2 月3 日AI 产品榜数据,DeepSeek APP 上线20 天日活超2000 万。根据Appfigures 的数据显示(不包括中国的第三方应用商店),DeepSeek App 于1 月26日登上苹果AppStore 全球下载榜榜首。根据Sensor Tower 的研究,该应用在谷歌Play 商店美国区下载排行榜中位居榜首。Sensor Tower 数据显示,DeepSeek 在发布的前18 天内累计下载量达1600 万次。
DeepSeek 是搅动全球模型市场的一条鲶鱼,带来性能、价格、开源三重冲击。
1)性能比肩国际顶尖模型:DeepSeek R1 在数学、代码、自然语言推理等任务上的性能可比肩OpenAI o1 模型正式版。在AIME 2024 数学基准测试中,DeepSeek R1 得分率为79.8%,OpenAI o1 的得分率为79.2%;在MATH-500 基准测试中,DeepSeek R1 得分率为97.3%,OpenAI o1 的得分率为96.4%。
2)低成本颠覆市场格局:DeepSeek V3 整个训练过程仅用了不到280 万个GPU小时,相比之下,Llama 3 405B 的训练时长是3080 万GPU 小时。DeepSeek-V3的训练成本仅为约557.6 万美元,而GPT-4 等模型的训练成本则高达数亿美元。
DeepSeek API 服务定价远低于OpenAI,以输出为例,每百万输出tokens 16 元(约2.2 美元),GPT - o1 每百万输出tokens 60 美元。
3)践行开源理念:DeepSeek-V3 和推理模型DeepSeek-R1 均开源,R1 同步开源了其模型权重,并允许用户利用模型输出,通过模型蒸馏等方式训练其他模型。
Meta 首席科学家杨立昆(Yann Lecun)对DeepSeek 评论“开源模型正在超越专有模型”。
ToB 端应用、AI 端侧应用将最受益于大模型的开源趋势、成本降低、迭代加速。
春节期间,华为云、微软、英伟达、AWS 等厂商均已上线DeepSeek 的模型服务。大模型是应用软件的基础设施之一,随着基础设施的能力提升和成本下降,我们将看到应用侧的百花齐放。除了DeepSeek,豆包、Qwen、Kimi 等近2 月都在快速升级迭代,月活提升,成本降低。我们认为,首先现有的B 端应用将最先迎来AI Agent,B 端应用有成熟的数据、场景,例如客服、营销类场景会较快布局活跃有效的智能代理服务。其次,随着低参数模型性能翻倍,将更适用于追求低能耗的端侧AI 创新产品。
相关标的
AI 应用:金山办公、科大讯飞、焦点科技、彩讯股份、泛微网络、鼎捷数智、汉得信息、致远互联等。港股:迈富时、金蝶国际、明源云等AI 端侧:中科创达、虹软科技、中兴通讯、润欣科技、乐鑫科技、兆易创新、移远通信、恒玄科技;
风险提示产品研发不及预期、市场需求不及预期、大模型商业落地不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘畅 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论