【我们团队对于DeepSeek 理解,可以用一个非常巧妙的比喻来概括:
内燃机效率的提高,一定会带来更大的石油消耗】DeepSeek 做了什么:
【1】验证了新的Scaling Law:在过去的几年间,AI 模型的增长主要依靠于预训练阶段的规模堆积,通过对人类已有数据的不断积累,从而增加模型的规模和能力。但随着训练耗尽了人类已有数据,叠加合成数据之路所产生的幻觉和边际收益递减问题,预训练阶段的Scaling Law 逐渐放缓。2024 年以来,基于强化学习的新Scaling Law成为了行业重点方向,先后涌现出了GPT-o1,Deepseek R1 等优秀模型。RL 这种新的AI 增长曲线,在初期展现出了非常高的投入性价比,这也是Deepseek V3 快速进化到R1,并展现出强大能力的根本原因。
当下RL 依然是基于传统的预训练模型,在推理阶段加入RL 使得模型面对理科问题时的推理技能更加强大。展望未来,随着RL 算法在预训练阶段逐渐取代自回归算法,同时使用更强大的算力和更多的数据,基于RL 算法训练模型生成思维链,将共同构成AI 新的Scaling Law,算法创新与算力堆叠在这条曲线上将一起狂奔,AI 的能力边界将迎来新一轮的扩张。
【2】极致的工程优化:DeepSeek 的真正创新之处在于极致的工程优化,主要依靠了如键值缓存,创新型的MoE 架构,以及基于PTX 层汇编语言实现对于英伟达GPU 效率的极致压榨等等,通过这些创新性的工程优化,使得DeepSeek 打破了西方模型公司固有的降本周期曲线,能够用更低的价格,来提供接近头部模型的使用体验,提高了全球算力的使用效率。
【3】慷慨的开源:与西方以OAI 和Anthropic 为代表模型巨头,逐渐走向闭源的模型商业理念不同,DeepSeek 将自身创新性原理和模型进行了开源,一方面使得全球模型厂商能够共享新的工程方法带来的性价比提升,另一方面使得全球用户能够本地或者通过公有云部署,从而避免高溢价,这也是Deepseek 在全球开发者中获得如此高殊荣的核心原因。
DeepSeek 对于英伟达的影响:
Deepseek 的出现,让全世界看到AGI 的实现又更近了一步。我们认为,海外在算力领域的布局不会因为deepseek 有所放缓,相反,因为deepseek 的出现,将会给全球科技巨头进一步上紧发条,海外科技巨头们将进一步加码在算力领域的布局。具体而言,一方面可能会进一步加大英伟达GPU 采购力度,另一方面也会加紧推进自研ASIC 方案的进度。此外,美国政府可能会进一步加紧芯片出口限制,试图在算力层面上进行最后的封锁,以限制其他国家地区的AI 发展,维护其所谓的AI 领先地位。
对于英伟达而言,我们认为,deepseek 的阶段性胜利,将继续推动算力市场的整体需求,长期的天花板进一步被打开,我们不认为英伟达的需求和订单会出现任何大幅度的影响,相反,一方面可能会进一步超预期,另一方面英伟达可能也会将其下一代产品的迭代速度加速,性能有望实现重大突破的极具创新型技术路线(如CPO、OIO 等),我们认为有望继续提速。我们认为英伟达的股价下跌并非反应的是需求的变化,而更多应是担心可能发生的进一步加紧的芯片出口限制而带来的不确定性。
DeepSeek 对于中国算力投资的影响
【对于国产算力】:DeepSeek 推出后,美国迫于竞争压力,对于中国进一步加强算力制裁的呼声愈发强大。同时由于DeepSeek 开源和低成本特性,国产显卡用于推理的性价比和ROI 急剧上升,至此,基于中芯国际的制造能力,芯片厂商的设计能力,Deepseek 模型的应用能力三者合一,中国算力自主可控的飞轮开始旋转。
【对于边缘侧】:DeepSeek 对于边缘侧的拉动主要有两点,第一是云端先进模型的价格降低,使得AI 应用,AI 硬件的使用和开发运营成本降低,这将促进AI 硬件的放量。第二是DeepSeek 对于小模型优化的能力,此次Deepseek 也基于Qwen 与Llama 发布了部分优化后的小模型,能力相较于此前小模型有一定提升。我们认为,随着RL 这一新增长曲线的不断放量,叠加边缘侧算力的提升,边缘推理将加速变为现实,边缘算力有望加速放量。
Deepseek 对于全球算力投资的影响:
1、GPU:我们认为deepseek 对GPU 的影响是积极的,因为目前无论从训练还是推理的角度,GPU 的优势的非常明显,算力长期来看依旧将继续指数级增长,我们依旧看好英伟达在AI 基础设施领域的确定性优势,同时看好其在能够大幅度提升性能的新技术领域的加速,看好CPO、OIO 的加速落地,建议关注:天孚通信、康宁、太辰光等。
2、ASIC:强化学习对推理的积极影响,可能会加速大模型团队及云厂商对于推理以及自研算力的需求和进展,最终市场取决于单位算力成本的比较,目前来看英伟达在推理领域依旧有着明显的优势,但云厂商可能会继续冒着支出更多的代价,坚定推进自研算力。利好云厂商的ASIC 合作伙伴,以及其配套产业链:博通、amd、mrvl、arista、cls、中际旭创、新易盛、cohr、lite 等。
3、通信:deepseek 对通信的影响比较综合,通常训练集群通信要求相较于同等规模的推理集群更高,但考虑到性价比问题,目前众多训练集群也兼顾了推荐算法、推理、科研、金融交易等其他功能,我们认为训练集群依然将坚定的向着规模更大的方向发展。同时,推理需求需要考虑规模效应,预计云厂商主导的推理市场依旧将占主导地位,端侧目前算力有限,不构成太大影响,预计推理集群也将延续过去发展趋势。综合来看,无论是训练还是推理,依旧将使用到更多的高端交换机和光模块,我们倾向于推荐产品有优势、在手订单充足、产能扩展顺利的标的,建议关注:博通、arista、cls、中际旭创、新易盛、cohr、lite、ciena、德科立。
4、能源:海外能源相关配套差,我们预计deepseek 的出现,将坚定海外科技巨头加速加码布局基础设施的决心,能源领域继续看好整个方向,建议关注:SMR、OKLO、威腾电气,电工合金。
总结来看,对于节后A 股的思考:
春节假期中,除了DeepSeek 之外,还发生了北美关税落地,芯片制裁进一步加严等事件。结合市场对于DeepSeek 的边际变化的认知更多反应在应用端的快速放量上,因此节后主要的进攻方向主要聚焦在端侧以及国产替代链上,而从中长期来看,通信、能源等全球算力配套产业链也将迎来全新的发展期。
节后方向:
端侧:物联网模组龙头,美格智能,移远通信,广和通。
国产替代:寒武纪-U,中芯国际,中兴通讯。
建议关注:
算力——
光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。铜链接:沃尔核材、精达股份。算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪、海光信息。
液冷:英维克、申菱环境、高澜股份。边缘算力承载平台:美格智能、广和通、移远通信。卫星通信:中国卫通、中国卫星、震有科技、海格通信。
IDC:润泽科技、光环新网、奥飞数据、科华数据、润建股份。
数据要素——
运营商:中国电信、中国移动、中国联通。数据可视化:浩瀚深度、恒为科技、中新赛克。
风险提示:AI 发展不及预期,算力需求不及预期,市场竞争风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:张晓波 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论