通信周报:DEEPSEEK开源的杀伤力

2025-03-01 18:25:02 和讯  德邦证券李宏涛
  1.投资策略
  1.1 行业数据流通不足,离线部署推动私有数据利用。我们认为,由于数据上传可能带来的数据隐私问题,传统企业对云端AI 平台或持谨慎态度。随着大模型进一步发展,行业数据将逐渐成为AI 赋能千行百业的瓶颈。DeepSeek 的开源模式通过本地化部署和离线运行能力,解决了数据泄露风险,推动企业私有数据的深度利用。1、AI 应用涉及数据泄露风险:①开源大型语言模型服务工具Ollama 默认无安全认证功能,众多部署用户忽视安全限制,导致大量服务器“裸奔”网络。在中国的5669 个服务器中,88.9%的活跃服务器可被随意调用,已出现恶意占用计算资源、导致服务器崩溃的事件。②海外AI 聊天聚合平台OmniGPT 遭到黑客组织“GreenBlood”(绿血)的网络攻击。黑客通过SQL 注入漏洞获取了OmniGPT 平台的数据库访问权限,并下载了约3400 万条聊天记录。2、私有化部署优势:①安全性高:私有化部署将所有的的敏感数据或业务数据部署在内网的本地服务器上,服务的稳定性、数据的安全性是能够达到极大的保证;②成本较低:可以通过企业规模来选择,定制个性使用方案,成本较低;③灵活性较高:私有化部署是指就是将系统直接部署到企业自己的服务器上,数据直接保存在本地。建设过程可以自行处理,也可以通过第三方服务器部署。3、多行业已经实现DeepSeek 本地部署:
  中国铝业已完成“坤安”大模型算力平台接入DeepSeek(671B“满血版”)工作。
  在DeepSeek 等市场主流大模型的能力加持下,中铝集团“坤安”人工智能大模型将全面提升在有色金属领域特别是矿山、冶炼、加工等智慧生产领域和科技研发场景的综合应用能力。此外,华尔街见闻表示,据不完全统计,已有不少于20 家银行、15 家险企、16 家券商“官宣”进行DeepSeek 本地化部署。
  1.2 基座模型开源+蒸馏技术,推动私有/行业模型发展。我们认为DeepSeek 所展示的“模型蒸馏”技术,将大模型能力压缩至轻量级垂直模型,有助于降低企业训练成本,进而推动行业尝试大模型的端侧应用。1、基座模型能力优秀:DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1 正式版。2、蒸馏模型实现“技术平权”:通过DeepSeek-R1 的输出,蒸馏了6 个小模型开源给社区,其中32B 和70B 模型在多项能力上实现了对标OpenAIo1-mini 的效果。3、结合行业需求,AI 赋能千行百业:2 月8 日,中国移动协同中国石油完成DeepSeekV3/R1 全栈国产化的训推适配和私有化部署。总部位于太原市晋源区的华为矿山军团正式更名为华为油气矿山军团。占地150 余亩的一期项目已于2024 年底主体完工。华为油气矿山军团以智慧矿山为基础,涵盖煤矿、非煤矿山、石油、天然气、钢铁、水泥、化工等领域。推动5G、人工智能、大数据等新一代信息技术与能源产业深度融合。
  1.3 DeepSeek 持续推动开放协作,大模型闭源策略受压。我们认为,DeepSeek的彻底开源模式对以OpenAI 为代表的采用闭源策略的大模型厂商产生了巨大冲击,有望推动行业向开放协作转型。1、DeepSeek“开源盛世”:除了模型本身开源外,DeepSeek 还开源了5 个代码库:①FlashMLA,这是专为英伟达HopperGPU优化的高效MLA 解码内核,专为处理可变长度序列设计;②DeepEP,首个用于MoE(混合专家模型)训练和推理的开源EP 通信库;③DeepGEMM,矩阵乘法加速库,为V3/R1 的训练和推理提供支持。④优化并行策略(DualPipe 和EPLB),DualPipe 是一种用于V3/R1 训练中计算与通信重叠的双向管道并行算法,EPLB则是一种针对V3/R1 的专家并行负载均衡器;⑤3FS,Fire-Flyer 文件系统,专门为了充分利用现代SSD 和RDMA 网络带宽而设计的并行文件系统,能实现高速数据访问。2、开源穿透力强,硬件厂家配合优化:自DeepSeek 发布后,全球多  家算力芯片厂商均主动对其做出适配。目前DeepSeek 模型已经上架英伟达NIM平台,国内厂家中,华为、寒武纪、摩尔线程以及昆仑芯均已表示完成满血版DeepSeek 模型的适配。3、活跃用户高速增长:DeepSeek 日活跃用户数在2 月1 日已经突破3000 万,成为史上最快达成这一里程碑的应用。截至2 月,OpenAI周活跃用户为4 亿,日均活跃用户约5700 万人。
  2.行业要闻
  2.1DeepSeek“开源周”收官,开源5 项核心数据库。据界面新闻,2 月28 日,国内AI 明星公司DeepSeek 为期五天的“开源周”告一段落,共计开源5 个代码库。1、FlashMLA,专为英伟达HopperGPU 优化的高效MLA 解码内核,专为处理可变长度序列设计。在自然语言处理等任务里,数据序列长度不一,传统处理方式会造成算力浪费。而FlashMLA 如同智能交通调度员,能依据序列长度动态调配计算资源。发布6 小时内,GitHub 上收藏量突破5000 次,被认为对国产GPU 性能提升意义重大。2、DeepEP,用于MoE(混合专家模型)训练和推理的开源EP通信库。MoE 模型训练和推理中,不同专家模型需高效协作,这对通信效率要求极高。DeepEP 支持优化的全对全通信模式,能让数据在各个节点间高效传输。让MoE 模型各部分间沟通更快、消耗更少,提升了整体运行效率。3、DeepGEMM,矩阵乘法加速库,为V3/R1 的训练和推理提供支持。通用矩阵乘法是众多高性能计算任务的核心,其性能优化是大模型降本增效的关键。支持普通GEMM 以及专家混合(MoE)分组GEMM,在HopperGPU 上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算)的计算性能,在各种矩阵形状上的性能与专家调优的库相当,甚至在某些情况下更优,且安装时无需编译,通过轻量级JIT 模块在运行时编译所有内核。4、优化并行策略(DualPipe 和EPLB)。DualPipe 是一种用于V3/R1训练中计算与通信重叠的双向管道并行算法。通过实现“向前”与“向后”计算通信阶段的双向重叠,将硬件资源利用率提升超30%。EPLB 则是一种针对V3/R1的专家并行负载均衡器。通过冗余专家策略复制高负载专家,并结合启发式分配算法优化GPU 间的负载分布,减少GPU 闲置现象。5、面向全数据访问的推进器3FS,也就是Fire-Flyer 文件系统。它是一个专门为了充分利用现代SSD 和RDMA网络带宽而设计的并行文件系统,能实现高速数据访问,提升AI 模型训练和推理的效率。我们认为,DeepSeek 此次开源将极大程度上推动全球AI 行业的快速发展。建议重点关注:中国移动、中国电信、中国联通、中兴通讯等。
  2.2 《全国数据资源统计调查制度》发布:摸清数据资源底数和发展趋势。据C114通信网,2 月24 日,为贯彻落实《数字中国建设整体布局规划》工作部署,进一步摸清全国数据资源底数和发展趋势,国家数据局综合司、公安部办公厅根据《中华人民共和国统计法》《部门统计调查项目管理办法》相关规定,制定了《全国数据资源统计调查制度》。该制度自2025 年1 月开始实施,有效期3 年。本年度全国数据资源统计调查工作开展时间为2025 年2 月18 日至3 月14 日。调查标准时点为2024 年12 月31 日。该制度主要调查的内容为数据资源指标,包括数据生产、存储、计算、流通、应用和安全等。调查对象包括合法拥有或控制数据的国家行政机关、事业单位、企业、社会团体等。统计范围为全国(不包括港澳台地区)。
  我们认为,DeepSeek 开源或极大程度缓和行业面临的算力瓶颈问题。因此有望迎来对数据语料的加速消耗。建议重点关注:恒信东方、零点有数、国脉科技、德生科技等。
  2.3 3800 亿元,阿里巴巴投建云和AI 硬件基础设施。据C114 通信网,阿里巴巴集团CEO24 日宣布,未来三年,阿里将投入超过3800 亿元,用于建设云和AI 硬件基础设施,总额超过去十年总和。这也创下中国民营企业在云和AI 硬件基础设施建设领域有史以来最大规模投资纪录。阿里云是亚洲头部云计算公司,阿里巴巴通义千问大模型已成为全球知名的开源模型。吴泳铭说,3800 亿元巨额资金继续投入,能极大提振相关产业信心,同时也表明,阿里一如既往相信未来、投资未来。
  2 月20 日,阿里巴巴发布2025 财年第三季度(截至2024 年12 月31 日)业绩报告,该季度阿里巴巴集团总营收2801.5 亿元,同比增长8%;调整后EBITDA(息税折旧摊销前利润)为620.5 亿元,同比增长4%;归属于普通股股东的净利润为489.45 亿元,同比增长239%。其中,阿里云季度营收317.42 亿元,同比增长13%,公共云收入持续两位数增长,AI 相关收入连续六个季度三位数增长,调整后EBITA 增长33%至31.38 亿。我们认为,阿里巴巴作为国内代表性云厂商,其资本开支投入很大程度上影响到我国的算力基础设施需求景气度。建议重点关  注:华丰科技、光迅科技、申菱环境、英维克、欧陆通、高澜股份等。
  2.4 英伟达利润大增80%,Blackwell 需求惊人。据C114 通信网、快科技,2 月27 日,英伟达公布了公司的2025 财年第四财季及全年财报。财报显示,第四财季营收达到393.31 亿美元,同比增长78%,环比增长12%;净利润为220.91 亿美元,同比大幅增长80%。这一强劲增长主要得益于市场对Blackwell 芯片的强劲需求以及AI 技术的快速发展。英伟达CEO 强调,Blackwell 芯片的需求远超预期,这得益于推理AI 的快速发展AI 训练能力的提升使模型更加智能,而长时间思考所需的额外算力则进一步优化了AI 的决策能力。英伟达已成功大规模推进BlackwellAI 超级计算机的生产,并在首个季度实现了数十亿美元的销售额。英伟达首席财务官透露,第四财季公司交付了价值110 亿美元的Blackwell 芯片,创下了英伟达历史上最快的新产品营收增长纪录。Blackwell 芯片的主要客户为大型云服务提供商,这些客户贡献了数据中心业务约50%的收入。我们认为,DeepSeek的开源降低了大模型发展的算力门槛。进而带来算力芯片的需求长期增长。建议重点关注:寒武纪、海光信息、中兴通讯、华丰科技、菲菱科思、紫光股份等。
  3.本周回顾及重点关注组合
  3.1 本周回顾:本周通信(中信)下跌9.62%,同期上证指数下跌1.72%,深证成指下跌3.46%,创业板指下跌4.87%,沪深300 下跌2.22%。从板块来看,本周IDC指数下跌5.81%,卫星导航指数下跌5.4%,物联网指数下跌5.15%。AI 算力指数本周下跌5.06%,东数西算指数下跌5.99%;专网领域标的佳讯飞鸿下跌0.64%,海能达下跌6.38%。本周通信板块整体走势表现为深度回调,重点看好DeepSeek带来的算力、AI 行业应用、算力基建相关领域投资机会。
  本周看点:周涨跌幅前十:共进股份(27.95%)、元道通信(15.80%)、博实结(13.05%)、大富科技(10.08%)、久盛电气(9.43%)、精伦电子(7.25%)、*ST 信通(4.55%)、ST 中嘉(3.80%)、ST 特信(2.40%)、佳创视讯(1.45%);周涨跌幅后十:
  德科立(-33.91%)、博创科技(-26.27%)、太辰光(-24.91%)、新易盛(-20.65%)、仕佳光子(-19.01%)、润建股份(-17.76%)、南凌科技(-16.48%)、平治信息(-16.21%)、嘉环科技(-15.38%)、二六三(-15.37%)。
  3.2 下周关注:AI 行业/端侧应用、算力基础设施、IDC:中国移动、中国联通、中国电信、中兴通讯、梦网科技、吴通控股、移远通信、广和通、美格智能、乐鑫科技、华丰科技、神宇股份、沃尔核材、申菱环境、英维克、中际旭创、博创科技、光迅科技、新易盛、天孚通信、奥飞数据,润泽科技、光环新网、数据港、首都在线、润健股份等。
  3.3 长期关注:运营商:中国移动、中国电信、中国联通;通信基建:中国铁塔;主设备:中兴通讯、烽火通信;北斗:华测导航、海格通信、振芯科技;军民融合:
  七一二、盛路通信;数字货币:楚天龙;物联网:移远通信、美格智能;云/IDC:
  光环新网、润建股份、佳力图、英维克;光模块:中际旭创、天孚通信、新易盛、光迅科技、博创科技、源杰科技;海上风电:中天科技、亨通光电;工业互联网:
  东土科技、飞力达。数据要素:云赛智联,天源迪科,东方国信;卫星互联网:创意信息、盟升电子、信科移动、普天科技、华测导航、臻镭科技、天银机电、上海瀚讯。
  风险提示:运营商集采进度不及预期;上游芯片受控影响产品交付;企业经营成本上升;我国商业航天发展速度不及预期;AI 算力需求不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:贺翀 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读