计算机行业周报:DEEPSEEK-V4 强化国产算力适配

2026-04-25 16:35:03 和讯  华西证券刘泽晶
  一、DeepSeek-V4 上线并开源,百万上下文与Agent 能力升级推升推理算力需求
  本周AI 产业链值得关注的变化,在于DeepSeek-V4 发布进一步强化了长上下文、Agent 和复杂推理方向。4 月24 日,DeepSeek-V4 预览版本正式上线并同步开源,模型上下文处理长度由128K 扩展至1M,支持百万字超长上下文,同时输出长度最大为384K tokens;本次DeepSeek-V4 首次增加KV Cache 滑窗和压缩算法,以减少Attention 计算和访存开销,并通过模型架构创新更好支持Agent 和Coding 场景。
  我们认为,DeepSeek-V4 的发布说明国内开源大模型仍在快速迭代,且模型竞争重点正在从通用对话能力,进一步转向长上下文处理、代码生成、工具调用和多步骤任务执行。随着办公Agent、代码Agent、企业知识库和具身Agent 等场景扩张,推理侧Token 消耗、调用次数和并发压力有望持续提升。
  二、昇腾超节点全面支持DeepSeek-V4,国产算力从模型适配走向规模化推理验证
  DeepSeek-V4 发布后,华为昇腾超节点的同步适配成为本周国产算力主线。华为官微发文称,昇腾一直同步支持DeepSeek 系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4 系列模型。昇腾950 通过融合kernel和多流并行技术降低Attention 计算和访存开销,并结合多种量化算法,实现高吞吐、低时延的DeepSeek V4 模型推理部署;昇腾A3 超节点系列产品也全面适配,并提供基于昇腾A3 超节点的训练参考实现。
  我们认为,这说明国产算力适配已经从“模型能否运行” ,进入“长上下文、低时延、高吞吐、可微调”的工程化验证阶段。对DeepSeek-V4 这类长上下文和Agent 模型而言,推理系统面临的压力不只是单卡算力,还包括显存容量、KV Cache 管理、跨卡通信、请求调度和长序列Attention 开销。昇腾超节点通过高速互联、统一调度和软硬件协同,有望提升复杂模型在企业级和云端推理场景中的可部署性。
  另外,寒武纪、摩尔线程及FlagOS 同步适配,国产AI 芯片生态协同继续加快。 除华为昇腾外,寒武纪、摩尔线程等国产AI 芯片生态也在本周同步适配DeepSeek-V4。寒武纪已基于vLLM 推理框架完成对285B DeepSeek-V4-Flash 和1.6T DeepSeek-V4-Pro 的Day 0 适配,适配代码已开源到GitHub 社区;摩尔线程携手智源FlagOS,为旗舰级AI 训推一体全功能GPU MTT S5000完成DeepSeek-V4-Flash 模型Day-0 适配。FlagOS 方面,众智FlagOS 已完成DeepSeek-V4-Flash 在8 款以上AI 芯片上的全量适配与推理部署,并正在推进DeepSeek-V4-Pro 在多个芯片上的迁移适配。
  我们认为,DeepSeek-V4 并非只带动单一硬件厂商,而是在推动国产AI 芯片、开源推理框架和模型服务之间形成更广泛协同。
  国产算力建设正在从单点硬件替代,进一步走向“模型发布—芯片适配—推理框架优化—云端服务—行业应用”的协同链条。
  三、投资建议
  受益标的:
  国产芯片:寒武纪,海光信息,摩尔线程,沐曦股份;国产算力产业链:盛科通信,华丰科技,航天电器,杰华特,意华股份,网宿科技,光环新网,优刻得,首都在线,利通电子,神州数码,烽火通信,浪潮信息,华勤技术;国产大模型:智谱,Minimax。
  四、风险提示
  核心技术水平升级不及预期的风险,AI 伦理风险,政策推进不及预期的风险,中美贸易摩擦升级的风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王治强 HF013)

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读