计算机行业周报：DEEPSEEK-V4 强化国产算力适配

2026-04-25 16:35:03 和讯华西证券刘泽晶

　　一、DeepSeek-V4 上线并开源，百万上下文与Agent 能力升级推升推理算力需求
　　本周AI 产业链值得关注的变化，在于DeepSeek-V4 发布进一步强化了长上下文、Agent 和复杂推理方向。4 月24 日，DeepSeek-V4 预览版本正式上线并同步开源，模型上下文处理长度由128K 扩展至1M，支持百万字超长上下文，同时输出长度最大为384K tokens；本次DeepSeek-V4 首次增加KV Cache 滑窗和压缩算法，以减少Attention 计算和访存开销，并通过模型架构创新更好支持Agent 和Coding 场景。
　　我们认为，DeepSeek-V4 的发布说明国内开源大模型仍在快速迭代，且模型竞争重点正在从通用对话能力，进一步转向长上下文处理、代码生成、工具调用和多步骤任务执行。随着办公Agent、代码Agent、企业知识库和具身Agent 等场景扩张，推理侧Token 消耗、调用次数和并发压力有望持续提升。
　　二、昇腾超节点全面支持DeepSeek-V4，国产算力从模型适配走向规模化推理验证
　　DeepSeek-V4 发布后，华为昇腾超节点的同步适配成为本周国产算力主线。华为官微发文称，昇腾一直同步支持DeepSeek 系列模型，本次通过双方芯模技术紧密协同，实现昇腾超节点全系列产品支持DeepSeek V4 系列模型。昇腾950 通过融合kernel和多流并行技术降低Attention 计算和访存开销，并结合多种量化算法，实现高吞吐、低时延的DeepSeek V4 模型推理部署；昇腾A3 超节点系列产品也全面适配，并提供基于昇腾A3 超节点的训练参考实现。
　　我们认为，这说明国产算力适配已经从“模型能否运行” ，进入“长上下文、低时延、高吞吐、可微调”的工程化验证阶段。对DeepSeek-V4 这类长上下文和Agent 模型而言，推理系统面临的压力不只是单卡算力，还包括显存容量、KV Cache 管理、跨卡通信、请求调度和长序列Attention 开销。昇腾超节点通过高速互联、统一调度和软硬件协同，有望提升复杂模型在企业级和云端推理场景中的可部署性。
　　另外，寒武纪、摩尔线程及FlagOS 同步适配，国产AI 芯片生态协同继续加快。除华为昇腾外，寒武纪、摩尔线程等国产AI 芯片生态也在本周同步适配DeepSeek-V4。寒武纪已基于vLLM 推理框架完成对285B DeepSeek-V4-Flash 和1.6T DeepSeek-V4-Pro 的Day 0 适配，适配代码已开源到GitHub 社区；摩尔线程携手智源FlagOS，为旗舰级AI 训推一体全功能GPU MTT S5000完成DeepSeek-V4-Flash 模型Day-0 适配。FlagOS 方面，众智FlagOS 已完成DeepSeek-V4-Flash 在8 款以上AI 芯片上的全量适配与推理部署，并正在推进DeepSeek-V4-Pro 在多个芯片上的迁移适配。
　　我们认为，DeepSeek-V4 并非只带动单一硬件厂商，而是在推动国产AI 芯片、开源推理框架和模型服务之间形成更广泛协同。
　　国产算力建设正在从单点硬件替代，进一步走向“模型发布—芯片适配—推理框架优化—云端服务—行业应用”的协同链条。
　　三、投资建议
　　受益标的：
　　国产芯片：寒武纪，海光信息，摩尔线程，沐曦股份；国产算力产业链：盛科通信，华丰科技，航天电器，杰华特，意华股份，网宿科技，光环新网，优刻得，首都在线，利通电子，神州数码，烽火通信，浪潮信息，华勤技术；国产大模型：智谱，Minimax。
　　四、风险提示
　　核心技术水平升级不及预期的风险，AI 伦理风险，政策推进不及预期的风险，中美贸易摩擦升级的风险。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王治强 HF013）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约