计算机行业重大事项点评:DEEPSEEK V3.2发布 推动国产AI生链崛起

2025-09-30 18:40:03 和讯  华创证券吴鸣远
  事项:
  9 月29 日,DeepSeek-V3.2-Exp 模型正式在Hugging Face 平台发布并开源,同日,华为昇腾、寒武纪等国产芯片厂商,均第一时间实现对开源适配。
  评论:
  国产芯片与大模型实现系统联动,引领国内 AI 发展浪潮。DeepSeek-V3.2-Exp发布并开源,并引入DeepSeek Sparse Attention(一种稀疏注意力机制)。华为昇腾已快速基于vLLM/SGLang 等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day 支持,并面向开发者开源所有推理代码和算子实现。寒武纪通过Triton 算子开发实现了快速适配,利用BangC 融合算子开发实现了极致性能优化,并依托DeepSeek-V3.2-Exp 带来的全新DeepSeek Sparse Attention 机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,为客户提供极具竞争力的软硬件解决方案。华为昇腾、寒武纪等国产芯片厂商迅速完成适配,展现了软硬件协同优化的强大效能,这种深度联动不仅通过稀疏注意力机制等技术提升了大模型的计算效率,更推动了国产AI 生态的完善,为构建自主可控的产业体系奠定坚实基础,加速我国AI 产业从单点突破迈向系统级创新。
  全球开源开放,性能与 Terminus 对比,DSA 验证模型能力。DeepSeek-V3.2-Exp 在 V3.1-Terminus 的基础上引入了DSA 架构,这是一项重要的架构创新。
  它通过实现细粒度稀疏注意力,突破了传统Transformer 模型在长文本处理时计算复杂度O(n^2)的限制。该机制能显著提升长文本训练和推理效率,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升,为下一代大模型的高效发展指明了方向。为了确保评估的严谨性,DeepSeek-V3.2-Exp 的训练设置与前代 V3.1-Terminus 进行了严格对齐。测试结果显示,该模型在各大公开评测集上的表现与 V3.1-Terminus 基本持平,有效性得到了验证。
  成本大幅降低,AI 应用商业化落地有望提速推进。基于模型在稀疏注意力架构上的创新,使得计算资源消耗的降低和推理效率的提升,使得新模型服务成本的大幅降低,DeepSeek 官方API 价格也相应下调,在新的价格政策下,输入方面,缓存命中时价格为0.2 元/百万tokens,缓存未命中时价格为2 元/百万tokens,输出方面则为3 元/百万tokens,开发者调用DeepSeek API 的成本将降低50%以上。这一举措显著降低了开发者的使用门槛和创新成本,使得更多的个人和企业能够负担并充分利用先进的AI 模型。同时,模型在HuggingFace 等平台的开源,也与降价策略相辅相成,共同推动着AI 技术的普惠化发展和应用生态的繁荣。
  投资建议:DeepSeek 继续引领国产大模型与国产算力发展,建议重点关注:
  1)国产芯片:寒武纪、海光信息(中科曙光);  
  2)华为产业链:华丰科技、华工数据、光讯科技等;  
  3)AI 应用:金山办公、金蝶国际、深信服、科大讯飞、合合信息、用友网络、三六零、第四范式、迈富时、虹软科技、税友股份、卫宁健康等。
  风险提示:技术进展不及预期;模型落地不及预期;商业落地不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:张晓波 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读