计算机行业:国产AI 核心主线

2025-08-25 13:15:12 和讯  财通证券杨烨
  DeepSeek-V3.1 架构创新实现系统性突破。DeepSeek-V3.1 是新一代旗舰大模型,凭借架构创新实现能力突破。其采用6850 亿参数与混合专家架构(MoE),支持128K 超长上下文窗口,预训练阶段新增840B tokens数据(含大量Agent 场景数据),强化工具调用能力。技术上,通过思维链压缩训练减少冗余、MoE 稀疏激活机制(单次推理仅用约160 亿参数)降计算开销。还升级混合推理架构,提升思考效率与Agent 能力,编程、搜索智能体支持增强。测试中,其SWE-bench、Terminal-Bench、Browsecomp等成绩大幅提升,输出tokens 减少20%-50%仍保性能,实现效率与成本平衡。
  UE8M0 FP8 Scale:DeepSeek 助力国产芯片对齐国际标准。
  UE8M0 是OCP 2023 年发布的MX 规范中,为AI 运算设计的8 位指数、无尾数编码方式,作低精度数据块级缩放因子,可避免训练中数值溢出/下溢,保障稳定性。MX 规范将张量分块,块内低精度存储,块外配UE8M0 编码缩放因子。英伟达Blackwell 架构首现MX 原生支持,降开销且MXFP8 吞吐率较BF16 提升约2 倍。DeepSeek-V3.1 采用“UE8M0 FP8 Scale”,既对齐标准适配Blackwell,又通过工程封装兼容国产硬件,还为国产算力兼容提供技术缓冲。
  H20 vs. 国产芯片:国产化崛起的终极博弈。2025 年4 月,美对英伟达H20 芯片对华出口实施管制,冻结其销售,该芯片曾是英伟达对华特供款,2024 年贡献120-150 亿美元收入,禁令致企业停单、英伟达库存滞销。此背景下,中国加速国产AI 芯片替代:政策支持使2025Q2 国产芯片市占率达38.7%;DeepSeek-V3.1 的UE8M0FP8 技术适配华为昇腾、昆仑芯等10 家厂商;摩尔线程、沐曦等国产GPU 企业冲刺IPO,获国家大基金680亿元及产业资本支持。目前中国AI 加速卡市场国产份额超40%,产业链形成“融资—研发—落地”正向循环,走独立可持续路径。
  风险提示:技术迭代不及预期的风险;商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:贺翀 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读