本报告导读:
昇腾多模态推理加速套件正式开源,联合中科弘云发布 AI 推理加速联合解决方案,加速昇腾芯片渗透率增长,昇腾链预计受益。
投资要点:
投资建议。根 据 CNMO 科技,2025 年 12 月 19 日华为昇腾多模态推理加速套件MindIE SD 项目已正式开源,可有效提升推理效率;根据IT 之家,2025 年12 月23 日,华为数据存储与中科弘云发布AI 推理加速联合解决方案。在长文档推理场景中,结合GSA 稀疏加速算法,当序列长度为 39K 时,并发能力提升 86%,推理吞吐提升36%。我们认为伴随昇腾芯片性能迭代与昇思生态完善,昇腾链相关环节有望受益,推荐标的:华丰科技,相关标的:深南电路、申菱环境、华工科技、光迅科技。
昇腾多模态推理加速套件正式开源。根据CNMO 科技,2025 年12月19 日华为昇腾多模态推理加速套件MindIE SD 项目已正式开源。
MindIE SD 项目包含以下四大关键加速特性:(1)加速插件,可提供多模态亲和加速插件能力,有效减少计算与内存访问开销;(2)以存代算,提供DiT module、DiT block、Attention 等多种粒度的缓存(Cache)算法,可显著提升模型运行时性能;(3)多卡并行,集成CFG 并行等能力,开发者仅需进行接口替换即可自动使能;(4)量化与稀疏Attention,针对昇腾硬件的数据类型和算力分布,提供亲和的量化算法,在保证模型效果的前提下提升推理效率并降低资源消耗。
华为数据存储、中科弘云发布 AI 推理加速联合解决方案,加速昇腾芯片渗透率提高。根据IT 之家,2025 年12 月23 日,华为数据存储与中科弘云发布AI 推理加速联合解决方案。该方案可实现(1)异构管理,支持平台、计算与存储的协同联动,兼容 MindSpore /vLLM/SGLang 等主流框架;(2)算力调度,对算力资源进行细粒度切分与池化处理,按需灵活调度,实现资源利用率最大化;(3)推理加速,依托华为UCM 技术, 将 KV Cache 持久化至华为OceanStor A 系列存储,实现推理记忆全量保存,减少重复计算。经实测,在智能问答的典型推理场景中,该方案实现首 Token 时延(TTFT)降低 57.5%,且序列长度越长,优化效果越显著;在长文档推理场景中,结合GSA 稀疏加速算法,当序列长度为 39K 时,并发能力提升 86%,推理吞吐提升36%,有望加速昇腾芯片渗透率增长。
催化剂。昇腾950PR 芯片验证通过;云厂商增加昇腾芯片订单。
风险提示。国产算力芯片需求增长不及预期;先进制程产能扩产不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:郭健东 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论