核心观点
春节模型密集发布,模型性价比提升显著:春节期间,国产模型密集发布,我们看到本轮模型迭代在性价比方面有了长足提升,以Minimax 为例,M2.5 提供 100 TPS 和 50 TPS 两种版本,其输出价格仅为同类产品的1/10 至 1/20。我们认为从国产模型迭代升级&性价比提升,到推理侧tokens的消耗量不断提升,进而抬升整体国产算力需求的这一逻辑闭环正在持续增强。事实情况也同样佐证我们的观点,由于交互人数激增,春节期间豆包一度暂停视频通话功能,我们认为目前算力储备端仍然为模型商业化拓展的主要瓶颈之一。
国产模型调用量激增:根据AI 模型API 聚合平台OpenRouter 数据显示,2 月9 日~15 日,国产模型以周度4.12 万亿Token 的调用量,首次超过同期美国模型的2.94 万亿Token。16 日~22 日,中国模型的周调用量进一步提升至5.16 万亿Tokens,伴随本轮模型迭代升级和性价比提升,国产模型调用量激增。
华为昇腾加速适配国产模型:针对近期发布的KIMI2.5,昇腾同步深度优化,在昇腾Atlas 800 A2、Atlas 800 A3 上实现高效推理部署。此外,昇腾同步支持智谱GLM系列模型,针对GLM-5 的昇腾AI 基础软硬件实现0day适配,支持对GLM 模型W4A8 混合精度量化,744B 超大参数模型基于Atlas 800 A3 实现单机部署。
昇腾超节点方案领先行业:我们预期2026 年将是推理侧国产超节点上量元年,华为Atlas900 搭载384 张算力卡,可以基于FP16 提供307.2PFLOPS 算力支持,D2D 双向带宽达到784GB/s。此外,华为下一代Atlas950/960,搭载8192/15488 张算力卡超节点方案将在算力性能、大带宽、低时延等方面持续升级。
投资建议:昇腾链上,我们建议重点关注华丰科技,伟测科技,此外华正新材、深南电路、南亚新材同样值得关注。与此同时,我们在国产算力板块持续看好ASIC 趋势,建议重点关注芯原股份。
风险提示:行业竞争加剧风险,宏观经济下行风险,地缘政治风险,AI 算力需求不及预期风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:董萍萍 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论