海外资本支出呈现持续上扬的态势,而国内资本支出近期承压。全球云计算厂商资本开支进入新一轮增长浪潮,AI 基础设施成为核心驱动力。国外厂商中,微软24Q3 资本开支同比增78.6%,主要投向AI 和云服务;谷歌维持高位,聚焦服务器和数据中心;亚马逊连续五季环比增长,全年预计750 亿美元。国内厂商中,阿里巴巴24Q3 同比增239.63%,加码AI 基础设施;腾讯同比增113.54%,布局GPU、CPU 服务器及数据中心;百度虽承压,预计24年底或25 年初迎来回升,重点投入AI 模型和智能云服务。
全球服务器出货同比回升,B+C 端应用逐步落地,思维链等新技术拉动推理算力需求增长。C 端应用如ChatGPT 访问量持续增长,国内多款AI 产品MAU快速上升;B 端AI 赋能商业增长显著,AppLovin、Palantir 等公司业绩大幅提升。AI 推理侧需求因思维链(CoT)技术及模型参数量增加快速增长。
CoT 对千亿参数模型显著提升推理能力,同时推理次数和算力需求快速增加。
中国AI 芯片市场规模23 年达1038.8 亿元,预计25 年增长至1780 亿元,推理算力占比24 年有望升至67.7%。国内外厂商如博通、Marvell、寒武纪等积极布局AI 推理硬件,助推算力发展。
国产科技巨头在AI 大模型与算力领域持续突破。字节跳动发布豆包Pro 对标GPT-4o,API 调用量大增,多场景渗透;召开冬季FORCE 原动力大会,推出数据飞轮2.0,强化全模态数据管理;正式推出情感大模型,在豆包APP全量开放。小米升级MiLM2 模型,参数灵活扩展,端云结合适配多场景;加速GPU 集群建设提升算力。阿里倚天710 芯片大规模落地,阿里云为双11提供百万核级算力。腾讯升级星脉网络2.0,优化网络协议与通信库,提升大模型训练效率。
多层面技术提升训练效率,测试性能领跑开源模型。2024 年12 月26 日,DeepSeek 上线并开源DeepSeek - V3 模型,多项评测超同类开源模型,在重要领域与顶尖闭源模型相当,训练成本低。模型层采用MoE 架构,经多阶段训练与能力提炼,在知识、代码、数学推理等测评中领先开源模型。架构层沿用V2 架构,引入新技术,如无辅助损失负载均衡策略、MTP 提升数据利用率。训练层通过DualPipe 算法和FP8 混合精度训练实现成本控制与效率提升。推理层先推出R1 - Lite 模型,后将R1 推理能力迁移至V3 提升其性能,推理算力包含GB300、博通、marvell 等各类asic 芯片。2025 年1 月发布的DeepSeek - R1 模型在多测试中超越OpenAI 的o1,在数学、编程及多种测试中表现出色。
风险提示:大模型研发进展不及预期、云厂商资本开支投入不及预期、国产算力迭代及供应不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王治强 HF013)
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论