算力: AMD 发布 MI350 系列 GPU 性能升级,预告 MI400 联合 OpenAI 研发6 月13 日,AMD 推出MI350X 和MI355X 两款GPU。与前代MI300X 相比,MI350 系列的算力提升4 倍,推理速度提高35倍。
MI350 系列产品在性能上可与英伟达B200 竞争。其内存容量为B200 的1.6 倍,训练及推理速度与B200 相当或更优。此外,由于该芯片功耗低于英伟达同类产品,在MI355X 上,每1 美元的投入可支持处理的tokens 数量比B200 多40%。同时,AMD 预告将于2026 年推出MI400 系列产品,并透露OpenAI 参与了该系列产品的联合研发工作。
MI350X 与 MI355X 核心设计相同,差异在于散热方式适配:
前者采用风冷,后者与 B200 一致采用液冷。二者均基于第四代 Instinct 架构(CDNA 4),配备 288GB HBM3E 内存及8TB / 秒带宽,容量为英伟达 GB200、B200 的 1.6 倍。功耗方面,MI350X 最高 TBP 为 1000W,MI355X 达 1400W,更高功耗使其性能优于 MI350X。
AMD 下一代 GPU MI400 系列将于2026 年推出,该系列由 AMD与 OpenAI 联合研发,OpenAI 为其训练和推理需求提供关键反馈。MI400 系列将采用下一代 CDNA 架构,预计速度较MI300 系列快 10 倍,FP4 运行速度达 40PFLOPs,配备432GB HBM4 内存及 19.6TB/s 内存带宽,搭配2nm 的VeniceCPU 和Vulcano 网卡,MI400 可以组装成完整的Helios AI 机架。Venice 搭载 256 个 Zen6 核心,计算性能较 Turin CPU提升 70%。代号 Vulcano 的下一代 AI 网卡支持 PCIe 与UAL 接口,线速吞吐量达 800GB/s。Helios 机架最多连接 72个 GPU,扩展带宽达 260TB/s。
AI 应用: Gemini 周平均访问量环比 +11.26%,中国科学院发布「启蒙」芯片设计系统6 月10 日,中国科学院计算技术研究所处理器芯片全国重点实验室,联合中国科学院软件研究所,基于大模型等AI 技术,推出处理器芯片和相关基础软件全自动设计系统——「启蒙」。
芯片设计向来是科技界的「皇冠明珠」,传统设计流程需要 顶尖专家团队耗时数月甚至数年攻坚,极具挑战性,而「启蒙」系统可以全自动的实现芯片软硬件设计各个步骤,达到或部分超越人类专家手工设计水平。
目前,研究人员已基本完成第一步中软硬件各个步骤的自动设计,后续将继续推进跨层协同设计数据集的建立和处理器芯片大模型的训练。研究人员将继续实现从自顶而下到自底而上的设计路线,并组成迭代的循环,最终朝着实现整个「启蒙」系统自演进的目标迈进。未来,还将通过符号主义、行为主义及连接主义等不同人工智能路径的交叉探索,不断提升「启蒙」系统的处理器芯片软硬件全自动设计能力,同时持续拓展「启蒙」的应用边界,为更广泛的处理器芯片设计应用场景提供智能化支持。
AI 融资动向:Multiverse 完成2.17 亿美元B 轮融资,LLM 压缩技术达 95%6 月13 日,西班牙人工智能公司 Multiverse Computing 于周四宣布完成 1.89 亿欧元(约 2.17 亿美元)B 轮融资。本轮融资由 Bullhound Capital 领投,HP Inc、ForgepointCapital 和东芝等知名机构参投。
该公司的CompactifAI 技术可将大语言模型(LLM)压缩高达95%,且不影响性能表现。这项技术通过"量子启发式算法"和张量网络,能够识别AI 模型中最相关和次要部分,从而显著减少模型体积。其压缩后的模型运行速度比原始模型快4-12倍,推理成本可降低50%-80%。
CompactifAI 还可用于边缘设备,如个人电脑、智能手机等。
该技术巧妙地结合了量子物理和机器学习的原理,通过模拟量子系统工作, 但无需使用量子计算机。此轮融资使Multiverse 成为西班牙最大的 AI 初创公司,跻身欧洲顶级AI 创业公司行列,与 Mistral、Aleph Alpha、Synthesia、Poolside 和 Owkin 等优秀企业并肩。Multiverse 已成功推出多个压缩版本的大语言模型,包括 Meta 的 Llama、中国的 DeepSeek 和法国的 Mistral,并计划推出更多模型。
该公司 CEO Enrique Lizaso Olmos 表示:"我们专注于压缩最常用的开源大语言模型,这些都是企业已在使用的模型。
企业客户中大多数都在使用 Llama 系列模型。" 目前,该工具已在 AWS AI 市场上线。
公司已获得包括HPE 在内的大企业客户认可,后者正使用该技术将AI 本地化部署到个人电脑。这轮融资相比2024 年3 月的2500 万美元A 轮融资显著增长,反映了市场对AI 模型压缩技术的强烈需求。
投资建议
继续看好海外算力链。甲骨文(Oracle)周三盘后公布财报显示,该公司第四财季业绩超预期,虽然云基建略微逊于预 期,但管理层预计2026 财年云基础设施营收预计将增长超过70%,同时资本支出继上年猛增三倍后,新财年将继续增至250 亿美元。首席执行官Safra Catz 表示,预计总云收入的增长将在2026 财年从2025 财年的24%加速至40%以上,云基础设施增长将从50%跃升至70%以上,且预计FY26 的RPO 将增长超过100%,意味着未来合同订单储备将大幅激增。
中长期,建议关注临床 AI 产品成功落地验证的嘉和美康( 688246.SH ) 、以AI 为核心的龙头厂商科大讯飞( 002230.SZ ) 、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于 GB200放量的鼎通科技(688668.SH)、已与Rokid 等多家知名AI 眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。
风险提示
1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:张晓波 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论