计算机行业周报：AMD公布MI325X同台竞技英伟达 “年更”预示AI芯片竞争趋于白热化

2024-06-17 08:05:05 和讯华鑫证券宝幼琛

　　算力：算力租赁价格平稳，AMD Instinct 产品线更新MI325X 同步英伟达本周算力租赁价格环比持平。在产业动态方面，近期，AMD 董事长兼CEO 苏姿丰在Computex 2024 展会的开幕主题演讲中公布了今年将会推出Instinct MI325X，2025 年推出MI350，2026 年推出MI400。MI325X将具有更大的算力规模，并转向第四代高带宽内存HBM3E。容量大幅提升至288GB，内存带宽提升至6TB/s。与英伟达相比，MI325X 内存大小和单服务器可运行模型参数规模是英伟达H200 的2 倍。内存带宽、理论FP16 算力峰值、理论FP8 峰值则是英伟达H200 的1.3 倍，可谓是AMD 史上最大的AI 性能提升。同时，MI350 的内存容量将是英伟达2025 年推出的B200 芯片的1.5 倍，AI 算力是B200 芯片的1.2 倍。
　　AMD 预计将在2026 年推出基于CDNA "Next" 架构的Instinct MI400 加速器系列，一年一更同步英伟达。
　　AI 应用：苹果发布Apple Inteligence 智能系统，正式开启端侧AI 新时代当地时间6 月10 日，苹果发布了Apple Intelligence，一款深度集成于iOS 18，iPadOS 18 和macOS Sequoia 的全新个性化智能系统。
　　Apple Intelligence 由多种智能生成模型组成，端侧云端混合并行，专为用户日常任务设计。端侧上，Apple Intelligence 拥有约30 亿参数的语言模型。在设备端和私有云上，苹果对模型生成的第一个token和后续token 的推理过程进行了优化，采用分组查询注意力机制、共享的输入和输出词汇嵌入表。设备端模型词汇量为49000，服务器模型为100000，在iPhone 15 Pro 上，从接收到提示词到生成第一个token所需时间约为 0.6 毫秒，生成速率为每秒 30 个token。在AppleIntelligence 的加持下，Siri 的智能化水平进一步提升，具备更丰富的语言理解能力和用户交互体验。
　　AI 融资动向： Mistral AI 获6.4 亿美元B 轮融资本期AI 初创公司的融资中，Mistral AI / Cognigy 融资额前二，分别为6.4 亿/1.0 亿美元。Mistral AI 是欧洲最强的 LLM 大模型公司，　　在多模态、检索增强生成（RAG）等大模型突破方向有着丰富经验，曾开发Mistral 7B、Mixtral 8x22B 等模型，是OpenAI 的强劲对手。
　　Cognigy 作为AI 客服巨头，专注于对话式AI 和生成式AI 的研究与开发工作，本次融资用于加速AI 自动化技术的研发，并推动其全球扩张。
　　投资建议
　　巨头入场加速端侧AI 发展。2024 年AIPC 和AI 手机的加速落地标志着AI 发展的重点逐步向端侧转移，特别是此次WWDC 大会上苹果发布的Apple Intelligence 体现了AI 颠覆传统消费电子设备体验的潜力。基于此，我们建议关注：1）端侧AI 优化手机等产品使用体验，大幅提升生产力，有望加速3C 换机周期，建议关注AIPC、AI 手机硬件产业链；2）Apple Intelligence 推理采用端侧和云侧相结合的方案，有望进一步拉动推理算力需求。
　　建议关注以AI 为核心的龙头厂商科大讯飞（002230.SZ）、有望迎来需求爆发的AI 应用金桥信息（603918.SH）等。
　　风险提示
　　1）AI 底层技术迭代速度不及预期。2）政策监管及版权风险。3）AI应用落地效果不及预期。4）推荐公司业绩不及预期风险。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

看全文

写评论已有条评论跟帖用户自律公约