计算机行业周报:AMD公布MI325X同台竞技英伟达 “年更”预示AI芯片竞争趋于白热化

2024-06-17 08:05:05 和讯  华鑫证券宝幼琛
  算力:算力租赁价格平稳,AMD Instinct 产品线更新MI325X 同步英伟达本周算力租赁价格环比持平。在产业动态方面,近期,AMD 董事长兼CEO 苏姿丰在Computex 2024 展会的开幕主题演讲中公布了今年将会推出Instinct MI325X,2025 年推出MI350,2026 年推出MI400。MI325X将具有更大的算力规模,并转向第四代高带宽内存HBM3E。容量大幅提升至288GB,内存带宽提升至6TB/s。与英伟达相比,MI325X 内存大小和单服务器可运行模型参数规模是英伟达H200 的2 倍。内存带宽、理论FP16 算力峰值、理论FP8 峰值则是英伟达H200 的1.3 倍,可谓是AMD 史上最大的AI 性能提升。同时,MI350 的内存容量将是英伟达2025 年推出的B200 芯片的1.5 倍,AI 算力是B200 芯片的1.2 倍。
  AMD 预计将在2026 年推出基于CDNA "Next" 架构的Instinct MI400 加速器系列,一年一更同步英伟达。
  AI 应用:苹果发布Apple Inteligence 智能系统,正式开启端侧AI 新时代当地时间6 月10 日,苹果发布了Apple Intelligence,一款深度集成于iOS 18,iPadOS 18 和macOS Sequoia 的全新个性化智能系统。
  Apple Intelligence 由多种智能生成模型组成,端侧云端混合并行,专为用户日常任务设计。端侧上,Apple Intelligence 拥有约30 亿参数的语言模型。在设备端和私有云上,苹果对模型生成的第一个token和后续token 的推理过程进行了优化,采用分组查询注意力机制、共享的输入和输出词汇嵌入表。设备端模型词汇量为49000,服务器模型为100000,在iPhone 15 Pro 上,从接收到提示词到生成第一个token所需时间约为 0.6 毫秒,生成速率为每秒 30 个token。在AppleIntelligence 的加持下,Siri 的智能化水平进一步提升,具备更丰富的语言理解能力和用户交互体验。
  AI 融资动向: Mistral AI 获6.4 亿美元B 轮融资本期AI 初创公司的融资中,Mistral AI / Cognigy 融资额前二,分别为6.4 亿/1.0 亿美元。Mistral AI 是欧洲最强的 LLM 大模型公司,  在多模态、检索增强生成(RAG)等大模型突破方向有着丰富经验,曾开发Mistral 7B、Mixtral 8x22B 等模型,是OpenAI 的强劲对手。
  Cognigy 作为AI 客服巨头,专注于对话式AI 和生成式AI 的研究与开发工作,本次融资用于加速AI 自动化技术的研发,并推动其全球扩张。
  投资建议
  巨头入场加速端侧AI 发展。2024 年AIPC 和AI 手机的加速落地标志着AI 发展的重点逐步向端侧转移,特别是此次WWDC 大会上苹果发布的Apple Intelligence 体现了AI 颠覆传统消费电子设备体验的潜力。基于此,我们建议关注:1)端侧AI 优化手机等产品使用体验,大幅提升生产力,有望加速3C 换机周期,建议关注AIPC、AI 手机硬件产业链;2)Apple Intelligence 推理采用端侧和云侧相结合的方案,有望进一步拉动推理算力需求。
  建议关注以AI 为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI 应用金桥信息(603918.SH)等。
  风险提示
  1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读