投资要点
AMD 推出MI300X GPU,性能超越H100,并可支持更大模型训练和推理AMD 推出了旗舰数据中心AI 芯片AMD Instinct MI300X GPU,形成了一个由8颗CDNA 3 架构Accelerator Complex Die(XCD)、4 个I/O Die(IOD)、8 个HBM 内存堆栈组成的共有12 颗5nm Chiplet 的集成系统,实现了计算核数、带宽及内容容量的显著增加;MI300X 最终拥有1530 亿颗晶体管、192GB HBM3内存容量、5.3TB/s 峰值内存带宽、896GB/s Infinity Fabric 互连带宽,FP16/FP8下算力为H100 的1.3 倍、显存为2.4 倍、显存带宽为1.6 倍,能支撑更大模型的训练和推理,同时定价上可能更具性价比。
AMD 上修市场规模增速预期,明年出货指引乐观AMD 将未来四年数据中心加速器市场规模CAGR 从40%上修至70%,即预计将从 2023 年的300 亿美元增长至2027 年的超4000 亿美元;同时,AMD 预计MI300X 系列2024 年出货约达30 万-40 万颗,最大客户为微软、谷歌,若非受限台积电CoWoS 产能短缺及英伟达早已预订逾四成产能,该系列出货可望再上修。
ROCm 6 针对生成式AI 优化,微软、Meta 等巨头将率先采购ROCm 6 开放软件平台对新数据类型、先进图形和核心进行了优化,增加了对生成式AI 的Flash Attention、HIP Graph、vLLM 等关键功能支持,在Llama 2 13B推理任务中单张MI300X 的性能为H100 的1.2 倍;微软、Meta、OpenAI 和Oracle 等一众公司已率先承诺将购买AMD 的该GPU 来替代H100,目前AMD已经向HPE、戴尔、联想、SuperMicro 等原始设备制造商发货,正式发售时间定于下季度。
海光深算DCU 兼容ROCm 生态,有望凭借兼容性及性价比提升AI 芯片市占率根据海光,深算DCU 全面兼容ROCm 生态,并且由于ROCm 和CUDA 在生态、编程环境等方面具有高度的相似性,CUDA 用户可以以较低代价快速迁移至ROCm 平台;深算二号已经实现了在大数据处理、人工智能、商业计算等领域的商业化应用,具有全精度浮点数据和各种常见整型数据计算能力,性能相对于深算一号性能提升100%以上,同时深算三号研发进展顺利,我们预计未来海光深算系列芯片有望凭借兼容性及性价比实现AI 芯片市占率的提升。
中科曙光为海光信息第一大股东,支持配备深算芯片的高密度GPU 服务器中科曙光是我国核心信息基础设施领军企业,在高性能计算、存储、安全、数据中心等领域拥有深厚的技术积淀和领先的市场份额,根据公司23 年中报,公司持有海光信息27.96%股份并为其第一大股东,同时公司基于海光DCU 推出了X875 系列服务器,支持多达8 个训练GPU,专为高密度GPU 计算提供全方位的性能支持,有望深度获益于深算系列GPU 市占率提升进程。
相关标的
(1)国产AI 芯片:海光信息、寒武纪、景嘉微、龙芯中科;(2)国产服务器:中科曙光、浪潮信息、高新发展、神州数码、中国长城、拓维信息、烽火通信、软通动力、四川长虹、紫光股份等;
风险提示
AI 大模型相关技术进展不及预期,相关政策推进不及预期,国际形势变化超出预期,研发进展不及预期,芯片等供应不足影响市场推广等风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论