随着模型参数量和上下文长度的增加,其在推理过程中对于内存容量的要求也在不断提升。当前,英伟达的Blackwell Ultra 芯片配备8 个HBM3E 内存,内存容量为288 GB,内存带宽为8 TB/s。尽管HBM标准持续向更高带宽、更大DRAM 存储密度发展,但当前大模型的参数规模已经达到万亿级别,上下文长度普遍超过128K,HBM 的容量已难以满足AI 大模型对于内存容量的要求。
HBF 或成为满足AI 大模型内存容量要求的最佳方案。2025 年8 月,Sandisk 公司宣布与SK Hynix 合作开发能够满足AI 大模型推理场景的新型存储产品HBF(High Bandwidth Flash),计划采用BiCS 和CBA晶圆键合工艺实现与GPU 的高速互联。根据Sandisk 官网,Sandisk在研的HBF 存储容量有望达到现有HBM 的8-16 倍,有望将GPU 的存储容量扩展至4 TB。HBF 的内存容量和传输速率都很好的满足了AI大模型对于内存容量较高的要求,其推出后有望在推理任务中实现大规模应用。
具有数据库技术基础的公司具有开发基于HBF 的数据基础软件的潜力。在针对存储介质优化的数据基础软件领域,相关产品开发厂商既包括华为、阿里等大型科技公司,也包括星环科技、PingCAP 等独立第三方公司。在对于数据库有一定技术积累的背景下,相关公司均有针对HBF 存储介质开发数据基础软件的潜力。由于华为、阿里等公司自研的AI 大模型存在较大的数据处理需求,其或自研数据基础软件用于其AI 大模型的推理任务中。而包括星环科技和PingCAP 等独立第三方公司的数据基础软件或可用于智谱AI、MiniMax 等公司大模型的推理任务中。
HBF 的技术成熟有望推动相关数据基础软件的应用。星环科技的分布式数据库ArgoDB 针对闪存存储硬件优化,内建细粒度的编码格式,可以充分发挥闪存的高随机读写特性。在具有一定技术积累的背景下,星环科技也有潜力开发基于包括HBF 在内的其他存储介质的数据基础软件产品。基于产品研发周期和投入资源,星环科技相关产品仍需要一定时间的研发。此外,相关产品的研发节奏也取决于公司的战略发展方向和重视程度。我们认为,随着HBF 相关技术的成熟,相应产品在AI推理任务中有望大规模使用,从而推动相关数据基础软件的应用。
风险提示。HBF 相关硬件产品距离成熟还有一年左右的时间,存在技术难点克服不及预期导致产品推出时间延迟的可能;HBF 在AI 大模型推理场景的应用未经市场验证,下游用户认可度和商业拓展存在不确定性;HBF 与传统存储介质在存储容量和传输速率上有差异,存在基于HBF 的数据基础软件的性能和效果不及预期影响商业拓展的可能。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:张晓波 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论