2 月 26 日,Deepseek 开源专为高效 FP8 通用矩阵乘法设计的 DeepGEMM 库,支持多种功能,采用 CUDA 编写。
【2 月 26 日,Deepseek 宣布开源 DeepGEMM】Deepseek 在开源周第三天开源了 DeepGEMM,这是一个专为简洁高效的 FP8 通用矩阵乘法设计的库。它具有细粒度缩放功能,支持普通和混合专家分组的 GEMM,采用 CUDA 编写,安装无需编译,通过轻量级即时编译模块在运行时编译所有内核,为 V3/R1 训练和推理提供支持。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论