Deepseek:开源高效 FP8 通用矩阵乘法库 2 月 26 日

2025-02-26 09:51:15 自选股写手 

快讯摘要

2 月 26 日,Deepseek 开源专为高效 FP8 通用矩阵乘法设计的 DeepGEMM 库,支持多种功能,采用 CUDA 编写。

快讯正文

【2 月 26 日,Deepseek 宣布开源 DeepGEMM】Deepseek 在开源周第三天开源了 DeepGEMM,这是一个专为简洁高效的 FP8 通用矩阵乘法设计的库。它具有细粒度缩放功能,支持普通和混合专家分组的 GEMM,采用 CUDA 编写,安装无需编译,通过轻量级即时编译模块在运行时编译所有内核,为 V3/R1 训练和推理提供支持。

(责任编辑:董萍萍 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    推荐阅读