DeepSeek宣布开源DeepGEMM

2025-02-26 09:32:06 智通财经 
  • 腾讯QQ
  • QQ空间
新闻摘要
智通财经APP获悉,Deepseek于开源周第三天宣布开源DeepGEMM。它支持普通和混合专家分组的GEMM。FP8GEMM库,为V3/R1训练和推理提供支持

智通财经APP获悉,Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如DeepSeek-V3中所提出。它支持普通和混合专家(MoE)分组的GEMM。该库采用CUDA编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。

DeepSeek开源周第二日(2月25日),DeepSeek官宣开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。特点有:高效、优化的全员沟通;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。2月21日,DeepSeek在社交平台发文称,构建了一支探索AGI(通用人工智能)的小团队,将开源5个代码库,以完全透明的方式分享研究进展。

(责任编辑:刘畅 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

    推荐阅读

      微信扫描二维码分享