DeepSeek 今日开源用于 MoE 模型的 DeepEP 通信库,具备多种高效特点及灵活资源控制。
【DeepSeek 开源周第二日:开源 EP 通信库】DeepSeek 正式宣布,在今日开源了 DeepEP,这是首个应用于 MoE 模型训练和推理的开源 EP 通信库。其具备的特点包括:实现了高效、优化的全员沟通;在节点内和节点间均支持 NVLink 和 RDMA;拥有用于训练和推理预填充的高吞吐量内核;具备用于推理解码的低延迟内核;具有原生 FP8 调度支持;能够实现灵活的 GPU 资源控制,达成计算-通信重叠。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论