蚂蚁集团:自研GMLake已被PyTorch集成,可提升33%GPU可用显存

2024-01-16 21:58:00 新浪网 

新浪科技讯 1月16日晚间消息,近日,蚂蚁集团向自研的GPU显存+传输优化开源项目GLake上集成了一种高效的动态显存组合技术框架——GMLake,同时宣布GMLake已被深度学习主流框架PyTorch集成,对上层模型代码和框架代码完全透明,模型不需要修改任何代码即可使用。

据介绍,GMLake能够在大模型训练、推理框架底层以及系统层对显存和传输进行一体优化,将碎片化的显存灵活地拼接起来,最高提高33%的GPU可用显存,使显存使用更为高效。

当前,以ChatGPT为代表的生成式大模型正在引领AI发展。为了训练得到如此高效的大模型,需要强大和昂贵的基础算力支撑。而当前制约高效训练的因素中,除了算力,显存容量也非常关键。

运用GMLake对典型大模型如GPT、GLM、Vicuna等进行了详细评测,最高扩大了约33%的可用显存,即在80GB的A100 GPU上节省约25GB的显存,训练吞吐提高最多4倍。

目前,刊载GMLake技术框架的论文已被计算机体系结构四大顶级会议之一的ASPLOS 24接收。(文猛)

责任编辑:王其霖

(责任编辑:董萍萍 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读

        【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。