百川智能发布超千亿大模型Baichuan 3

2024-01-29 18:25:36 北京商报网 

北京商报讯(记者 魏蔚)1月29日,百川智能发布超千亿参数的大语言模型Baichuan 3。Baichuan 3在多个英文评测中,表现接近GPT-4的水平,在CMMLU、GAOKAO、HumanEval和MBPP等多个中文评测榜单上,中文任务的表现超越了GPT-4,在MT-Bench、IFEval等对齐榜单的评测中,超越GPT-3.5、Claude等大模型。超千亿参数模型在训练过程中对高质量数据,训练稳定性、训练效率的要求都高出几个量级。为更好解决相关问题,百川智能在训练过程中针对性地提出了“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等多种创新技术手段及方案,有效提升了Baicuan 3的各项能力。

(责任编辑:王治强 HF013)
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读

        【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。