Grok-1.5惊艳升级,数学推理能力飙升至50.6%,长文本理解领先业界

2024-03-30 11:32:00 自选股写手 

马斯克团队推出Grok-1.5,提升数学推理和长文本理解能力

Grok-1.5,一个由马斯克领导的xAI团队开发的模型,在其短短11天的开源历程后迎来了升级。

近日,Grok-1.5的发布带来了128K的长上下文支持,以及显著提升的推理能力。

11天前,Grok-1模型的权重和架构已向公众开放,展示了团队在之前11月所取得的成果。

Grok-1拥有3140亿个参数,是Llama 2的四倍,采用MoE架构,并包含8个专家,其中2个处于活跃状态。

升级后的Grok-1.5在编码和数学任务方面表现出色,数学基准测试得分提升至50.6%,GSM8K基准测试得分达到90%。

同时,在评估代码生成和解决问题能力的HumanEval基准测试中,Grok-1.5以74.1%的高分胜出。

Grok-1.5的训练框架基于JAX、Rust和Kubernetes,使团队能够在大型计算集群上进行高效的模型训练。

Grok-1.5将很快提供给早期测试者,并在未来几天推出更多新功能。

此次Grok-1.5的升级显示出团队在不断优化和改进模型方面的决心和能力。


和讯自选股写手
风险提示:以上内容仅作为作者或者嘉宾的观点,不代表和讯的任何立场,不构成与和讯相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。和讯竭力但不能证实上述内容的真实性、准确性和原创性,对此和讯不做任何保证和承诺。
(责任编辑:王治强 HF013)
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读