豆包大模型:开源 SuperGPQA 填补评估空白

2025-03-04 12:21:15 自选股写手 

快讯摘要

豆包大模型团队近日开源 SuperGPQA,构建含 285 学科、26529 道问题的评估体系,填补长尾知识评估空白。

快讯正文

【豆包大模型团队近日开源基准测试集 SuperGPQA】近日,豆包大模型团队开源了 SuperGPQA,这是一个领域全面且具有高区分度的知识推理基准测试。据了解,此数据集构建了涵盖 285 个研究生级学科、包含 26529 道专业问题的评估体系。其不仅涵盖主流学科,还将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面的学科覆盖广度,填补了长尾知识评估领域的空白。

(责任编辑:张晓波 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

推荐阅读