豆包大模型团队近日开源 SuperGPQA,构建含 285 学科、26529 道问题的评估体系,填补长尾知识评估空白。
【豆包大模型团队近日开源基准测试集 SuperGPQA】近日,豆包大模型团队开源了 SuperGPQA,这是一个领域全面且具有高区分度的知识推理基准测试。据了解,此数据集构建了涵盖 285 个研究生级学科、包含 26529 道专业问题的评估体系。其不仅涵盖主流学科,还将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面的学科覆盖广度,填补了长尾知识评估领域的空白。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论