混元:开源多模态奖励模型 大幅提升性能

2025-05-13 19:51:15 自选股写手 

快讯摘要

混元联合多机构开源首个多模态统一 CoT 奖励模型,实现多任务能力提升并已全面开源。

快讯正文

【混元宣布开源首个多模态统一 CoT 奖励模型】近日,混元与上海 AILab、复旦大学、上海创智学院共同开展全新研究工作 UnifiedReward-Think,构建出首个拥有长链式推理能力的统一多模态奖励模型。该模型首次使奖励模型在各视觉任务中真正“学会思考”,极大提升了对复杂视觉生成与理解任务的准确评估能力,以及跨任务泛化与推理的可解释性。当前,此项目已完全开源,涵盖模型、数据集、训练脚本以及评测工具。

(责任编辑:王治强 HF013 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    推荐阅读