阿里通义千问:训练新模型 s1 引关注

2025-02-06 22:12:15 自选股写手 

快讯摘要

2 月 6 日,研究人员以不到 50 美元费用训练 s1 模型,其基座为阿里通义千问模型,阿里云确认并回应相关情况。

快讯正文

【2 月 6 日,李飞飞等研究人员以不到 50 美元云计算费用训练出人工智能推理模型 s1 引发广泛关注。】不过很快,该 s1 模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。 新浪科技向阿里云方面求证,阿里云方面确认这一消息,并回应称:“他们以阿里通义千问 Qwen2.5 - 32B - Instruct 开源模型为底座,在 16 块 H100GPU 上监督微调 26 分钟,训练出新模型 s1 - 32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比 o1 - preview 高出 27%。”

本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担

(责任编辑:董萍萍 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    推荐阅读