2 月 6 日,研究人员以不到 50 美元训练出 s1 人工智能推理模型,其基座为阿里通义千问模型,表现与尖端模型相当。
【2 月 6 日消息:李飞飞等斯坦福大学和华盛顿大学的研究人员以不到 50 美元的云计算费用训练出名为 s1 的人工智能推理模型。】调查显示,s1 模型的训练并非从零开始,其基座模型为阿里通义千问(Qwen)模型。s1 用 50 美元训练出新的具有推理能力的模型,实际上是用从谷歌模型中提炼出来的 1000 个样本对千问模型进行微调而成。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论