事件:OpenAI 于2024 年9 月13 日发布新模型o1(即此前预告的草莓模型)。OpenAI首席执行官山姆·阿尔特曼表示,尽管作答前需要花费更多时间思考,但在处理难而复杂的任务上,OpenAI o1 达到了当下人工智能的最高水平,展现出强大的推理能力。
综合评价:逻辑、代码、数学能力提升明显。o1 意味着大模型将进入了一个新的扩张范式:从模型参数增大,转向强化学习的探索。O1 在机器学习测试、博士级科学问题物理、MMLU 大学数学等测试集中,o1 都相比于4o 有明显的提升,超越了人类专家的表现,成为第一个在该基准测试中做到这一点的模型。目前ChatGPT Plus 用户已可以访问o1-preview 和 o1-mini。初期的消息限制为每周 30 条(o1-preview)和 50 条(o1-mini)。未来 OpenAI 还将逐步开放更多功能,包括文件和图片上传、浏览功能等。
能力提升主要来自于推理环节。o1 是经过强化学习训练来执行复杂推理任务的新型语言模型,o1 在回答之前产生一个很长的内部思维链。随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1 的性能持续提高。即类似推理阶段的ScalingLaw。
利好推理算力,教学、编程、医疗、金融等应用。
1)o1 首先利好推理端需求算力。API 价格,o1 预览版每百万输入15 美元,每百万输出60 美元,o1-mini 每百万输入3 美元,每百万输出12 美元,而GPT4o,分别是5 美元和15 美元。推测o1 普遍推理成本可能是原路线的约3 倍以上。
2)在应用方面,围绕o1 推理、代码、数学能力的提升,我们认为主要利好以下方向:
科学研究:物理、化学和生物学等复杂建模辅助;编程和软件开发:帮助开发者进行代码的生成、调试和优化,教育和学术:提升数学、科学计算教学辅助能力,医疗健康:病历、影像学资料、基因数据强逻辑环节提供思维链支持;金融: 风险评估、投资决策等应用。
除了推理提升外,后续大模型其它期待。1)训练的Scaling Law 继续发挥作用,即模型参数继续提升,从万亿级别提升至十万亿,同时模型智能水平继续涌现;2)多模态,结合视觉能力提升,增加大量视觉数据做大规模预训练,以及sora 为代表的DiT 视频生成。
相关标的:1)算力产业链:中际旭创(申万通信)、新易盛(申万通信),浪潮信息、海光信息、寒武纪、中科曙光。2)AI 应用:科大讯飞、金山办公、同花顺、润达医疗、虹软科技、福昕软件。
风险提示:大模型技术中美仍存在差异;LLM 商业变现能力仍需要验证;scaling law 在训练领域的效果和GPT-5 实际迭代情况仍需要关注。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论