AIGC系列之31：OPEN AI O1模型发布推理范式大范围创新！

2024-09-19 18:25:05 和讯申万宏源研究洪依真

　　事件：OpenAI 于2024 年9 月13 日发布新模型o1（即此前预告的草莓模型）。OpenAI首席执行官山姆·阿尔特曼表示，尽管作答前需要花费更多时间思考，但在处理难而复杂的任务上，OpenAI o1 达到了当下人工智能的最高水平，展现出强大的推理能力。
　　综合评价：逻辑、代码、数学能力提升明显。o1 意味着大模型将进入了一个新的扩张范式：从模型参数增大，转向强化学习的探索。O1 在机器学习测试、博士级科学问题物理、MMLU 大学数学等测试集中，o1 都相比于4o 有明显的提升，超越了人类专家的表现，成为第一个在该基准测试中做到这一点的模型。目前ChatGPT Plus 用户已可以访问o1-preview 和 o1-mini。初期的消息限制为每周 30 条（o1-preview）和 50 条（o1-mini）。未来 OpenAI 还将逐步开放更多功能，包括文件和图片上传、浏览功能等。
　　能力提升主要来自于推理环节。o1 是经过强化学习训练来执行复杂推理任务的新型语言模型，o1 在回答之前产生一个很长的内部思维链。随着更多的强化学习（训练时计算）和更多的思考时间（测试时计算），o1 的性能持续提高。即类似推理阶段的ScalingLaw。
　　利好推理算力，教学、编程、医疗、金融等应用。
　　1）o1 首先利好推理端需求算力。API 价格，o1 预览版每百万输入15 美元，每百万输出60 美元，o1-mini 每百万输入3 美元，每百万输出12 美元，而GPT4o，分别是5 美元和15 美元。推测o1 普遍推理成本可能是原路线的约3 倍以上。
　　2）在应用方面，围绕o1 推理、代码、数学能力的提升，我们认为主要利好以下方向：
　　科学研究：物理、化学和生物学等复杂建模辅助；编程和软件开发：帮助开发者进行代码的生成、调试和优化，教育和学术：提升数学、科学计算教学辅助能力，医疗健康：病历、影像学资料、基因数据强逻辑环节提供思维链支持；金融: 风险评估、投资决策等应用。
　　除了推理提升外，后续大模型其它期待。1）训练的Scaling Law 继续发挥作用，即模型参数继续提升，从万亿级别提升至十万亿，同时模型智能水平继续涌现；2）多模态，结合视觉能力提升，增加大量视觉数据做大规模预训练，以及sora 为代表的DiT 视频生成。
　　相关标的：1）算力产业链：中际旭创（申万通信）、新易盛（申万通信），浪潮信息、海光信息、寒武纪、中科曙光。2)AI 应用：科大讯飞、金山办公、同花顺、润达医疗、虹软科技、福昕软件。
　　风险提示：大模型技术中美仍存在差异；LLM 商业变现能力仍需要验证；scaling law 在训练领域的效果和GPT-5 实际迭代情况仍需要关注。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约