计算机行业周报：OPENAI O1如何指引未来AI投资

2024-09-17 16:35:08 和讯国盛证券刘高畅

　　OpenAI 发布o1 模型，数学、代码等领域大幅进步。2024 年9 月12 日，OpenAI 发布新的o1 系列模型，包括OpenAI o1-preview 和OpenAI o1-mini，旨在花更多时间思考后再做出反应。它们可以处理复杂的任务，解决比以前的科学、编码和数学模型更难的问题。OpenAI 在一系列不同的人工考试和ML 基准上的测试表明，在绝大多数推理能力较强的任务中，o1 的表现明显优于GPT-4o。
　　强化学习+思维链推理，大模型Scaling Law 开启新范式。与人类在回答难题之前会长时间思考的方式类似，o1 在解决问题时会使用思维链。通过强化学习，o1 学会训练其思维链并改进其使用的策略。随着强化学习的计算量增加和思考时间的增加，o1 的性能会持续提高。此前基于ScalingLaw 的思想，扩大预训练模型大小、数据集大小和训练计算量，就能得到性能更强的模型，但幂律关系在数学上也意味着性能的提升边际回报将会放缓。我们认为o1 成功验证了在后训练和推理阶段提升模型能力的新方向，其技术思路可能被业界其他大模型效仿，成为一种新的重要技术范式。
　　算力需求再度强化，模型准确度提升有望促进应用创新。o1 模型在训练端增加了对强化学习的计算量，在推理端增加了模型进行思维链思考的计算量，进一步强化了大模型对算力的需求。o1 系列模型在代码和数学能力方面准确率有较大提升，利好AI 编程、AI 解题等领域应用。同时我们认为AI 应用在各领域的创新进展与大模型在具体领域完成任务的准确度密切相关，例如需要完成长任务的Agent。智能助理很可能是AI 时代的超级应用。
　　o1 仍存在局限性，期待GPT-5 准确度全面提升推动产业。o1 目前提升较大的主要在数学、编程等有比较准确评判标准的领域，强化学习应用于其他领域或有一定难度。同时o1 推理侧的思维链运算带来的较慢响应速度也会对应用场景造成限制。目前预训练阶段的Scaling Law 仍然有效，o1 探索出了在后训练和推理阶段能优化部分任务的准确度的方案，这令我们更期待未来的GPT-5 系列模型是否能带来全面的准确度提升。若GPT-的准确度大幅上升，则可以乐观预期AI 应用的创新和落地速度将会大幅加快，如各垂直行业的Copilot，能代替用户进行具体操作的AI Agent 等。
　　建议关注
　　1）算力侧：寒武纪、中际旭创、新易盛、中科曙光、海光信息、浪潮信息、工业富联、神州数码、软通动力、协创数据、云赛智联、高新发展等。
　　2）端侧AI：立讯精密、东山精密、传音控股、鹏鼎控股、中科创达、漫步者。
　　风险提示：AI 技术迭代不及预期风险；经济下行超预期风险；行业竞争加剧风险。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约