核心观点:
9 月12 日,OpenAI 正式发布o1 模型,测试表明在数据分析、编码和数学领域中,o1 的受欢迎程度远远高于GPT-4o。相较于GPT-4、GPT-4o 等传统LLM,我们认为o1 有四大关键变化值得关注。
(1)LLM 的思考分析能力再次得到强化,数理、代码能力显著得到加强。根据OpenAI 的测试,在国际数学奥林匹克(IMO)资格考试中,GPT-4o 仅正确解决了13%的问题,而o1 得分为83%;o1 在Codeforces 比赛中位居89%分位;此外,在绝大多数推理需求较强的任务中,o1 的表现明显优于GPT-4o。o1 在回答问题时会进行思考,将复杂问题分解为若干简单问题,并尝试不同解题路径,该过程可以极大提升模型推理能力。在OpenAI 给出的解码问题实例中,o1 会通过自问自答的方式将问题拆解为诸多细分问题,并相继给予解答或否定。
(2)o1 能力提升的背后是强化学习的结果。根据OpenAI 官网,o1模型花更多时间思考问题,然后再做出反应,类似于人类;通过训练,o1 能够学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。我们认为,数理、编程等问题通常具有更加具体、确定性强的答案,因此非常适合用作强化学习训练。
(3)尺度定律(Scaling Law)再次被证实,意味着训练/推理算力需求或进一步增加。OpenAI 在其研究博客中表示,随着强化学习的增加(以训练时间计算)和思考时间的增加(以测试时间计算),o1 的性能会持续提高。因此,尺度定律目前由训练侧延伸至推理侧,我们看好未来随着用户对模型性能的持续提升带来的推理算力需求提升。
(4)LLM 变得更加安全。OpenAI 在开发这些新模型的过程中提出了一种新的安全训练方法,利用模型的推理能力,使其遵守安全和协调准则。在OpenAI 最严格的“越狱”测试之一中,GPT-4o 得分为22(百分制),而o1-preview 模型得分为84,表明o1 的高级推理能力提高了安全性,因为o1 可以根据上下文适应安全规则,并更有效地应用这些规则,从而使模型更能抵御有害内容的生成。
投资建议。o1 模型代表的是真正的“智能“,人类AGI 之路又迈进一步,o1 的发布标志着模型能力上限再次被提升,推理尺度定律拉动算力需求进一步上行,2025、2026 年可能远非算力投资的顶峰,算力需求中长线逻辑再次确立。继续推荐新易盛、天孚通信。
风险提示。AI 基础设施建设不及预期的风险;AI 应用发展不及预期的风险;AI 领域的进出口政策变化的风险;国际合作减少的风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论