计算机行业:OPENAI O1发布 高阶推理能力显著提升

2024-10-03 13:50:07 和讯  广发证券刘雪峰/周源
核心观点:
事件:当地时间2024 年9 月12 日,OpenAI 发布o1 大模型,相较于此前的单一思维链路的大模型,o1 大模型在逻辑思维、编程能力、高阶推理等方面具有明显优势。
OpenAI o1 的发布有望推动AI 大模型由效率工具向智力替代方向转变。我们在2023 年6 月发布的深度报告《计算机行业:多模态大模型方向确定,从通用到垂直场景智能化升级的统一和差异》中曾提到“程序开发人员在人工智能编码助手GitHub Copilot 的帮助下,减少了55%的代码开发时间,效率提升效果显著”。经过一年多时间的发展,以o1 为代表的AI 大模型性能持续提升,有望在程序开发、科学研究等智力工作上实现更多人力替代。
更长的强化学习时间,更大的算力消耗是o1 大模型性能提升的关键。
OpenAI 采用了大规模强化学习的方式来打造o1 大模型高效的思维链路能力。在研发过程中,OpenAI 发现o1 大模型的性能与强化学习的训练时长呈正相关关系,回答问题的效果与推理时长呈正相关关系。
o1 大模型在回答高阶的科学问题时推理的时间较长,而回答的效果较好,反映了OpenAI 增加了强化学习的时长所达到的效果。o1 开拓了AI 大模型性能提升新的技术方向,为实现更高水平的逻辑思维能力,各AI 模型公司在训练和推理阶段或增加强化学习时长,采用更大规模的AI 算力,有望推动AI 芯片、网络设备等硬件基础设施的增长。
较高的使用成本限制了o1 模型在大规模商用中的适用性。首先,目前o1 模型的使用权限和次数受到严格控制,只有高级用户和特定开发者账户才能访问,并且调用频率有限,不足以支撑大规模应用。其次,o1模型在回答生成过程中消耗大量tokens,每次推理消耗的算力成本较高,进一步增加了商用成本。因此,在当前的定价和使用限制下,o1 模型并不适合大规模商用场景。随着o1 大模型后续的不断优化,成本有望降低,价格存在下探可能性。
实测效果较强,但仍有较大潜力可待挖掘。通过测试,我们总结, o1大模型展现出了强大的推理能力和先进的思维链技术,在某些科学知识领域的推理能力超越了此前版本,模型的“拟人化”表现也有所提升。然而,根据OpenAI 官方文档,o1-preview 在某些自然语言任务中并不是首选。此外,相比GPT-4o 的实时响应,不管简单问题还是复杂问题,o1 大模型在回答前均需要进行精细化思考,速度较慢。模态方面,目前o1 仅支持纯文本模式,尚不具备多模态能力。因此,o1 大模型虽然表现较强,高阶推理能力显著提升,但在某些方面仍存在改进空间。伴随技术进步,AI 大模型未来仍有较大潜力可待挖掘。
风险提示。研发投入与技术更新的持续压力;推理成本与算力需求上升阻碍下游应用商业化落地风险;AI 生成内容存在知识版权纠纷风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读