中信建投证券:OpenAI o1逻辑能力显著提升 推理侧算力消耗大幅增加

2024-09-20 09:14:27 智通财经 
新闻摘要
智通财经APP获悉,中信建投证券发布研报称,OpenAI发布新的具有深度思考能力的o1推理模型,模型在复杂问题上花更多时间进行思考而非直接回应,具有改善和调整策略的能力,在科学、代码和数学等复杂问题上表现出色。OpenAIo1融合思维树和强化学习,实现思维模式的深度探索。Openo1在模型推理侧同样满足scalinglaw,即模型推理时间越久模型处理复杂问题能力愈强,通过不断的思维树检索和反复自我博弈,o1呈现出类人的逻辑思维潜力

智通财经APP获悉,中信建投证券发布研报称,OpenAI发布新的具有深度思考能力的o1推理模型,模型在复杂问题上花更多时间进行思考而非直接回应,具有改善和调整策略的能力,在科学、代码和数学等复杂问题上表现出色。OpenAI o1融合思维树和强化学习,实现思维模式的深度探索。Open o1在模型推理侧同样满足scaling law,即模型推理时间越久模型处理复杂问题能力愈强,通过不断的思维树检索和反复自我博弈,o1呈现出类人的逻辑思维潜力。由于推理过程的反复博弈,新架构下推理侧算力消耗将大幅增加。

OpenAI o1具备深度思考能力,在复杂问题上表现出色。从ChatGPT爆火整个社交网络后,大模型行业进入如火如荼的发展阶段,模型的基础能力得到显著提升,然而Transformer模型由于其架构限制存在一定的能力边界难以逾越,涉及到复杂数理逻辑推理时表现仍然有待提升。提示词工程应运而生,在合理的提示词设计下,大模型推理能力得到显著提升。OpenAI发布新的具有深度思考能力的o1推理模型,模型在复杂问题上花更多时间进行思考而非直接回应,具有改善和调整策略的能力,在科学、代码和数学等复杂问题上表现出色。

OpenAI o1融合思维树和强化学习,实现思维模式的深度探索。思维链和思维树通过中间推理步骤帮助大模型实现了复杂的推理能力,大语言模型能够自己对严谨推理过程的中间思维进行评估。强化学习是人工智能重要的研究领域,智能体在与环境的反复交互过程中持续学习,不断最大化其奖励。OpenAI o1深度融合思维树和强化学习,实现思维树的自我训练,同时通过广度搜索和深度搜索不断优化其思维树结构,进而实现思维模式的深度探索。

推理侧scaling law同样存在,大模型算力需求逐步迁移至推理侧。过去在训练侧证实了scaling law的存在,即训练越多模型愈发聪明。Open o1在模型推理侧同时发现了scaling law,即模型推理时间越久模型处理复杂问题能力愈强,推理侧的scaling law同样展现了巨大的潜力,通过不断的思维树检索和反复自我博弈,o1呈现出类人的逻辑思维潜力。由于在推理过程的反复博弈,模型当前推理算力需求大幅提升,大模型整体算力消耗从训练侧逐渐迁移至推理侧,对整个算力需求起到长期的重要支撑。

(责任编辑:王治强 HF013)

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读