月8 日,OpenAl 正式发布GPT-5。主要亮点包括将多个模型集成到同一智能系统、更低的幻觉率、以及更低的成本。
GPT-5 是GPT-4o 的重大升级,代表OpenAI 在实现通用人工智能(AGI)路径上的重要一步,提供更智能、更快速和更可靠的响应,用户交互体验类似于与博士级专家对话。在多个基准测试中表现出色,包括SWEBench(编码任务,得分74.9%)、MMMU(推理任务,超越多数人类专家)和AIME 2025(数学推理),显著优于前代模型和其他市场模型。在场景应用端,GPT5 在健康、金融、教育等领域有突出表现,例如帮助患者理解医疗报告、加速金融分析和代码教学。
GPT-5 将多个模型统一,按需自动调用工具,提升用户友好度GPT-5 在产品设计上不再区分推理、多模态和Agent 模型,而是将这些模型集成在一个智能系统中,实时路由器(Router)功能会根据用户的需求(prompt)来动态调整调用的模型和工具。用户无需手动选择模型(如速度型/思考型),系统自动判断任务复杂度调整响应方式。在发布会直播案例中,GPT-5 生成交互式SVG 动画时自动启用深度推理,而简单问题(如概念解释)直接响应。
搜索、文件/图片上传、数据分析、画布、记忆,这些工具在 GPT-5 中都将直接可用,用户无需手动切换工具,上传文件后可直接提问,系统自动调用合适的功能处理请求,响应速度更快、结果更可靠。GPT-5 原生整合所有工具,解决了传统级联模型导致的延迟高、误差累积等问题。我们认为这种一体化系统的设计,提供更便捷的交互方式,对用户更友好。
幻觉率更低,减少事实性错误,推动AI 从“可用”迈向“可信”GPT-5 显著减少了幻觉的发生,它出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%。GPT-5 采用一系列方法来降低幻觉和减少事实性错误:
1) 合成课程训练(Synthetic Curriculum),通过GPT-4 生成结构化教学数据(非原始网络数据),确保知识密度与逻辑严谨性。
2) 自验证链(Chain-of-Verification),添加了‘验证链’机制——强制模型在响应前对自己的答案进行事实核查。
3) 安全完成机制(Safe Completion),GPT-5 在遇到无法完全满足的请求时,拒绝生硬说“不”,转而解释原因并提供替代方案,既守住安全边界,又避免用户反复试探诱发模型编造答案。
4) 工具约束强化(Tool Use Constraint),强制GPT-5 严格遵守能力边界:当任务因缺少必要工具无法完成时,模型不会谎称已执行操作(如虚假记录“已查询数据库”),杜绝因虚构工具行为产生的欺骗性幻觉。
幻觉的降低,对AI 应用落地至关重要,其意义在于突破高风险领域应用壁垒,解锁更多场景:
1) 幻觉率的降低直接决定AI 能否进入对准确性要求严苛的领域:比如金融、法律和医疗等对合规和安全要求非常高的领域。
2) 幻觉率下降推动AI 从“辅助工具”升级为“可信代理”,重构人机协作模式 3) 降低应用门槛与成本,幻觉率下降减少人工复核需求,企业级部署成本优化。
B 端降本、C 端普惠,大模型成本下降加速AI 应用落地GPT-5 通过免费开放核心能力、API 价格大幅下降、企业无限次调用的三重策略,实现用户总成本锐减,尤其助力中小开发者和企业降低AI 集成门槛。
1) 免费用户首次可访问顶级模型:所有用户(包括免费用户)均可使用GPT-5,仅高频使用时切换至轻量版GPT-5 mini,而此前免费用户仅能用GPT-3.5,GPT-4o 仅限付费用户,此次是首次免费开放旗舰模型。
2) API 价格大幅下降,企业用户无限次调用:对于API 用户来说,GPT5 的价格为每百万token 输入1.25 美元,输出10 美元,价格低于此前的GPT 4o,甚至还低于以“低价”著称的Gemini 2.5 Pro,GPT mini 和nano 的价格,也都低于主要竞争对手的同等级模型。对于企业用户来说,可设置GPT-5 为默认模型,无限次调用(无频次限制)。
3) 付费用户权益升级(间接降本):Plus 用户可获得5 倍于免费用户的GPT-5调用额度,且支持“深度思考模式”(Pro Extended)生成更复杂内容。
GPT-5 在医疗领域取得突破,从“信息工具”升级为“诊疗协作伙伴”GPT-5 临床测试能力显著提升,在HELP-Bench 临床测试中得分达到97%,相比GPT-4o 的82%大幅提升。GPT-5 从诊断层面、患者层面取得明显突破:
1) 诊断层面:GPT-5 主动发现漏洞,降低误诊风险。GPT-5 可精准解读复杂医疗数据,在解析病理报告时主动识别遗漏项,通过风险量化建模的方式,将医学争议转化为可量化指标(复发率、副作用发生率等)。
2) 患者层面:利用多模态交互能力,GPT-5 可将将医学数据转化为3D 可视化模型(如肿瘤与器官的空间关系),并且生成患者的个性化路径,基于患者数据生成阶段式行动指南。
投资建议:AI 应用加速落地,关注AI Agent、多模态应用和AI 医疗GPT-5 作为行业标杆之一,其进化对整个AI 产业链的趋势具有启发意义。从GPT-5 最新的情况来看,大模型呈现多模态融合、推理能力继续提升、成本持续下降的趋势,幻觉率也大大降低。更强的能力、更低的成本和更低的幻觉率,是AI 应用加速落地的必要条件。建议关注:
1) AI Agent:随着推理能力的提升,Agent 的效果将提升。我们继续认为企业服务或是AI Agent 最先落地场景,办公/OA/ERP/营销等Saas 厂商有望受益:具备数据入口优势;作为组织交互中心,可作为AI Agent 入口;企业流程管理规则明确、节点清晰,能发挥AI Agent 自动化优势。相关公司【用友网络】【光云科技】【能科科技】【亚信科技】【鼎捷数智】【税友股份】等。
2) 行业垂类应用:部分有付费意愿高,场景简单,数据基础好的行业场景更容易变现:AI+教育【科大讯飞】【粉笔】等;AI+营销【迈富时】【医脉通】等;AI+法律【华宇软件】;AI+金融【京北方】;AI+政府【博思软件】等。
3) 多模态应用:随着大模型多模态能力提升,图片生成和编辑等能力逐步可以为专业人士提供帮助,相关标的【美图公司】【万兴科技】【快手-W】4) AI 医疗:医疗大数据和大模型开发:【讯飞医疗科技】【医渡科技】【云知声】【润达医疗】; 医疗信息化龙头:【创业慧康】【东软集团】【卫宁健康】【嘉和美康】;AI 药物研发:【晶泰控股】。
风险提示:
大模型技术发展不及预期;Agent 落地不及预期;国内模型和应用进展不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘静 HZ010)
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论