计算机行业周报:OPENAI发布大模型GPT-5谷歌推出世界模型GENIE3

2025-08-11 16:50:06 和讯  上海证券章锋
  市场回顾
  过去一周(8.4-8.8)上证综指上涨2.11%,创业板指上涨0.49%,沪深300 指数上涨1.23%,计算机(申万)指数下跌0.41%,跑输上证综指2.52 个百分点,跑输创业板指0.90 个百分点,跑输沪深300 指数1.65 个百分点,位列全行业第30 名。
  周观点
  OpenAI 发布GPT-5。根据新华网,8 月7 日,OpenAI 发布其最新人工智能模型 GPT-5,是迄今为止该机构推出的最强大的人工智能系统,在各类基准测试中超越了先前的模型,在编程、数学、写作、健康、视觉感知等方面都具备业界领先的性能,在减少幻觉、提升指令执行能力、降低“逢迎”倾向方面都有重大进展。OpenAI 表示,GPT-5 采用统一系统架构,整合了高效基础模型、深度推理模块和实时路由系统,能够根据不同情况判断何时该快速回应,何时应进行深度推理思考以提供专家级的答案。OpenAI 首席执行官萨姆·奥尔特曼称,GPT-5 是“世界上最好的模型”,代表着 OpenAI 在开发通用人工智能 (AGI) 道路上迈出了“重要一步”。此外,8 月6 日,OpenAI开源了gpt-oss-120b 和gpt-oss-20b 两个推理模型。据OpenAI 公布的基准测试结果,gpt-oss-120b 在竞赛编码、工具调用基准测试中的得分接近或超过闭源的o4-mini 模型,gpt-oss-20b 在基准测试中的分数则与o3-mini 相当或超过o3-mini。这两款模型的推理性能在开源模型中都属于第一梯队。
  Anthropic 发布Claude Opus 4.1。根据第一财经,8 月6 日,Anthropic 推出了Claude Opus 4.1。该公司表示,以往公司只专注于发布重大版本更新,此次更新意味着公司转向推动编码模型渐进式改进,公司还将在未来几周内推出更多更新。Claude Opus 4.1 主要是在深入研究、数据分析、代理搜索方面的能力也比前一代有所提升。
  Anthropic 表示,新产品擅长处理复杂的多步骤问题,该公司将其定位为更有效的AI 智能体。在SWE-bench Verify 基准测试中,ClaudeOpus 4.1 得分74.5%,超过Opus 4 的72.5%,显示编码能力较前一代有所提升。此外,该模型在Terminal-Bench(代理终端编程)、GPQA Diamond(研究生级别推理能力)、MMMLU(多语言问答)基准测试中的得分分别为43.3%、80.9%、89.5%,超过Opus 4 的39.2%、79.6%、88.8%。据Anthropic 介绍,GitHub 平台用户、Rakuten Group 客户的反馈显示,Opus 4.1 在代码修改精准度和调试效率上有明显改善。
  谷歌发布 Genie 3。根据第一财经,8 月6 日,谷歌推出通用世界模型Genie 3,其是谷歌第一个允许进行实时交互的世界模型。据谷歌介绍,Genie 3 可以生成多样化的交互环境。该模型对世界物理特性的建模可以模拟水、光等自然现象,可以生成包含动物、植物在内的生态系统,还可以创造动画角色,并模拟复杂环境下各种元素的相互作  用。在Genie 3 生成的动态世界里,可以以每秒24 帧的速度进行导航,并在720p 的分辨率下保持长达几分钟的画面一致性,该模型的视觉记忆还可以追溯至一分钟前。
  投资建议
  建议关注:(1)算力:华丰科技、申菱环境、寒武纪、海光信息、安博通等;(2)AIDC:科华数据、云赛智联、弘信电子、润建股份、润泽科技、数据港等;(3)AI 应用:金山办公、科大讯飞、鼎捷数智、汉得信息、卓易信息、普元信息等。
  风险提示
  下游景气度不及预期;政策推进不及预期;技术创新不及预期、行业竞争加剧。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:张晓波 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读