Gemini 3 发布,模型能力全方位突破。谷歌近期连续发布了Gemini 3 系列模型、Nano Banana Pro 图像模型,以及全新开发平台Antigravity,标志着多模态理解、推理与Agent 能力的全面跃迁。1)Gemini 3 Pro 多模态理解能力尤其是ScreenUnderStanding 能力登顶;推理与长期规划能力显著提升,在Vending-Bench 2 长期任务测试中表现最佳;Deep Think 模式突破AGI 相关推理:ARC-AGI 评测高达45.1%;Agentic 能力:编程和工具使用能力增强,更可靠执行多步骤任务。2)Nano Banana Pro:具备物理逻辑的图像生成,完美的解决图像生成中文本渲染错误痛点,与现实世界知识结合,支持专业视觉内容制作。3)Antigravity:智能工作台:提供AI 驱动IDE 与多智能体管理界面,智能体有专属的工作空间。
Screen UnderStanding 是本次跃迁的关键。我们认为Gemini 3 的多模态理解能力,尤其是Screen UnderStanding 能力的大幅提高是驱动AI 应用落地的关键突破。Gemini 3 Pro 在ScreenShot-Pro 评测基准大幅领先Claude Sonnet 4.5 和GPT 5.1。Gemini 3 Pro 能精准解读结构化/非结构化文档,对发票、合同、研究文档等场景意义重大。Screen UnderStanding 对未来AI 进一步发展具有里程碑意义:( 1)通过屏幕理解直接操作GUI,不再依赖API。这意味着AI 可操作没有API的软件,Agent 能真正执行看屏幕、点按钮的人类工作流程大幅扩展自动化场景。
2)通向物理机器人能力的桥梁:模型学会理解屏幕上的按钮并点击与机器人理解世界并行动的逻辑高度同构,未来可自然迁移到机器人对设备面板、仪表、工具界面的识别与操作。
自定义Agent 展望,每个人自己的工作与生活助手。大模型快速迭代,推理与工具调用能力持续增强,催生了越来越强的自定义Agent 应用前景。对金融机构尤其是二级买卖方而言,我们展望未来可探索以下方向:1)构建个人投研知识库,支持资料检索、分析和分享汇报;2)打造智能群发助手,实现带称呼的差异化群发及后续自动回复闭环;3)利用Agent 整理微信消息、研报、公众号等海量信息,并按个性化规则提炼要点;4)个性化的研究助理,指定大模型的输出风格如分析时需要附上权威信息来源;5)通过简单对话就能靠AI 编程能力制作数据分析、合规底稿助手、报销助手等实用工具;6)类似美团( 小美”的生活助手,且同时对接竞争厂商平台,实现各种生活服务整合。
建议关注
算力:寒武纪、海光信息、东阳光、神州数码、新易盛、中芯国际、华虹半导体、胜宏科技、品高股份、鸿腾精密科技、有方科技、协创数据、中际旭创、沪电股份、兴森科技、中科曙光、浪潮信息、东山精密、云天励飞、伟仕佳杰、宏景科技、中芯国际、奥飞数据、云赛智联、科华数据、禾盛新材、潍柴重机、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、弘信电子、圣阳股份、润泽科技、润建股份、深桑达、优刻得、云从科技、太极股份、数据港、首都在线。
Agent:谷歌、阿里巴巴、腾讯控股、阜博集团、广立微、第四范式、360、金蝶国际、拓尔思、合合信息、税友股份、新致软件、金桥信息、快手、美图公司、鼎捷数智、慧辰股份、嘉和美康、海天瑞声、泛微网络、朗新集团、润达医疗、壹网壹创、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。
自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。
军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。
风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘静 HZ010)
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论