计算机行业周报:手机AGENT的两种范式 API与GUI

2025-12-07 18:15:04 和讯  国盛证券刘高畅/李可夫
  手机Agent,移动交互范式的跃迁。自触控屏幕开启移动互联网黄金时代以来,App 被设计为一个个独立的孤岛,用户通过点击图标进入特定的应用环境,依靠视觉和手动点击来完成任务。随着应用数量的增长和功能的堆叠,用户在不同App 间切换、寻找功能入口、手动搬运数据的成本显著上升。随着大模型的突破性进展,移动交互范式正处于跃迁的前夜:从GUI交互向Agentic 交互演进。用户只需通过自然语言表达想做什么,手机Agent 便负责将意图转化为具体的执行步骤并交付结果。如何在碎片化的移动生态中让AI 跨越应用围墙执行任务,业界目前有两条不同的技术路线:
  API 范式:建立标准化的语义接口,App 开发者主动适配并暴露相应功能。
  Agent 通过结构化的API 调用来指挥App 执行任务,以苹果的AppleIntelligence 及其App Intents 框架为典型代表。
  GUI 范式:利用多模态模型看懂屏幕上的UI 元素,利用系统辅助服务模拟手指的点击与滑动。这一路线不依赖开发者的配合,试图以通用的视觉能力“暴力”打通所有应用。智谱AI 的AutoGLM 和字节跳动的豆包手机助手是这一路线的先锋。
  核心差异对比,API Agent 与GUI Agent 各有千秋。对比了两种范式的技术路线差异,GUI Agent 的核心优势在于通用性高,在可靠性、性能、隐私风险角度则是API Agent 更胜一筹。1)通用性:GUI Agent 的通用性显著更高,这是核心优势,不需要App 开发者进行适配。理论上只要是人类能够使用的App,GUI-Agent 都能使用。解决了应用覆盖率的问题,新功能或未暴露功能的适配度也2)更可高靠。性;GUI Agent 的可靠性仍然较低。原因包括模型对复杂界面的识别能力还达不到百分百;需要多步骤模拟用户操作,整体任务失败率更高;UI 改版时容易失效。3)性能:APIAgent 可以一次调用完成复杂任务,后端直接驱动执行效率高。GUI Agent性能较低,完成简单任务可能需要多次截图分析、视觉推理等复杂计算,算力消耗更大。截图上传到云端模型时,数据量通常高于API 传输参数,延迟也更高。4)隐私风险:API-Agent 的应用端后台可进行精细的数据和权限管理,权限边界清晰。GUI-Agent 的隐私风险较高。它需要读取屏幕内容,容易暴露聊天记录、密码、验证码等敏感信息。除了技术问题,商业阻力上我们认为GUI Agent 不经过授权,更容易受到应用厂商的抵触。
  商业形态演变:三方博弈与生态重构。手机Agent 的兴起意味着移动互联网流量的重新洗牌,手机厂商、大模型厂商和应用厂商三方势力将展开复杂的博弈。手机厂商有望从硬件售卖进一步获取流量入口的价值,OS 成为了用户意图的第一接收者。类似于搜索广告可能演变成一种新的竞价模式。大模型厂商的愿景是打造一个全能的App(如ChatGPT、豆包)。用户在这个App 里通过对话完成所有需求。把将其他App 变成自己的后端数据库和工具。大模型厂商会积极寻求与二线手机厂商合作。字节跳动与中兴的合作就是典型案例。应用厂商,一方面可能与手机/模型厂商合作,开放部分能力接口;另一方面,为保护自身利益,也可能拒绝或限制Agent的接入。Agent 的授权边界是需要进一步划分的法律问题。App 自身也在Agent 化,例如微信最终会推出一个AI 智能体,淘宝也在尝试通过“问问”等功能在App 内实现自然语言导购。我们认为手机Agent 的发展不会是API 或GUI 的单选题,对于高价值、涉及敏感数据的操作(如支付、通讯、核心业务流),API Agent 有更高的准确度和隐私保护。对于只读、信息查询类的需求,以及API 尚未覆盖的应用,GUI Agent 通过视觉理解的方式运行可以更灵活通用。为了解决延迟和隐私问题,未来的手机处理器预计还将进一步优化视觉模型的推理能力,使GUI 识别和决策在端侧完成,不再上传云端。。
  建议关注
  GUI Agent:字节跳动、谷歌、阿里巴巴、中兴通讯。
  API Agent:腾讯控股、阿里巴巴、谷歌
  算力:寒武纪、海光信息、东阳光、神州数码、新易盛、中际旭创、中芯国际、华虹半导体、胜宏科技、品高股份、鸿腾精密、有方科技、协创数据、沪电股份、兴森科技、中科曙光、浪潮信息、东山精密、云天励飞、伟仕佳杰、宏景科技、中芯国际、奥飞数据、云赛智联、科华数据、禾盛新材、潍柴重机、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、弘信电子、圣阳股份、润泽科技、润建股份、深桑达、优刻得、云从科技、太极股份、数据港、首都在线。
  Agent:谷歌、阿里巴巴、腾讯控股、阜博集团、广立微、第四范式、360、汇量科技、金蝶国际、拓尔思、合合信息、税友股份、新致软件、金桥信息、快手、美图公司、鼎捷数智、慧辰股份、嘉和美康、海天瑞声、泛微网络、朗新集团、润达医疗、壹网壹创、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。
  自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。
  军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。
  风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:张晓波 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读