OpenAI、谷歌“较劲”智能助手 Kimi、秘塔接连“出圈”

2024-05-22 06:34:26 每日经济新闻

新闻摘要

伴随来势汹汹“百模大战”的，是重复性建设的争议和商业变现的难题。随着最初的热潮褪去，一些投资人对大模型的认知也进入了冷静期。AI原生应用正在成为科技巨头追捧的新风口

伴随来势汹汹“百模大战”的，是重复性建设的争议和商业变现的难题。随着最初的热潮褪去，一些投资人对大模型的认知也进入了冷静期。AI原生应用正在成为科技巨头追捧的新风口。

当地时间5月13日，OpenAI发布了由新一代AI大模型GPT-4o支持的ChatGPT智能助手，交互能力堪比真人。一日之后，谷歌也推出了视觉识别和语音交互产品Project Astra，并为其搜索工具推出了AI概述（AI Overview）功能，用户在搜索框输入问题，即可得到一个AI总结的答案。

视觉中国图

明星投资人朱啸虎表示，在大模型上做增值服务的机会很多，应用层有很多创新，中国在数据和应用场景上是远远超过美国的。

英诺天使基金合伙人王晟在接受《每日经济新闻》记者采访时对此也表示认同。他说：“应用里会出大机会。我认为最大的平台终究还是一个用户需求驱动的应用平台。”

在OpenAI和谷歌的大动作之前，秘塔AI搜索和月之暗面的Kimi智能助手已经接连“出圈”，让市场看到了AI应用的广阔市场空间。业内甚至有观点认为，2024年将成为AI应用创新的元年。对此，王晟持怀疑态度。他表示，大模型能力、工具链能力、成本端等方面尚有不足，AI应用的爆发还没有到时间。

硅谷“新赛场”：智能助手

“百模大战”行至当下，越来越多的业界人士认为，AI未来的竞争高地不在大模型本身，而在落地于千行百业的原生应用。以强大的大模型为基础，硅谷的科技巨头正在着力研发更人性化、功能更强大的生成式AI工具。

当地时间5月13日，OpenAI召开春季发布会，发布了新一代AI大模型GPT-4o，编号中的字母“o”代表“omni”（全能），既能接受文本、音频和图像的任意组合输入，还能生成文本、音频和图像的相关回应。

在直播演示中，由GPT-4o支持的ChatGPT不仅能翻译和识别图像并展开讨论，还会察言观色，开玩笑和假装脸红，而且还知道如何应对干扰，展示了流畅的对话水平，对话基本无延迟，交互能力堪比真人。

《Wire》报道称，这样的调整可能使ChatGPT更具吸引力。OpenAI首席执行官阿尔特曼直言：“这就像电影中的AI 一样真实，坦白说，我还是有点惊讶。达到接近人类的反应速度和表达能力，是一个重大的突破。”

OpenAI计划在未来几周内在API（应用程序编程接口）中向部分合作伙伴开放GPT-4o新音频和视频功能。

而在GPT-4o发布的第二天，谷歌的年度开发者大会如约召开，十余款产品相继发布：除了多模态AI模型Gemini 1.5 Pro、文生图模型Imagen 3和文生视频模型Veo，谷歌还推出了视觉识别和语音交互产品Project Astra。

只要打开手机摄像头，对准任意物品，Astra就可以准确说出物品的名称，还可以回答诸如“镜头中什么东西是可以发声的”这种问题。

从演示上看，Astra的对话延迟比GPT-4o长一些，被提问之后需要一定的反应时间，但同样具备多模态理解和实时对话能力。

此外，谷歌还为其搜索工具推出了AI概述（AI Overview）功能，用户在搜索框输入问题，即可得到一个AI总结的答案，且能处理超长问题。

在OpenAI和谷歌之外，硅谷企业家埃隆·马斯克、技术企业“深层思维”创始人之一穆斯塔法·苏莱曼也分别投资开发了聊天机器人(300024)Grok和Pi，将拟人化特点作为产品主攻方向。

“应用里有大机会”

猎豹移动董事长兼CEO傅盛认为，如果不计成本地叠加参数，提高所谓的大模型能力，这条路肯定会遇到困难。OpenAI发布GPT-4o，正说明了大模型在应用层面大有可为，大模型的能力会不断迭代，但最终能把大模型用好的，还是应用。

近期，秘塔AI搜索和月之暗面在国内的大火也充分展示了AI应用的广阔空间。

“AI产品榜（aicpb.com）”统计数据显示，月之暗面的Kimi智能助手今年4月的访问量达2004万，环比增长60.2%，前一个月环比增长321.58%。继3月环比增长551.36%后，国产AI应用秘塔AI搜索今年4月的访问量延续增长态势，环比上涨54.56%，达1086万。

在此之前，百度也一口气发布了超20款AI原生应用；字节跳动成立了新团队，主攻应用层；腾讯将大模型嵌入了小程序；阿里也要用通义千问将所有应用重新做一遍。

英诺天使基金合伙人王晟在接受《每日经济新闻》记者采访时表示：“应用里会出大机会。我认为最大的平台终究还是一个用户需求驱动的应用平台。”

明星投资人朱啸虎也非常看好国内的应用层创新，在他看来，国内创新最大的底气是数据和应用场景上是远远超过美国的。

抉择：To B还是To C

当大量的热钱和人才向大模型应用领域加速集中时，企业的选择也开始分化：一部分如秘塔科技在面向C端（消费端）之余也在加强B端（商业端）客户的覆盖，另一部分如月之暗面则选择To C（面向消费者）。

在用户规模上，秘塔科技的COO（首席运营官）王益为去年11月向媒体透露，秘塔通过C端注册用户触达B端用户，彼时已有互联网大厂、知名媒体等在内的几千家B端客户。

由前微软全球副总裁姜大昕创办的国内大模型初创公司阶跃星辰将目标主要集中在C端。

“我们选择不做传统意义上的To B，会比较聚焦在To C上。”阶跃星辰方面对《每日经济新闻》记者如此说道：“从大的角度来说，我们目前更多还是聚焦在模型上。产品我们肯定做，第一是我们需要有产品来牵引模型的发展，第二是用产品的数据来反哺我们的模型。至于做什么样的产品？首先，阶跃星辰不想做传统的定制化模型加上私有化部署这样的逻辑，我们还是想保持相对比较精英、人才比较集中的团队。”

月之暗面曾在接受《每日经济新闻》记者采访时解释称，坚定To C是因为模型能力还在快速迭代中，做To B产品容易浪费大量人力和物力资源。“国内市场的B端产品往往需要私有化部署和定制化开发，而基于现有模型的某个版本进行如此部署和开发，将会导致B端产品的能力和用户体验完全跟不上模型能力的快速提升，很快就会被淘汰。”

专注于AI基础设施层的创业公司硅基流动的创始人袁进辉却不这么看。他对《每日经济新闻》记者分析称，目前而言，做To B服务的确定性更高，很多企业都在利用大模型做不同行业的垂类服务，他们对大模型的微调、推理都有很强的需求。

袁进辉认为，To C应用成功的不确定性更高，至少在国内还没有看到像Midjourney、Character.ai这样的杀手级应用。随着大模型推理部署的成本进一步降低，To C应用的尝试也会越来越多，更有机会出现超级应用。相较而言，海外市场的To C应用比国内的进展要快。

他强调，从长远来看，在大模型领域，无论是做To C还是To B，都有广阔的市场空间。

如果说2023年是AI大模型元年的话，那么业内有很多声音认为，2024年将成为AI应用创新年。

对于这点，王晟在采访中持怀疑态度。他表示，鉴于大模型能力、工具链能力、成本端等方面均尚有不足，AI应用的爆发还没有到时间。就像对中国市场来说，微信是第一个重要的手机应用，但它出现的时候，iPhone已经发布4年了。

除了创造应用的条件不够成熟，王晟还指出，新的应用场景还未被发掘，尤其对于初创公司而言。现在很多应用就是把AI应用到过去已有的互联网业务项目上，过去旧产业里的大玩家在这上面有客户、钱、数据、人才、对场景的理解等一系列优势，初创公司很难补齐。对于初创公司来说，核心就是要创新，不要只服务既有场景和既有用户，要去找到新的需求和人群。

（责任编辑：张洋 HN080）

看全文

写评论已有条评论跟帖用户自律公约