事件:美国东部时间5 月14 日,Google 举办了2024 年开发者大会Google IO,发布了一系列图像/视频生成模型、应用产品及AI 基础设施升级。
视觉生成模型和开源模型全面升级。1)全新视频生成模型Veo 将逐步在VideoFX 产品中应用,相较OpenAI 在24M2 发布的Sora,支持生成更长时间的视频内容。2)新一代图像生成模型Imagen 3:相较于谷歌在23M12 发布的Imagen 2,该模型在提示词理解、图像质量生成和文字渲染等维度有显著增强,将逐步植入ImageFX、Vertex AI 等产品。3)发布27B 参数量的开放大模型Gemma2,其性能与Llama 3 70B 版本相当。此外,相比同参数量级模型,该模型减少一半部署成本。4)开源轻量化视觉语义模型PaliGemma加强了对图像多模态内容的理解和分析能力,将拓展更多应用场景。
Gemini 模型系列持续演进,构筑完整产品矩阵。 1)为Gemini 订阅用户提供上下文一百万tokens 的Gemini 1.5 Pro,并发布上下文至2 百万tokens的版本,支持上下文内容缓存来减少使用成本。2)针对低成本高频简单任务,优化推出响应更快的Gemini 1.5 Flash 模型。3)基于Gemini 训练而成的AI助理Project Astra 具备记忆和无延迟对话能力。4)轻量化Gemini Nano 将植入部分安卓设备,提供本地化多模态大模型支持。
Gemini 赋能搜索业务,重塑搜索体验。Gemini 可以根据搜索结果的内容进行个性化的展示,除文本外,现接受视频作为搜索关键字。主要的功能包括:
1)AI 能总结归纳内容,提高搜索满意度,为内容提供方带来更有价值流量。
2)支持复杂搜索指令,如详细规划和精细推荐。3)针对于开放性结果的搜索,对内容归纳和整理,计划首先应用在餐饮和食谱的搜索。
AI 算力基础设施实现新突破。1)新一代TPU Trillium 芯片性能相较TPU v5e提升4.7 倍,ICI 高带宽内存容量和带宽翻倍,为大规模模型训练和复杂任务推理奠定基础。2)成为英伟达Blackwell GPUs 首家云供应商。
丰富的AI 产品矩阵赋能谷歌生态。1)Gemini 模型融入谷歌核心服务如Gmail、搜索等,可显著提升生产力。2)Gemini Nano 等轻量级模型本地化部署在安卓设备,推出创新AI 功能,提升用户体验和黏性。3)算力基础设施的持续增加为未来模型性能的提升和全新大模型训练奠定基础。4)Vertex AI产品提供低代码式模型训练部署,降低AI 使用门槛。
投资建议:谷歌拥有深厚的AI 技术积累,基础设施、模型端和应用端相辅相成,构建完善的AI 应用生态,Gemini for Workspace 的产品陆续开始商业化。
24 年谷歌资本支出预计将大幅上升,投资于AI 相关基础设施建设,24Q1 公司首次发放股利,谷歌云和Youtube 收入强劲增长,建议持续关注。
多模态大模型开始赋能应用端,海外AI 应用和服务货币化进程逐渐加快,建议关注:1)AI 语音助手:OpenAI 的GPT-4v 和谷歌Project Astra 均由多模态大模型提供支持,大幅降低延迟和减少信息丢失,能够理解周围环境和解读语音中的情感,将AI 应用的场景拓宽至智能客服、教育、情感陪伴等领域,关注亚马逊、Duolinguo。2)AI 手机和VR/AR:多模态大模型与移动终端的契合度较高,有望孵化出更多创新AI 原生应用,关注苹果、Meta。
风险提示:AI 技术研发和产品迭代不及预期;AI 行业竞争加剧风险;商业化进展不及预期风险;国内外政策风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论