事件近期,OpenAI发布文生视频模型Sora,Google发布Gemini Pro1.5模型。
OpenAI 发布文生视频模型Sora,或将成为AGI 的重要里程碑。北京时间2 月16 日凌晨, OpenAI 发布其首个文生视频模型Sora。Sora 能够生成长达60 秒的视频,能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景,支持一次生成整个视频或扩展生成的视频以及多镜头。根据Open AI 的官方技术文档,Sora 是基于Transformer 架构的Diffusion 模型,一次生成多帧的预测,确保画面主体即使暂时离开视野也能保持不变,使其具备较强的对象一致性,三维世界一致性,以及对物理世界的初步理解能力。并利用视频数据进行大规模训练,使其视频生成质量显著提升。Open AI 认为,Sora 是能够理解和模拟现实世界的模型基础,或将成为实现通用AGI 的重要里程碑。
Google 发布Gemini 1.5 Pro 模型,可高处理10,000K token 上下文。北京时间2 月15 日,Google 发布Gemini 1.5 Pro 模型。其基于Transformer和MoE 架构,使得模型效率大幅提升。能够一次性处理海量信息——比如1 小时的视频、11 小时的音频、超过30,000 行的代码库,或是超过700,000 个单词。在处理高达10,000K token 的文本时,检索准确性仍然高达99.2%。同时,1.5 Pro 具备更强的推理能力,更强的多模态理解能力和编程能力,比如1.5 Pro 能够在402 页的飞行记录找到关键信息、在44 分钟的电影中梳理出情节发展和细节信息、分析和掌握复杂代码库等。
投资建议:AI 大模型持续迭代,拥有更强的推理能力、多模态能力和理解能力,推动AI 应用加速落地并逐步实现商业化,也有望在各个垂直领域带来革命性的改变。我们建议关注以下方向:
1)影视/IP:多模态大模型将大幅提升内容创作效率,降低创作门槛,赋能内容创意、内容制作、宣发等环节,带来内容质量以及产能的提升,同时实现降本增效。另一方面,拥有丰富IP 储备可以对IP 进行短视频、小说、短剧等多种形式的商业化变现,提高IP 使用效率,IP 价值得到重估。建议关注华策影视、光线传媒、芒果超媒等;2)游戏:AI 赋能游戏场景设计、游戏CG、玩法、NPC 等,游戏品质、玩法丰富度有望进一步提升,进而带来玩家体验和付费意愿的提升。建议关注巨人网络、恺英网络、三七互娱、完美世界、腾讯、网易等;3)短视频:Sora 生成60s 时长视频契合短视频内容生态,有望将降低内容创作者的视频制作门槛,提升内容生产质量以及内容生产效率,推动短视频内容生态繁荣。建议关注:快手、天下秀(KOL 短视频生成)等;5)图片/视频版权:多模态是后续大模型的重要发展方向之一,多模态训练对图像、视频、音频等数据需求远大于语言文字,同时,无论是图像视频生成还是理解,更高清的图像、高帧率的视频具有更高的细节和更好的训练效果,故帧率高质量数据的重要性进一步提升。建议关注:
视觉中国、阜博集团等;
6)有AI 商业落地场景:AI 技术的持续迭代有望提升原有产品的表现,建议关注已有AI 商业落地场景的公司。建议关注盛天网络、易点天下等。
风险提示:AI 进展不及预期,商业化不及预期,政策风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论