传媒行业点评报告：AGI里程碑：OPENAI发布视频生成模型SORA 多模态有望加速

2024-02-21 16:25:08 和讯东吴证券张良卫/郭若娜

　　投资要点
　　事件：2 月17 日，OPENAI 发布首个视频生成模型Sora，可实现文生视频、图生视频、扩展或补充视频等，最高可生成一分钟的高清视频，能生成具有多个角色、包含特定运动的复杂场景，表现出突破性的语义理解能力、复杂场景理解能力和一致性等。
　　视频生成能力显著突破，向着AGI 目标再进一步。相比行业原有视频生成模型gen2、pika 等，Sora 在语义理解能力、复杂场景理解能力、一致性以及生成视频时长等方面取得明显突破。1）模型层面，Sora 是一种扩散模型，从一个看起来像静态噪音的视频开始生成视频，通过多个步骤去除噪音，逐渐转换视频。Sora 可以一次性生成整个视频，也可以扩展生成的视频。与 GPT 模型类似，Sora 也采用了transformer 架构，模型性能随着模型规模扩大而提高。新技术路径验证有望加速行业发展，算力需求有望增加。2）训练数据层面，Sora 将视频和图像表示为更小的数据单元集合patch（类似于 GPT 中的token），通过统一数据表示方式，可在比以往更广泛的视觉数据上训练模型，包括不同的持续时间、分辨率和宽高比，最终生成的视频在这些维度也具有更高的灵活性。
　　OpenAI 未将Sora 单纯视作视频模型，而是将其作为“世界模拟器”，在物理世界模拟上已开始出现涌现效应，我们认为其亦有望为AI 3D 等其他多模态领域提供经验借鉴，多模态大模型有望加速发展。
　　建议关注Sora 带来的多模态应用发展机遇。1）视频生成技术在广告、电商等垂直领域的商用可行性大幅提高，如广告营销领域为客户提供更多的营销工具，电商领域为卖家提供相关的工具服务，已积累对应客户资源的行业玩家有望借此打开变现空间。2）创意落地的成本大幅缩减。
　　SORA 最高可生成一分钟的高清视频，基本达到主流短视频平台创作时长的要求，加上文字创作、文生图等技术日趋成熟，制作不同形态内容的门槛和成本大幅降低，一方面优质IP 有望降低试错成本，扩大IP 变现途径，另一方面视频生成技术成熟后可能会诞生新的AI 时代的抖音，国内市场聚焦在AI 大模型上持续投入的公司可有更大的拓展空间，海外接入外部大模型能力，发挥工具价值的公司可实现垂类场景的深耕。
　　3）专业内容生产方可降本增效。影视、游戏和MR 领域专业创作者可以利用先进AI 技术降本增效，如动画电影生产周期缩短，相关内容生产方有望受益。
　　投资建议：我们推荐在多模态方向已有布局或具备布局能力的标的，包括昆仑万维、万兴科技、美图等，建议关注新国都。头部IP 变现有望受益于视频生成技术成熟，推荐中文在线，建议关注上海电影等。多模态技术进步利好电商、营销、影视、游戏、教育、MR 等领域AI 应用发展，推荐焦点科技、蓝色光标、风语筑、盛天网络、世纪天鸿、华策影视、光线传媒等，建议关注丝路视觉、易点天下、因赛集团、虹软科技等。算力方向建议把握板块龙头投资机会，推荐中际旭创、天孚通信等龙头。建议关注可能受益于AI 视频发展的视频技术公司，如当虹科技等。
　　风险提示：多模态技术发展不及预期，伦理与隐私问题，商业化拓展不及预期，算力基础设施发展不及预期。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

看全文

写评论已有条评论跟帖用户自律公约

提交还可输入500字

传媒行业点评报告：AGI里程碑：OPENAI发布视频生成模型SORA 多模态有望加速

最新评论

相关推荐

热门阅读

和讯特稿

传媒行业点评报告：AGI里程碑：OPENAI发布视频生成模型SORA 多模态有望加速

最新评论

相关推荐

热门阅读

和讯特稿

推荐阅读