传媒行业快报：视频生成模型再迎突破

2024-02-19 12:55:03 和讯华金证券倪爽

投资要点
事件： 2 月16 日OpenAI 发布文生视频模型Sora，其使用Transformer 架构，建立在DALL·E 3 和GPT 模型之上，可以生成长达一分钟的有运动、多机位视频。相比业界水平，Sora 将视频生成的时长一次性提升了15 倍，直接迈过了市面上所有短视频的时长要求。
视频生成模型范式的确定有望进一步推动多模态模型发展。模型层面：在文生视频领域，目前模型思路有循环网络（ RNN ）、生成对抗网络（ GAN ）和扩散模型（ Diffusion models ），Sora 为一种扩散模型相较于GAN，扩散模型的生成多样性和训练稳定性都要更好。生成表现：扩散模型在图片和视频生成上有更高的天花板，GAN 模型从原理上本质上是机器对人的模仿，而扩散模型则更像是机器学会“ 成为一个人”。Sora 基本框架：基于OpenAI 大语言模型思路， Sora 采用Transformer 架构（主流视频生成扩散模型较多采用U-Net架构），同时开发视频压缩网络有效减小Transformer 架构带来的计算量压力。训练端：Sora 文生视频模型，利用用DALL·E 3 的re-captioning 功能，给训练视频素材加上高质量文本描述。输入端： Sora 并非基于用户输入提示词直接生成，用户输入提示词后，GPT 会先将用户输入的提示词进行精准扩写，将扩写后的提示词交给Sora，生成较为精准视频。
模型多维度赋能视频制作或将影响行业生态。视频功能：1、模拟真实及虚拟世界：能够模拟物理世界中的人、动物和环境的某些方面；可以生成摄像机动态运动的视频。随着摄像机的移动和旋转，人物和场景元素在3D 空间中的移动会保持一致。训练数据规模扩张或将成为开发物理、数字世界、元宇宙的高效模拟方式。2、视频连接功能：在两个输入视频之间逐步插值，并在主题、场景构成完全不同的视频之间创建无缝过渡。3、扩展生成视频：能向前或向后多个维度扩展视频，（将同一生成的视频向不同视角延伸，视频开始都与其他视频不同，但结尾保持一致）4、视频剪辑：在0 拍摄的情况下，转换输入视频的风格和环境。5、通过图像、视频进行生成提示：通过图像、视频的方式生成视频。6、生成图像能力：生成不同大小，分辨率高达2048x2048 的图像。
AIGC 产业市场规模呈现指数，生成式模型逐步向应用端渗透。根据第50 次《中国互联网络发展状况统计报告》，截至2022 年6 月，中国互联网普及率已高达74.4%。在网民规模持续提升、网络接入环境多元化。AIGC 技术作为新型内容生产方式，有望渗透人类生产生活，为千行百业带来颠覆变革。根据艾瑞咨询预测，2023 年中国AIGC 产业规模约为143 亿元，随后进入大模型生态培育期，持续打造与完善底层算力基建2030 年中国AIGC 产业规模有望突破万亿元，达到11441 亿元。目前AIGC 相关应用逐步颠覆传统PGC、UGC等内容生产方式。AIGC 主要影响内容创作与人机交互，因此价值链线上化程度越高，内容在价值链中占比越高，AIGC 对其颠覆效应越明显；另一方面，行业自身的数据、知识、监管要求等特点也会影响到AIGC 技术的渗透速度。
内容分发平台为核心的AIGC 布局现阶段主要在UGC 与PGC 中进行渗透。创作工具中模型能力为核心，文、图发展路径将分化。
投资建议：AIGC 相关模型发展或将改善原有生产工具及业务流程，降本增效的同时有望提升内容质量。相关标的：捷成股份(300182.SZ)、视觉中国(000681.SZ) 、昆仑万维(300418.SZ) 、因赛集团(300781.SZ) 、天娱数科(002354.SZ) 、恺英网络(002517.SZ) 、巨人网络(002558.SZ) 、中文在线(300364.SZ)、蓝色光标（300058.SZ）、风语筑（603466.SH）、掌阅科技(603533.SH)、元隆雅图（002878.SZ）、引力传媒（603598.SH）等。
风险提示：相关监管政策不确定性、算法发展不确定性、多模态相关应用发展不确定性等。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

看全文

写评论已有条评论跟帖用户自律公约

提交还可输入500字

传媒行业快报：视频生成模型再迎突破

最新评论

相关推荐

热门阅读

和讯特稿

传媒行业快报：视频生成模型再迎突破

最新评论

相关推荐

热门阅读

和讯特稿

推荐阅读