传媒行业快报:视频生成模型再迎突破

2024-02-19 12:55:03 和讯  华金证券倪爽
投资要点
事件: 2 月16 日OpenAI 发布文生视频模型Sora,其使用Transformer 架构,建立在DALL·E 3 和GPT 模型之上,可以生成长达一分钟的有运动、多机位视频。相比业界水平,Sora 将视频生成的时长一次性提升了15 倍,直接迈过了市面上所有短视频的时长要求。
视频生成模型范式的确定有望进一步推动多模态模型发展。模型层面:在文生视频领域,目前模型思路有循环网络( RNN )、生成对抗网络( GAN )和扩散模型( Diffusion models ),Sora 为一种扩散模型相较于GAN,扩散模型的生成多样性和训练稳定性都要更好。生成表现:扩散模型在图片和视频生成上有更高的天花板,GAN 模型从原理上本质上是机器对人的模仿,而扩散模型则更像是机器学会“ 成为一个人”。Sora 基本框架:基于OpenAI 大语言模型思路, Sora 采用Transformer 架构( 主流视频生成扩散模型较多采用U-Net架构),同时开发视频压缩网络有效减小Transformer 架构带来的计算量压力。训练端:Sora 文生视频模型,利用用DALL·E 3 的re-captioning 功能,给训练视频素材加上高质量文本描述。输入端: Sora 并非基于用户输入提示词直接生成,用户输入提示词后,GPT 会先将用户输入的提示词进行精准扩写,将扩写后的提示词交给Sora,生成较为精准视频。
模型多维度赋能视频制作或将影响行业生态。视频功能:1、模拟真实及虚拟世界:能够模拟物理世界中的人、动物和环境的某些方面;可以生成摄像机动态运动的视频。随着摄像机的移动和旋转,人物和场景元素在3D 空间中的移动会保持一致。训练数据规模扩张或将成为开发物理、数字世界、元宇宙的高效模拟方式。2、视频连接功能:在两个输入视频之间逐步插值,并在主题、场景构成完全不同的视频之间创建无缝过渡。3、扩展生成视频:能向前或向后多个维度扩展视频,(将同一生成的视频向不同视角延伸,视频开始都与其他视频不同,但结尾保持一致)4、视频剪辑: 在0 拍摄的情况下,转换输入视频的风格和环境。5、通过图像、视频进行生成提示:通过图像、视频的方式生成视频。6、生成图像能力:生成不同大小,分辨率高达2048x2048 的图像。
AIGC 产业市场规模呈现指数,生成式模型逐步向应用端渗透。根据第50 次《中国互联网络发展状况统计报告》,截至2022 年6 月,中国互联网普及率已高达74.4%。在网民规模持续提升、网络接入环境多元化。AIGC 技术作为新型内容生产方式,有望渗透人类生产生活,为千行百业带来颠覆变革。根据艾瑞咨询预测,2023 年中国AIGC 产业规模约为143 亿元,随后进入大模型生态培育期,持续打造与完善底层算力基建2030 年中国AIGC 产业规模有望突破万亿元,达到11441 亿元。目前AIGC 相关应用逐步颠覆传统PGC、UGC等内容生产方式。AIGC 主要影响内容创作与人机交互,因此价值链线上化程度越高,内容在价值链中占比越高,AIGC 对其颠覆效应越明显;另一方面,行业自身的数据、知识、监管要求等特点也会影响到AIGC 技术的渗透速度。
内容分发平台为核心的AIGC 布局现阶段主要在UGC 与PGC 中进行渗透。创作工具中模型能力为核心,文、图发展路径将分化。
投资建议:AIGC 相关模型发展或将改善原有生产工具及业务流程,降本增效的同时有望提升内容质量。相关标的:捷成股份(300182.SZ)、视觉中国(000681.SZ) 、昆仑万维(300418.SZ) 、因赛集团(300781.SZ) 、天娱数科(002354.SZ) 、恺英网络(002517.SZ) 、巨人网络(002558.SZ) 、中文在线(300364.SZ)、蓝色光标(300058.SZ)、风语筑(603466.SH)、掌阅科技(603533.SH)、元隆雅图(002878.SZ)、引力传媒(603598.SH)等。
风险提示:相关监管政策不确定性、算法发展不确定性、多模态相关应用发展不确定性等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读