传媒行业快报：视频生成再迎突破开源赋能内容创作

2024-12-06 07:50:04 和讯华金证券倪爽

　　投资要点
　　事件： 12 月3 日，腾讯混元大模型正式上线视频生成功能并实现开源，参数量达130 亿，并在综合评测中呈领先趋势。基于该开源模型，开发者有望显著实现降本增效，加速赋能行业技术创新和进步。
　　混元大模型功能上新，开源视频生成迎里程碑式突破。年初至今，腾讯混元系列模型的开源速度不断加快。此前，腾讯混元已经开源了旗下文生文、文生图和3D 生成大模型。此次文生视频发布，标志着腾讯混元系列大模型已实现全面开源。目前该模型已上线腾讯元宝APP，C 端用户可在AI 应用中的“AI 视频”板块申请试用，B 端企业客户通过腾讯云提供服务接入，目前API 同步开放内测申请。用户只需输入一段描述，即可生成视频。目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。该模型可实现超写实画质、生成高度符合提示词的视频画面。面对大幅度运动画面的生成，该模型可生成非常流畅、合理的运动镜头，物体不易出现变形；光影反射基本符合物理规律，在类似镜面的场景中，可做到镜面内外动作一致。同时，模型还可实现在画面主角保持不变的情况下自动切镜头，显著领先业界大部分模型。在与国内外多个顶尖模型的评测对比中，混元视频生成模型在文本视频一致性、运动质量和画面质量多个维度效果领先，在人物、人造场所等场景下表现尤为出色，总体评分41.30%，显著领先第二名（37.70%）和第三名（37.50%），位居第一。视频生成质量显著提升，开源视频生成技术实现突破，有望深度赋能内容生产和创作。
　　开源视频生成技术持续迭代，牵引配套技术升级，赋能下游多领域。除基础的视频生成能力外，腾讯在其基础上进行生态拓展，推出了视频配音与配乐功能，能够为生成的视频提供音效与背景音乐，进一步提升视频的完整性和表现。此外，腾讯还推出了驱动2D 照片数字人的技术，支持通过语音、姿态和表情等多种驱动方式控制照片数字人的动态表现，以增强生成内容的自然度、一致性和可控性。
　　主要技术突破带动次要功能升级，有望刺激视频剪辑、配音等互补产品生态蓬勃发展；多维度的一键式AIGC 内容生产工具相辅相成，有望长效赋能内容生产。
　　投资建议：开源视频生成模型迎里程碑式突破，或有望带动互补产品生态蓬勃发展，合力赋能toB 和toC 端内容生产创作。建议关注：腾讯控股、网易-S、因赛集团、蓝色光标、恺英网络、巨人网络、汤姆猫、昆仑万维、美图公司、天娱数科、引力传媒、中文在线、阅文集团、捷成股份、华策影视、风语筑、视觉中国、快手-W、万兴科技等。
　　风险提示：政策不确定性、技术落地进度不及预期、AI 版权授权潜在风险等。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：贺翀）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约