视频生成是大模型重要的多模态能力。OpenAI 发布Sora 后,奠定了视频生成的重要技术路线DiT,并且将生成视频的时长提高到分钟级别,成为行业转折点。截至24 年10 月,Sora 一直未发布公测版。与此同时,国内外其他模型厂商逐步落地类似Sora 的产品。其中,国内大模型初创公司MiniMax 于8 月上线视频生成模型,效果惊艳,使其产品月访问量增速超800%。我们认为,MiniMax 等公司持续优化视频生成效果,有望推动AIGC在各行业的加速落地,加快AI 应用迭代;同时由于视频生成所需算力远大于文本,有望进一步提高AI 算力需求。推荐国产算力链:沪电股份、工业富联、海光信息;AI 应用:微软、奥多比、金山办公、福昕软件、泛微网络、鼎捷数智。
Sora DiT 技术成为视频生成转折点,国内外厂商率先实现产品落地24 年2 月,OpenAI 发布了视频生成模型Sora,采用了Diffusion Transformer(DiT)技术路径,通过文本提示的方式,能够生成长达1min 的高质量视频,且其指令跟随和一致性相比之前Diffusion 技术的产品有显著改善。但是截至24 年10 月,Sora 公开版一直未发布。另一方面,国内外其他厂商率先实现了类Sora 产品落地,包括国内MiniMax、智谱、字节、快手、爱诗科技、生数科技,海外Runway、Pika、Luma。目前由于算力和技术等因素,视频生成时长一般在10s 以内。
MiniMax 视频生成模型测评榜Top 1,助力产品月增速800%24 年8 月底,MiniMax 发布视频生成模型并整合到海螺AI 产品中。据第三方榜单VBench 统计数据,在VBench-long 测评中,MiniMax 视频模型总分排行Top 1,并且在空间关系、多目标、图像质量、对象分类、色彩、时间风格等细节指标上Top 1。从实测结果看,对于同样的提示词和默认配置下,对比其他初创公司和大厂的视频生成模型,MiniMax 生成的结果一致性、指令跟随性较好,整体用户观感优秀。在视频模型技术加持下,据AI 产品榜(web)数据,截至24 年9 月,海螺AI 网页版月访问量增速超800%。
模型和产品双线布局,实现技术到应用的有效PMFMiniMax 视频生成效果优秀,得益于模型技术和产品经验积累。模型方面,MiniMax 于23 年10 月abab 5.5 第二代首次实现MoE,2024 年4 月推出万亿参数MoE abab 6.5 和6.5s 模型。下一代多模态模型abab 7 将采用MoE + Linear Attention,支持更高效的模型训练和更快的响应速度。产品线方面,C 端瞄准内容消费/专业助手赛道,形成星野&Talkie/海螺AI 产品矩阵。
据Sensor Tower 数据,2024 年1-6 月,Talkie 月活用户1100 万。我们认为,在领先的大模型技术加持下,叠加优秀的PMF 和产品运营能力,MiniMax已经在AI 应用中占据有力赛道,并有望继续拓展市场,带动行业进步。
风险提示:宏观经济波动,技术进步不及预期,中美竞争加剧。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:郭健东 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论