AI+专题系列点评(二十二)：豆包AI：多主体互动与高效计算的视频生成

2024-10-17 07:25:07 和讯华创证券吴鸣远

　　事项：
　　2024 年9 月24 日，字节跳动旗下火山引擎在深圳举办的AI 创新巡展上正式发布了两款豆包视频生成大模型：Pixel Dance 和Seaweed，同时开启了面向企业市场的邀测。豆包AI 视频生成大模型具备多主体协同和复杂任务处理的显著能力，支持复杂的多镜头操作，如变焦、平移和环绕，确保不同镜头切换时视觉风格和细节的一致性。该模型采用动态集成Transformer（DiT）架构，每分钟处理高达80 万次Token，远超行业标准，具备强大的并发处理能力。这些特性使豆包AI 在视频生成领域，尤其是影视和广告行业，拥有广泛的应用前景和竞争优势。
　　评论：
　　多主体互动与复杂任务处理：豆包AI 视频生成大模型突破了多主体复杂互动的技术障碍，支持深度语义理解，通过复杂指令驱动多个角色的自然互动。这使得生成的视频角色动作、表情高度协调，自然流畅，满足影视、游戏等多角色场景的需求。
　　多镜头切换与一致性：依托动态集成Transformer（DiT）架构，模型支持丰富的多镜头操作，如变焦、环绕、平移等，并在不同镜头切换中保持主体风格、氛围的一致性。这解决了传统视频生成中因镜头切换导致视觉不连贯的问题，为视频创作者提供了更灵活的视觉表达手段。
　　细节处理与风格适应性：该模型具备强大的细节处理能力，能够准确呈现人物的外貌、服装等细微变化，并且适应多种风格需求。即使在复杂的时序转换中，视频内容仍能保持高度一致性，进一步提升视频的表现力与观赏性。
　　高效计算与扩展能力：豆包AI 视频生成模型具备每分钟高达80 万Token 的并发处理能力，远超行业标准。这使其能够高效应对大规模应用中的高并发需求，确保系统的稳定性和效率。同时，它在影视制作和广告生成等领域展现出巨大的应用潜力。豆包AI 的技术突破显著提升了生成高质量复杂视频内容的效率，推动了智能化视频生成领域的发展，并在行业中展现了强大的竞争优势。
　　投资建议：AI 大模型本质应落脚垂类应用，国内大模型正快速追赶美国先进水平，中文大模型的突破有望为下游AI 应用注入新的活力，看好AI+应用产品力与商业化落地进程。建议关注以下标的：AI+应用侧：1）安全：永信至诚、深信服；2）办公：金山办公、福昕软件；3）法律：金桥信息、华宇软件、通达海；4）医疗：润达医疗；5）教育：佳发教育、欧玛软件、新开普；6）金融：同花顺、新致软件；7）邮箱：彩讯股份；8）传媒：掌阅科技、华策影视；9）数据：海天瑞声；10）电商：焦点科技；11）OA：致远互联、泛微网络；12）ERP：用友网络、金蝶国际。算力侧：1）算力基础：润泽科技、亚康股份、海光信息、寒武纪、龙芯中科；2）服务器：中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。
　　风险提示: 商业化后表现不及预期，用户付费意愿低，行业技术迭代速度较快。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约