AI+专题系列点评(二十二):豆包AI:多主体互动与高效计算的视频生成

2024-10-17 07:25:07 和讯  华创证券吴鸣远
  事项:
  2024 年9 月24 日,字节跳动旗下火山引擎在深圳举办的AI 创新巡展上正式发布了两款豆包视频生成大模型:Pixel Dance 和Seaweed,同时开启了面向企业市场的邀测。豆包AI 视频生成大模型具备多主体协同和复杂任务处理的显著能力,支持复杂的多镜头操作,如变焦、平移和环绕,确保不同镜头切换时视觉风格和细节的一致性。该模型采用动态集成Transformer(DiT)架构,每分钟处理高达80 万次Token,远超行业标准,具备强大的并发处理能力。这些特性使豆包AI 在视频生成领域,尤其是影视和广告行业,拥有广泛的应用前景和竞争优势。
  评论:
  多主体互动与复杂任务处理:豆包AI 视频生成大模型突破了多主体复杂互动的技术障碍,支持深度语义理解,通过复杂指令驱动多个角色的自然互动。这使得生成的视频角色动作、表情高度协调,自然流畅,满足影视、游戏等多角色场景的需求。
  多镜头切换与一致性:依托动态集成Transformer(DiT)架构,模型支持丰富的多镜头操作,如变焦、环绕、平移等,并在不同镜头切换中保持主体风格、氛围的一致性。这解决了传统视频生成中因镜头切换导致视觉不连贯的问题,为视频创作者提供了更灵活的视觉表达手段。
  细节处理与风格适应性:该模型具备强大的细节处理能力,能够准确呈现人物的外貌、服装等细微变化,并且适应多种风格需求。即使在复杂的时序转换中,视频内容仍能保持高度一致性,进一步提升视频的表现力与观赏性。
  高效计算与扩展能力:豆包AI 视频生成模型具备每分钟高达80 万Token 的并发处理能力,远超行业标准。这使其能够高效应对大规模应用中的高并发需求,确保系统的稳定性和效率。同时,它在影视制作和广告生成等领域展现出巨大的应用潜力。豆包AI 的技术突破显著提升了生成高质量复杂视频内容的效率,推动了智能化视频生成领域的发展,并在行业中展现了强大的竞争优势。
  投资建议:AI 大模型本质应落脚垂类应用,国内大模型正快速追赶美国先进水平,中文大模型的突破有望为下游AI 应用注入新的活力,看好AI+应用产品力与商业化落地进程。建议关注以下标的:AI+应用侧:1)安全:永信至诚、深信服;2)办公:金山办公、福昕软件;3)法律:金桥信息、华宇软件、通达海;4)医疗:润达医疗;5)教育:佳发教育、欧玛软件、新开普;6)金融:同花顺、新致软件;7)邮箱:彩讯股份;8)传媒:掌阅科技、华策影视;9)数据:海天瑞声;10)电商:焦点科技;11)OA:致远互联、泛微网络;12)ERP:用友网络、金蝶国际。算力侧:1)算力基础:润泽科技、亚康股份、海光信息、寒武纪、龙芯中科;2)服务器:中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。
  风险提示: 商业化后表现不及预期,用户付费意愿低,行业技术迭代速度较快。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读