可灵2.6模型推出“音画同出”能力中文语音生成效果全球领先

2025-12-04 09:04:56 智通财经

新闻摘要

智通财经APP获悉，12月3日，可灵推出视频生成2.6模型，该模型提供了里程碑式的“音画同出”能力，彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程，能够在单次生成中，输出包含自然语言、动作音效以及环境氛围音的完整视频，重构了AI视频创作工作流，极大提升创作效率。目前，语音支持生成中文与英文，生成的视频长度最长可达10秒。通过对物理世界声音与动态画面的深度语义对齐，可灵2.6模型在音画协同、音频质量和语义理解上表现亮眼，同时在中文语音生成效果上保持全球领先

智通财经APP获悉，12月3日，可灵推出视频生成2.6模型，该模型提供了里程碑式的“音画同出”能力，彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程，能够在单次生成中，输出包含自然语言、动作音效以及环境氛围音的完整视频，重构了AI视频创作工作流，极大提升创作效率。本次模型升级了文生音画、图生音画两大功能。目前，语音支持生成中文与英文，生成的视频长度最长可达10秒。

通过对物理世界声音与动态画面的深度语义对齐，可灵2.6模型在音画协同、音频质量和语义理解上表现亮眼，同时在中文语音生成效果上保持全球领先。

（责任编辑：董萍萍）

【免责声明】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约