计算机行业点评：SORA正式上线多模态模型的里程碑

2024-12-14 09:10:03 和讯山西证券方闻千

　　事件描述：
　　12 月10 日，OpenAI 正式上线Sora，并向包括美国在内的多数国家用户开放，用户可在OpenAI 官网上体验Sora。同时，Sora 被包含在ChatGPT Plus和ChatGPT Pro 的会员订阅方案中，用户无需额外付费。其中，订阅Plus 方案的用户可使用Sora 生成最多50 个分辨率达720p、时长为5 秒的高级视频，而Pro 方案能生成最多500 个分辨率达1080p、时长为20 秒的高级视频，并且提供去水印功能。
　　事件点评：
　　相较于OpenAI 2 月份发布的版本，此次上线的新Sora 新增Storyboard、Remix、Re-cut 等功能，视频再创作能力大幅提升，并且优化了视频生成速度及生成方式。新Sora 的新功能包括1）Storyboard：类似于电影里的分镜，即用户只需借助文字设计几段视频帧或直接上传图片作为静态视频帧，并在视频帧之间预留一些时间供Sora 发挥，Sora 便能自动把这些视频帧串联起来形成一段完整的视频；2）Remix：通过不同的文字描述对视频中的元素进行替换、删除或重构，比如可以把图书馆变成宇宙飞船；3）Re-cut：智能识别并剪切出视频中的最佳帧，并将其导入Storyboard 中，拓展该视频帧；4）Loop：用于创建无限循环的视频；5）Blend：将两个视频无缝合并为一个视频；6）Style presets：为视频预设风格，比如黑白电影、纸片人等。此外，借助Sora Turbo，新Sora 的视频生成速度显著提升，同时，新Sora 将视频生成方式扩展为文/文+图/文+视频生成视频。
　　今年以来，国内企业开始加速研发并迭代AI 视频生成产品，产品能力不断提升，应用场景持续拓宽。1）今年6 月，快手AI 团队发布可灵AI 视频生成大模型，可生成长达2 分钟、分辨率达1080p 的视频，可灵AI 主要功能包括文生视频、图生视频、视频续写等；2）今年7 月，智谱AI 上线视频生成产品智谱清影，并在11 月进行全新升级，支持生成时长为10 秒的4K超高清视频，除常规的文生视频和图生视频功能外，智谱清影引入CogSound模型，可以对为生成的视频添加背景音乐；3）今年8 月，字节推出即梦AI一站式创作平台，随后在11 月宣布即梦AI 两大视频模型S2.0 Pro 和P2.0 Pro正式全量上线，其中，S2.0 Pro 在图生视频场景具有较高的首帧一致性，能够保持视频与用户输入图像的色彩、风格等保持一致，P2.0 Pro 具有极高提示词遵循能力，能够在一句提示词内实现多个镜头切换及多镜头组合，同时保持视频内形象主体、风格和氛围的一致性。此外，Minimax、阿里云等初创企业及大模型厂商也在布局AI 视频生成赛道，整体来看，视频生成工具的能力不断提升，未来有望渗透更多应用场景。
　　投资建议：Sora 正式上线同时视频创作能力显著提升，开始从创作工具向生产力工具转变，随着以Sora 为代表的AI 视频生成工具持续迭代，未来其向多种应用场景的渗透有望加速。一方面，应用层我们建议重点关注创意、设计、教育等多模态特别是视频生成强相关的领域，相关标的包括万兴科技、美图公司、科大讯飞、海康威视、金山办公、虹软科技、焦点科技等；另一方面，视频生成模型对算力需求较文本显著提升，重点关注AI 算力相关标的，包括寒武纪、海光信息、景嘉微、浪潮信息、紫光股份、中科曙光、工业富联、云天励飞、云赛智联、优刻得、青云科技等。
　　风险提示：AI 技术发展不及预期，行业竞争加剧，下游需求不及预期。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：刘静 HZ010）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约