计算机行业点评：SORA惊艳发布文生视频跨越式突破

2024-02-18 10:30:06 和讯国盛证券刘高畅

　　OpenAI 发布Sora 模型，1 分钟文生视频效果惊艳。2 月15 日，OpenAI 发布文生视频模型Sora，展示出许多亮点：1）视频生成长度可达1 分钟，远超其他文生视频模型。2）3D 空间的一致性，Sora 可以生成具有动态镜头运动的视频，随着摄像机的移动和旋转，人物和场景元素在三维空间中保持连贯运动。3）长期连续性和物体持久性。可以在单个视频中生成同一物体的多个镜头，一个主题即使暂时离开视野也能保持不变。4）能够向前后扩展视频，以及连接两个视频。5）模拟数字世界，Sora 能够模拟人工操作，例如控制Minecraft 游戏中的玩家。我们认为Sora 相比此前其他文生视频模型，已经跨越到实用生产力工具，1 分钟长度有望大规模应用在短视频领域，扩展视频的能力也有望制作长视频，或将带来新一轮内容创作产业革命。
　　AIGC 应用空间广阔，算力需求或呈量级提升。Sora 是一种扩散模型，与GPT 模型类似，Sora 使用transformer 架构，将视频和图像表示为称为Patch 的较小数据单元的集合，类似于GPT 中的token。Sora 建立在OpenAI 在Dall E 和GPT 模型的基础上。目前Sora 暂未对外开放使用，仅OpenAI CEO Sam Altman 在X 平台上与评论互动生成视频，我们认为算力的限制可能是目前Sora 暂未开放使用的重要因素。随着AIGC技术在影视剧集、宣传视频、自媒体、游戏等领域逐步渗透，视频创作效率或迎来显著提升，同时视频相对于文字、图像的交互数据量级将有巨大提升，或对应算力需求的高速扩张。
　　谷歌发布Gemini1.5 Pro，上下文长度达百万token。2 月15 日，谷歌推出Gemini 1.5 Pro，支持长达100 万个token，远超当前其他基础模型，可以一次性处理大量信息，如1 小时的视频、11 小时的音频、超过3 万行代码或超过70 万个单词。Gemini 1.5 Pro 是一个中型大小的多模态模型，相同基准测试下其性能与此前谷歌最大的Gemini-1.0 Ultra 相似，即使上下文窗口增加，Gemini1.5 Pro 也能保持高水平的性能。我们认为，谷歌Gemini1.5 的推出进一步促进了大模型技术的良性竞争，产业发展趋势欣欣向荣。
　　投资建议：
　　算力侧：中科曙光、浪潮信息、海光信息、利通电子、新易盛、高新发展、中际旭创、工业富联、寒武纪、神州数码、恒为科技、软通动力、润建股份、万马科技、云赛智联、拓维信息、烽火通信等。
　　映射应用：万兴科技、紫天科技、虹软科技、大华股份、海康威视。
　　风险提示：技术迭代不及预期、经济下行超预期、行业竞争加剧。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

看全文

写评论已有条评论跟帖用户自律公约

提交还可输入500字

计算机行业点评：SORA惊艳发布文生视频跨越式突破

最新评论

相关推荐

热门阅读

和讯特稿

计算机行业点评：SORA惊艳发布 文生视频跨越式突破

最新评论

相关推荐

热门阅读

和讯特稿

推荐阅读

计算机行业点评：SORA惊艳发布文生视频跨越式突破