OpenAI 发布Sora 模型,1 分钟文生视频效果惊艳。2 月15 日,OpenAI 发布文生视频模型Sora,展示出许多亮点:1)视频生成长度可达1 分钟,远超其他文生视频模型。2)3D 空间的一致性,Sora 可以生成具有动态镜头运动的视频,随着摄像机的移动和旋转,人物和场景元素在三维空间中保持连贯运动。3)长期连续性和物体持久性。可以在单个视频中生成同一物体的多个镜头,一个主题即使暂时离开视野也能保持不变。4)能够向前后扩展视频,以及连接两个视频。5)模拟数字世界,Sora 能够模拟人工操作,例如控制Minecraft 游戏中的玩家。我们认为Sora 相比此前其他文生视频模型,已经跨越到实用生产力工具,1 分钟长度有望大规模应用在短视频领域,扩展视频的能力也有望制作长视频,或将带来新一轮内容创作产业革命。
AIGC 应用空间广阔,算力需求或呈量级提升。Sora 是一种扩散模型,与GPT 模型类似,Sora 使用transformer 架构,将视频和图像表示为称为Patch 的较小数据单元的集合,类似于GPT 中的token。Sora 建立在OpenAI 在Dall E 和GPT 模型的基础上。目前Sora 暂未对外开放使用,仅OpenAI CEO Sam Altman 在X 平台上与评论互动生成视频,我们认为算力的限制可能是目前Sora 暂未开放使用的重要因素。随着AIGC技术在影视剧集、宣传视频、自媒体、游戏等领域逐步渗透,视频创作效率或迎来显著提升,同时视频相对于文字、图像的交互数据量级将有巨大提升,或对应算力需求的高速扩张。
谷歌发布Gemini1.5 Pro,上下文长度达百万token。2 月15 日,谷歌推出Gemini 1.5 Pro,支持长达100 万个token,远超当前其他基础模型,可以一次性处理大量信息,如1 小时的视频、11 小时的音频、超过3 万行代码或超过70 万个单词。Gemini 1.5 Pro 是一个中型大小的多模态模型,相同基准测试下其性能与此前谷歌最大的Gemini-1.0 Ultra 相似,即使上下文窗口增加,Gemini1.5 Pro 也能保持高水平的性能。我们认为,谷歌Gemini1.5 的推出进一步促进了大模型技术的良性竞争,产业发展趋势欣欣向荣。
投资建议:
算力侧:中科曙光、浪潮信息、海光信息、利通电子、新易盛、高新发展、中际旭创、工业富联、寒武纪、神州数码、恒为科技、软通动力、润建股份、万马科技、云赛智联、拓维信息、烽火通信等。
映射应用:万兴科技、紫天科技、虹软科技、大华股份、海康威视。
风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论