事件:北京时间2 月16 日凌晨,OpenAI 发布了首个文生视频模型Sora,可以用文字指令生成长达60 秒的高清流畅视频,在生成视频长度、连贯性、多镜头切换方面具备显著优势。
Sora 基于DALL-E 与GPT 框架,AGI(通用人工智能)迎来里程碑。我们认为,简单来说,Sora 继承并结合OpenAI 的DALL-E 与GPT 模型而打造的强大文生视频模型:1)基于DALL-E 3 Diffusion 架构:Sora 与DALL-E 一样采用扩散型架构,即将一个随机噪声通过去噪过程来生成视频; 2)基于GPTTransformer 架构:Sora 同样采用Transformer 架构,与GPT 通用语言大模型将文本转换为可被理解的Token 类似,Sora 将视频转换成一系列Patch(视觉编码块)并将其进行降维,用Patch 作为视觉图像统一表现形式。Sora 达到理解世界运动与物理运动,已经初具模拟真实世界与物理运动能力,这将是人类迈向AGI 的关键一步。
文生视频技术史诗级突破,元宇宙或迎“第二春”。Sora 可以将简短文本描述转换成一分钟流畅视频,相对于Runway、Pika、Stable Video 等提升了几个代级,1)视频长度相对传统视频生成工具提升15-20 倍;2)视频质量、清晰度更高;3)可实现多镜头切换;4)连贯性与稳定性更好;5)支持多种数据格式输入,具备实现文生视频、图生视频、视频扩展能力。我们认为,Sora是“数据驱动的物理引擎”,将在元宇宙发展进程中起到关键性作用,并将推动元宇宙进入下一阶段,一方面,Sora 能根据需求打造虚拟空间,快速搭建元宇宙虚拟场景;另一方面,Sora 可以通过模拟世界及物理运动进一步探索虚拟时空。
推升算力基础设施需求,重点关注推理侧算力及通信端。我们认为,Sora 强大的文生视频能力将快速推进应用端商业化落地、拉动产业规模,进而传导到上游算力基础设施,算力基础设施需求将再次迎来爆发。目前OpenAI 已加入算力芯片军备竞赛中,根据OpenAI 论文,推理阶段算力需求是模型参数数量与训练数据集规模乘积的2 倍,Sora 将推动推理端算力占比将大幅提升。此外,通信端等配套实施需要全方位升级,网络上行下载速度需大幅提升以应对大量推理端传输需求,800G、1.6T 光模块有望持续放量。
投资建议:Sora 是人工智能发展进程中的“里程碑”,预示AGI 将加速到来,未来千行百业将颠覆式变革,建议重点关注国内上市公司:1、国内多模态大模型:科大讯飞、海康威视、大华股份;2、算力基础设施:工业富联、中科曙光、软通动力、神州数码、曙光数创、润泽科技、拓维信息;3、AI 应用端:
万兴科技、金山办公、彩讯股份、拓尔思、卫宁健康、嘉和美康等。
风险提示:技术研发进度不及预期风险; 供应链风险; 政策推进不及预期风险;消费需求不及预期风险;行业竞争加剧风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论