投资要点
事件:2 月16 日凌晨,OpenAI 发布旗下首个AI 视频生成模型——Sora 模型,Sora 人工智能模型能够通过文本提示,生成逼真且富有想象力的视频。
事件分析:
1、Open AI 首个文生视频模型发布,效果震撼。Sora 可以直接输出长达60 秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48 个视频demo,在这些demo 中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型甚至还可以根据提示、静止图像填补现有视频中的缺失帧来生成视频。Sora 模型能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景。该模型不仅能理解用户在提示中所要求的内容,还能理解这些事物在现实世界中的存在方式。该模型对语言有深刻理解,能准确解读提示,并生成表达丰富情感的引人入胜的角色。Sora 还能在单个生成的视频中创建多个镜头,使角色和视觉风格保持准确一致。
2、Sora 实现多维度突破,模型带来无限可能。Sora 模型是在DALL·E 和GPT的研究基础上进一步发展。它利用了DALL·E 3 的重新标注技术,为视觉训练数据生成高度描述性的说明文字,借鉴了GPT 模型的成功,采用了Transformer 架构,实现了前所未有的扩展性能。Sora 模型出众点在三方面:
1、技术领先,Sora 与ChatGPT 一样是有理解能力的,它可以感知真实的物理世界和自然语言。2、大幅降低短视频制作成本。只需一个简单的提示词,就能生成一段制作精良的60 秒视频。还支持使用图片或视频片段进行扩展,生成全新的视频。同时也支持将两个视频合并整合成一个新的视频。3、生成4K 高清图片。Sora 还能够生成图像,分辨率高达2048x2048。但同样,目前Sora 模型也有不足点,难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系,还可能混淆提示词的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
3、多模态模型迭代节奏加快,算力通信大宽带受益。当前,AI 算力及基础设施投入加速,2 月9 日,OpenAI 创始人Sam Altman 与包括阿联酋政府在内的潜在投资者进行谈判,计划筹集5 万亿至7 万亿美元,推进提升全球芯片制造能力的AI 芯片项目; 2 月13 日,英伟达计划进军ASIC 定制芯片领域,同时推出ChatWithRTX 本地部署AI 大模型;2 月16 日,谷歌发布新一代AI 大模型Gemini 1.5,自2023 年12 月发布Gemini 1.0 后迭代速度进一步加快,其最大亮点在于首次采用多模态通用模型Gemini 1.5 Pro,将稳定处理上下文的上限扩大至100 万tokens;算力包括单体GPU 的性能和群体数 据中心的性能,算力的提升需要大带宽的支撑。面向单体GPU,通信带宽越大,GPU 之间的数据交换速度越快,模型也就能更快地训练出来;面向数据中心,低延迟、高带宽以及可扩展性来满足大规模计算和数据传输的需求,需要不断的升级架构、采用先进的协议以支持更大的接口带宽。我们认为,随着模型应用端的爆发以及新型算力的涌现,不仅将加速硬件尤其网络端设备的升级更新,甚至会驱动如LPO\CPO 等新型光模块等网络设备的落地。
建议关注标的:
1) 算力基础设施:中兴通讯、紫光股份、神州数码、拓维信息、工业富联、浪潮信息、菲菱科思、共进股份;
2) 算力连接:中际旭创、光迅科技、华工科技、天孚通信、源杰科技、博创科技、新易盛;
3) 算力供给:润泽科技、首都在线、数据港、宝信软件、奥飞数据;4) 算力云:首都在线、优刻得、青云科技、云赛智联;5) 算力可视化及运维:恒为科技、亚康股份、新炬网络;6) 算力液冷:英维克、佳力图、申菱环境;
7) 算力服务:润建股份、亚康股份。
风险提示:受客观因素影响建设进度不及预期;各地政策落实缓慢;行业转型进度不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论