社会服务行业:SORA&GENIE面世 多模态推动人工智能迈向AGI

2024-03-01 11:30:08 和讯  中航证券裴伊凡
  事件: Sora&Genie相继发布,AIGC快速迭代。①Sora: 2024年2月16日,Open AI发布了文生视频模型Sora,首次由AI通过文本生成长达1分钟的多镜头长视频,全面展现了真实人类世界的高模拟度画面、精细的画质、多镜头拍摄、多角度运镜,除去文本,Sora还可以从静止图像中生成视频,并“扩展”现有视频,包括“填充缺失的帧”的能力。②Genie: 2月26日,谷歌发布110亿参数的基础世界模型,定义了生成式AI的全新范式--生成式交互环境(Genie, GenerativeInteractive Environments),可以通过单张图像提示生成可玩的交互式环境,创造AI新玩法。
  Sora引领文生视频浪潮,重塑AI视频业态。Sora的文生视频能力远超此前推出的Pika、Runway等,较同类工具,SOra土次优欢八扩充几十倍,且具备更高准确度、清晰度,构建一种新现实。一方面,Sora无论从文本到视频生成能力、多镜头生成能力等呈现的效果都展现了新高度,短视频、广告、游戏、动间、影优等1中队益;Sora的能力将斌能创作者,大福峰低视频内含土,消耗将大幅提升视频制作的效率和质量,视频制作的技术门槛和人力消耗将大幅降低;另一方面,为理解、重建和模拟现实世界提供了全新的可能性,图和视频的信息传递损耗远低于文字,能够用视频(模拟真实)的方式输出知识和内容,或将在更多领域实现颠覆式沉浸体验。
  Genie构建交互新范式,有望高效赋能游戏/CG等产业发展。谷歌介绍,Genie专注2D平台游戏和机器人技术的视频,但方法通用,应适用于任何类型领域并可扩展至更大的互联网数据集。相比于Sora,Genie多了交互性,也就是在文/图基础上生成了可交互的世界,能够在一定程度上理解空间和物体之间的互动关系,将重点放在潜在动作预测上,为生成和进入虚拟世界提供了可能。
  多模态模型能力跃进,拓宽AI应用边界。Sora/Genie等模型的推出实现AIGC突破式的进展,意味着模型对物理世界的理解和模拟愈加接近现实,是AGI实现的重要里程碑。在强大泛化能力基础上,多模态大模型从语音识别、图像生成、自然语言理解、视频分析,到机器翻译、知识图谱都能够提供更丰富、更智能、更人性化的服务和体验,实现在不同模态和场景之间实现知识的迁移和共享,应用场景和价值正在不断扩展和提升。
  投资建议:未来在多模态模型的演进迭代之下,创作内容产业革命来临,一方面,视频素材、文字标注及合成数据是多模态模型训练的基础,有版权的视频内容有望实现价值兑现,拥有稀缺IP资源的公司具备核心价值;另一方面,AI多模态有望快速延伸至游戏、教育、营销、娱乐等领域,提升用户体验,加速科技价值变现。建议关注三条投资主线:①IP版权方向:【中文在线、掌阅科技、奥飞娱乐、上海电影、华策影视】;2AI+应用:游戏【掌趣科技、盛天网络、三七互娱、完美世界、汤姆猫】、教育【南方传媒、佳发教育、世纪天鸿】、营销【蓝色光标、焦点科技、易点天下、因赛集团】 ;③AI工具方向【[万兴科技、昆仑万维】。
  风险提示:技术发展不及预期风险、政策变化风险、国内外宏观环境变化风险、市场拓展不及预期风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读