社会服务行业：SORA&GENIE面世多模态推动人工智能迈向AGI

2024-03-01 11:30:08 和讯中航证券裴伊凡

　　事件: Sora&Genie相继发布，AIGC快速迭代。①Sora: 2024年2月16日，Open AI发布了文生视频模型Sora，首次由AI通过文本生成长达1分钟的多镜头长视频，全面展现了真实人类世界的高模拟度画面、精细的画质、多镜头拍摄、多角度运镜,除去文本，Sora还可以从静止图像中生成视频，并“扩展”现有视频，包括“填充缺失的帧”的能力。②Genie: 2月26日，谷歌发布110亿参数的基础世界模型,定义了生成式AI的全新范式--生成式交互环境(Genie, GenerativeInteractive Environments)，可以通过单张图像提示生成可玩的交互式环境，创造AI新玩法。
　　Sora引领文生视频浪潮，重塑AI视频业态。Sora的文生视频能力远超此前推出的Pika、Runway等，较同类工具,SOra土次优欢八扩充几十倍，且具备更高准确度、清晰度，构建一种新现实。一方面，Sora无论从文本到视频生成能力、多镜头生成能力等呈现的效果都展现了新高度，短视频、广告、游戏、动间、影优等1中队益;Sora的能力将斌能创作者，大福峰低视频内含土,消耗将大幅提升视频制作的效率和质量，视频制作的技术门槛和人力消耗将大幅降低;另一方面，为理解、重建和模拟现实世界提供了全新的可能性，图和视频的信息传递损耗远低于文字，能够用视频（模拟真实)的方式输出知识和内容，或将在更多领域实现颠覆式沉浸体验。
　　Genie构建交互新范式，有望高效赋能游戏/CG等产业发展。谷歌介绍，Genie专注2D平台游戏和机器人技术的视频，但方法通用，应适用于任何类型领域并可扩展至更大的互联网数据集。相比于Sora,Genie多了交互性，也就是在文/图基础上生成了可交互的世界，能够在一定程度上理解空间和物体之间的互动关系，将重点放在潜在动作预测上，为生成和进入虚拟世界提供了可能。
　　多模态模型能力跃进，拓宽AI应用边界。Sora/Genie等模型的推出实现AIGC突破式的进展，意味着模型对物理世界的理解和模拟愈加接近现实，是AGI实现的重要里程碑。在强大泛化能力基础上，多模态大模型从语音识别、图像生成、自然语言理解、视频分析，到机器翻译、知识图谱都能够提供更丰富、更智能、更人性化的服务和体验，实现在不同模态和场景之间实现知识的迁移和共享，应用场景和价值正在不断扩展和提升。
　　投资建议:未来在多模态模型的演进迭代之下，创作内容产业革命来临，一方面，视频素材、文字标注及合成数据是多模态模型训练的基础，有版权的视频内容有望实现价值兑现，拥有稀缺IP资源的公司具备核心价值;另一方面，AI多模态有望快速延伸至游戏、教育、营销、娱乐等领域，提升用户体验，加速科技价值变现。建议关注三条投资主线:①IP版权方向:【中文在线、掌阅科技、奥飞娱乐、上海电影、华策影视】;2AI+应用:游戏【掌趣科技、盛天网络、三七互娱、完美世界、汤姆猫】、教育【南方传媒、佳发教育、世纪天鸿】、营销【蓝色光标、焦点科技、易点天下、因赛集团】 ;③AI工具方向【[万兴科技、昆仑万维】。
　　风险提示:技术发展不及预期风险、政策变化风险、国内外宏观环境变化风险、市场拓展不及预期风险。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

看全文

写评论已有条评论跟帖用户自律公约

提交还可输入500字

社会服务行业：SORA&GENIE面世多模态推动人工智能迈向AGI

最新评论

相关推荐

热门阅读

和讯特稿

社会服务行业：SORA&GENIE面世 多模态推动人工智能迈向AGI

最新评论

相关推荐

热门阅读

和讯特稿

推荐阅读

社会服务行业：SORA&GENIE面世多模态推动人工智能迈向AGI