谷歌Gemini 1.0 发布,测试表现远超现有多模态大模型
12 月6 日,谷歌原生多模态大模型Gemini 1.0 版正式上线,针对不同任务,其分为Gemini Ultra,Gemini Pro 和Gemini Nano。该模型具有复杂多模态推理能力,可以帮助理解复杂的书面和视觉信息,还可以同时识别和理解文本、图像、音频等内容。在编码方面,其具备擅长解决超越编码的复杂数学和理论计算机科学的竞争性编程问题的代码生成系统AlphaCode2。不同于为不同模态训练独立组件后拼接的多模态模型创建方法,Gemini 1.0 先在不同模态上进行预训练,再用额外的多模态数据进行微调,以进一步提高其效果,这使得Gemini 可以从零开始无缝理解和推理不同类型的信息,表现远超现有的多模态模型。具体来看,Gemini Ultra 在MMLU(大规模多任务语言理解)测试中,以90.0%的高分首次超过人类专家;在包括跨领域多模态任务的MMMU(大规模多学科多模态理解)基准测试中,Gemini Ultra 取得了59.4%的高分,高于GPT-4V 的56.8%。我们认为,Gemini 1.0 是AI 技术在多模态领域取得里程碑式进展的重要标志,其将为相关AI 应用发展提供有力支持,促进应用产品丰富和应用场景拓展。
Pika 1.0 测评结果表现突出,进一步打开C 端市场
2023 年11 月29 日,美国AI 初创公司Pika Labs 发布其视频生成模型Pika 1.0,该模型具备使用文本生成和编辑多种风格视频的功能。 根据数字生命卡兹克的测评:1)在使用方面,Pika 1.0 相较于此前在Discord 社区的公测版更易用。视频比例和帧率、镜头控制和速度、负面提示词及提示词相关性都由原来的手动输入改进为了页面点击设置,并且视频扩展、区域修改、放大增强和视频延长4秒的功能在生成视频后的二次编辑窗口可直接点击使用。2)在生成视频的效果方面,Pika 1.0 模型的语义理解能力强,文生视频和图生视频的质量大幅提升,模型尤其擅长3D 和3D 动画风格。3)此外,视频扩展、区域修改、视频延长4 秒、一键增强功能也表现突出。我们认为,Pika 1.0 模型各项功能的突出表现将吸引更多的视频创作者了解并使用多模态大模型辅助创作,进一步打开C 端用户市场,扩大AI 大模型的商业化空间。
AI+视频新产品和新技术持续更新迭代,商业化价值有望提升
回顾近期受到市场关注的AI+视频产品的进展:1)2022 年7 月,诗云科技推出具备声音克隆、AI 数字人生成等功能的在线视频生成平台HeyGen。2)2023 年11 月3 日,Runaway 对视频生成模型Gen-2进行更新,提高生成视频的清晰度和一致性;11 月20 日上线运动笔刷功能,实现视频局部区域的由静转动。3)11 月16 日,Meta 发布基于扩散模型的文本/图像到视频的视频生成应用Emu Video。4)11月18 日,字节跳动发布高动态视频生成模型PixelDance。5)11 月21 日,Stability AI 推出由文本/图像到视频的Stable VideoDiffusion(SVD)开源视频生成模型。6)11 月28 日,Pika Labs 发布具备使用文本生成和编辑多种风格视频功能的视频生成模型Pika1.0。12 月8 日,Pika Research 首次对外披露的技术细节显示,基于DreamPropeller 方法,文本到3D 的生成速度可提升4.7 倍。我们认为,AI+视频领域正方兴未艾,新产品推出和技术迭代将持续推动该领域的发展。并且,过往由于AI 应用主要集中于B 端,商业化发展受到限制。随着多模态技术取得突破,C 端用户需求得到满足,AI 多模态有望进一步打开C 端市场,提升商业化价值。
投资建议:
我们认为,谷歌Gemini 1.0 发布标志着多模态领域取得里程碑式进展,产业趋势确定性进一步明确。在商业化方面,过往由于AI 应用主要集中于B 端,商业化发展受到限制。随着多模态新产品和新技术的持续迭代,Pika 在多模态领域取得突破,AIGC 有望在文娱行业拓展应用,进一步打开C 端市场,提升商业化价值。今年是AI 应用落地的元年,建议重视场景和用户的价值,推荐关注三条主线:1)大模型和AI Agents:昆仑万维;2)多模态:文字IP:中文在线、掌阅科技;形象IP:上海电影,奥飞娱乐;多模态赋能视频:华策影视,光线传媒;3)AI 应用:AI 社交产品:盛天网络;AI 教育:
皖新传媒,佳发教育;AI 校对:果麦文化;AI 游戏:恺英网络、三七互娱、吉比特、巨人网络、电魂网络、掌趣科技。
风险提示:
AI 技术发展不及预期风险;政策监管风险;行业竞争加剧风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论