计算机行业点评:OPENAI有望推出多模态GPT模型

2023-09-20 12:45:04 和讯  国盛证券刘高畅
  OpenAI 有望推出多模态GPT 模型。9 月19 日,据The Information 报道,OpenAI 意图赶在谷歌推出多模态大语言模型Gemini 前广泛推出名为GPT-Vision 的多模态功能,此前OpenAI 在3 月份推出GPT-4 时展示了多模态功能,但并未向除了Be My Eyes 之外的公司提供,未来OpenAI 或许会推出一个更强大的多模态大模型,代号为Gobi。此前在5 月10 日的谷歌I/O 2023 大会谷歌就已宣布了下一代多模态基础模型Gemini 在训练中。我们认为AI 领军企业OpenAI 与科技巨头谷歌在多模态大模型上竞相提速彰显了多模态技术的重要性,并有利于推动多模态AI 尤其是基础模型取得进步,进一步推动多模态相关应用落地。
  多模态相关应用进展不断,打开广阔下游应用空间。7 月28 日谷歌deepmind 推出VLA 模型RT-2,基于视觉语言模型PaLM-E 和PaLI-X 的预训练,为机器人任务带来了显著更好的泛化性能。9 月13 日,Adobe 发布新的Firefly 生成式AI 模型和Web 应用程序,支持100 多种语言的文本提示,全面覆盖文生图、创意填充、文字渲染、重新着色、草图细化、3D 图像等多种创意功能。我们认为,当前多模态的输入输出主要是文本、图像,应用场景包括智能办公和各类AIGC 功能,1-5 年内,随着多模态GPT 的发展带来AI 泛化能力提升,通用视觉、通用机械臂、行业服务机器人、真正的智能家居等会进入生活。在5-10 年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,带来通用机器人等千行百业的广阔应用。
  应用增长及多模态数据处理复杂度提高催生算力需求。多模态模型需要处理的输入和输出信息将包括文本、图像、视频、音频等,复杂度远超纯文本数据,同时将不同模态的特征进行融合,找到不同模态间的内在关联和交互关系也需要更复杂的模型架构,这也增加了计算负载,要发挥多模态模型的优势,必须有强大的算力支持。同时多模态发展打开广阔下游应用空间,用户增长将让应用厂商在模型推理侧需要更多算力,进一步催生算力需求。
  建议关注:1)多模态AI:大华股份、海康威视、千方科技、中科创达、萤石网络、万兴科技、虹软科技、当虹科技等;2)算力:英伟达、浪潮信息、中际旭创、新易盛、工业富联、云赛智联、中科曙光、拓维信息、四川长虹、烽火通信、海光信息、恒润股份、寒武纪、易华录、神州数码、景嘉微、中贝通信等。
  风险提示:AI 技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读