传媒行业:多模态GPT-4O发布 情感理解&低延迟大幅提升易用性

2024-05-14 19:00:07 和讯  广发证券旷实/叶敏婷
  核心观点:
  事件:根据OpenAI 官网,OpenAI 发布多模态模型GPT-4o 及桌面版GPT 和ChatGPT 新UI。GPT-4o 是一个端到端的多模态模型,模型能力提升方面,GPT-4o 在非英文文本(支持50 种语言)、视觉和音频理解上显著提升。目前其文本和图像能力已在ChatGPT 中推出,用户可以免费使用,在未来几周内,将在ChatGPT Plus 中推出带有GPT-4o 的语音模式新版本。成本方面,在API 上GPT-4o 相比GPT-4Turbo 速度提高了2 倍、成本降低了一半。关注GPT-4o 核心亮点:(1)多模态能力,实现文本/音频/图像的组合输入&输出,音视频能力显著提升。(2)理解能力突出,能够识别人类感情并“有感情”地反应。
  并且用户可以打断模型,更贴近真实人类对话场景。(3)低延迟、实时性:音频输入的响应时间最短仅需232 毫秒,平均320 毫秒,做到了与人类对话的响应速度一致。
  应用层面,GPT-4o 的发布,大幅提升了大模型的易用性,将AI 助手更自然融入办公/学习场景并优化,提升办公效率和任务执行度,同时其对人类情感的理解和反应能力也将对AI 情感陪伴、AI 社交等赛道带来新的想象空间。根据演示,GPT-4o 在桌面系统内可以利用视觉能力识别屏幕中的代码、PDF 等,并进行相应的提示或总结;在手机系统内,可以在对话中识别语音中的情绪,通过视频理解人的表情,并自然地做出贴合场景对话的情绪变化,更“人性化”。
  投资建议:我们认为,GPT-4o 突破了此前大模型在人机交互中的诸多瓶颈,大幅提升了大模型的易用性,为AI 应用带来了更多可能性,成本进一步降低,或将加速AI 应用的繁荣。GPT-4o 的能力提升对效率向和娱乐向产品都有望带来产品功能和形态的突破,效率向方面,关注AI 办公产品的能力升级、端侧AI 智能助手的突破;娱乐向方面,关注AI 情感陪伴、AI 社交等产品的“人格化”和情感属性增强后,用户体验的大幅提升。持续关注AI 对游戏、营销、教育、影视等行业的赋能。建议关注:(1)游戏:有望进一步将游戏内容精品化,提升优质游戏产能,关注腾讯控股、网易-S、三七互娱、恺英网络、完美世界、神州泰岳、巨人网络、盛天网络、姚记科技、吉比特、电魂网络、游族网络等。(2)营销:提升广告内容的生成效率和效果,关注有AI 工具产品布局的蓝色光标、易点天下、分众传媒等。(3)教育:
  GPT-4o 在知识理解与问答上展现出优异能力,可以通过视觉能力识别并理解代码、数学题等,在教育领域有诸多应用可能,关注佳发教育、视源股份、世纪天鸿、南方传媒等。(4)影视:有望助力影视行业工业化&精品化,关注华策影视、博纳影业、光线传媒、柠萌影视等。
  风险提示:模型迭代效果不及预期、商业化不及预期、内容伦理风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读