计算机:OPENAI发布GPT行业点评:4O 人机交互能力大幅跃升

2024-05-17 11:25:06 和讯  国都证券王树宝
一、事件:
5 月14 日,OpenAI 举办了线上“春季更新”活动,发布最新多模态大模型“GPT-4o”,支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出,多模态能力大幅提升。同时,OpenAI 表示GPT-4o 的文本和图像功能今天开始免费在ChatGPT 中推出,并向Plus用户提供高达5 倍的消息上限。
二、点评:
此次OpenAI 春季发布会主要包括以下要点:
(1)新的 GPT-4o 模型:OpenAI 通过跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经网络处理,这意味着GPT-4o 打通了任何文本、音频和图像的输入,相互之间可以直接生成,无需在此前多个模型中间转换。
(2)语音延迟大幅降低:GPT-4o 能在232 毫秒内回应音频输入,平均为320 毫秒,这与对话中人类的响应时间相似。此前ChatGPT 的平均延迟为2.8 秒(GPT-3.5)和5.4 秒(GPT-4)。
(3)惊艳的实时语音助手演示:对话更像人、能实时翻译,识别表情,可以通过摄像头识别画面写代码分析图表。
(4)GPT-4o 向所有用户免费开放(有使用上限),Plus 用户的消息限额将比免费用户高出5 倍。同时,GPT-4o 速度是GPT-4 Turbo 的2 倍,API 成本低50%,速率限制高5 倍。
(5)一个新的ChatGPT 桌面应用程序:用户可以直接在应用程序中截图或通过语音于ChatGPT 进行讨论。目前适用于macOS,Windows 版本今年晚些时候推出。
整体来看,GPT-4o 人机交互能力及体验实现大幅提升优化。AI 大模型技术持续升级迭代,应用场景不断拓宽,有望拉动AI PC、AI 手机、智能硬件等产业链需求,同时建议关注海外映射AI 应用类企业及AI 算力产业链。重点公司:金山办公、科大讯飞、万兴科技、中科曙光、浪潮信息。
风险提示:技术发展不及预期、下游需求不及预期、行业竞争加剧等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读