事项:
2024 年5 月14 日,OpenAI 发布了新一代生成模型 GPT-4o 及其桌面应用程序。GPT-4o(“o”代表“omni”)是 OpenAI 最新的旗舰型号,不仅具备与 GPT-4 同等的强大模型能力,还大幅提升了推理速度。GPT-4o 能够同时理解和处理文本、图像、音频等多种内容,展现了卓越的多模态能力。这一突破性进展将进一步推动自然语言处理和人工智能领域的发展,使人机交互更加高效和自然。OpenAI 的最新发布标志着人工智能技术的又一里程碑,有望在更多实际应用中展现其强大功能。
评论:
多模态模型显著降低延迟,实现即时语音对话:GPT-4o 多模态能力大幅提升,能够跨文本、音频和视频进行实时推理。使用语音模式与ChatGPT 对话当中,GPT-3.5 与 GPT-4 平均延迟分别为 2.8s、5.4s,而 GPT-4o 对音频输入的响应时间最短为 232 毫秒,平均为 320 毫秒,这与人类在对话中的响应时间相当。GPT-4o 运行速度大大提升,推动了更加自然的人机交互。
视觉与音频理解能力提升,交互能力更上一层楼:GPT-4o 为用户提供更自然、准确的交互体验。模型具有情感感知能力,能够生成不同情绪风格的语言交互,包括声情并茂的讲情感故事、实时视频对话、实时音频翻译等。此外,用户可以随时打断模型,不需要等到其结束才能开始说话,更加符合人类交互逻辑。
API 调用成本降低,凸显性价比优势:API 的性价比显著提升。与 GPT-4 Turbo相比,GPT-4o 的速度提升了两倍,成本则减少了 50%,并且速率限制提高了五倍。
GPT-4o 刷新SOTA,性能表现卓越:在传统基准测试中,GPT-4o 在文本、推理和编码智能方面,达到了GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉能力方面创下了新高。在文本评估中,GPT-4o 几乎碾压一众模型,包括Claude 3 Opus,Gemini Pro 1.5,甚至是Llama 3 400B。GPT-4o 在零样本的COTMMLU(常识问题)上创造了88.7%的新高分。与传统的5 个样本,没有使用COT 的MMLU 评测中,GPT-4o 更是创下了87.2%的新高分。
投资建议:AI 大模型本质应落脚垂类应用,国内大模型正快速追赶美国先进水平,中文大模型的突破有望为下游AI 应用注入新的活力,看好AI+应用产品力与商业化落地进程。建议关注以下标的:AI+应用侧:1)安全:永信至诚、深信服;2)办公:金山办公、福昕软件;3)法律:金桥信息、华宇软件、通达海;4)医疗:润达医疗;5)教育:佳发教育、欧玛软件、新开普;6)金融:同花顺、新致软件;7)邮箱:彩讯股份;8)传媒:掌阅科技、华策影视;9)数据:海天瑞声;10)电商:焦点科技;11)OA:致远互联、泛微网络;12)ERP:用友网络、金蝶国际。算力侧:1)算力基础:润泽科技、亚康股份、海光信息、寒武纪、龙芯中科;2)服务器:中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。
风险提示:商业化后表现不及预期,用户付费意愿低,行业技术迭代速度较快。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论