AI+专题系列(十八)：OPENAI发布GPT-4O：AI应用或加速落地

2024-05-17 12:45:03 和讯华创证券吴鸣远

　　事项：
　　2024 年5 月14 日，OpenAI 发布了新一代生成模型 GPT-4o 及其桌面应用程序。GPT-4o（“o”代表“omni”）是 OpenAI 最新的旗舰型号，不仅具备与 GPT-4 同等的强大模型能力，还大幅提升了推理速度。GPT-4o 能够同时理解和处理文本、图像、音频等多种内容，展现了卓越的多模态能力。这一突破性进展将进一步推动自然语言处理和人工智能领域的发展，使人机交互更加高效和自然。OpenAI 的最新发布标志着人工智能技术的又一里程碑，有望在更多实际应用中展现其强大功能。
　　评论：
　　多模态模型显著降低延迟，实现即时语音对话：GPT-4o 多模态能力大幅提升，能够跨文本、音频和视频进行实时推理。使用语音模式与ChatGPT 对话当中，GPT-3.5 与 GPT-4 平均延迟分别为 2.8s、5.4s，而 GPT-4o 对音频输入的响应时间最短为 232 毫秒，平均为 320 毫秒，这与人类在对话中的响应时间相当。GPT-4o 运行速度大大提升，推动了更加自然的人机交互。
　　视觉与音频理解能力提升，交互能力更上一层楼：GPT-4o 为用户提供更自然、准确的交互体验。模型具有情感感知能力，能够生成不同情绪风格的语言交互，包括声情并茂的讲情感故事、实时视频对话、实时音频翻译等。此外，用户可以随时打断模型，不需要等到其结束才能开始说话，更加符合人类交互逻辑。
　　API 调用成本降低，凸显性价比优势：API 的性价比显著提升。与 GPT-4 Turbo相比，GPT-4o 的速度提升了两倍，成本则减少了 50%，并且速率限制提高了五倍。
　　GPT-4o 刷新SOTA，性能表现卓越：在传统基准测试中，GPT-4o 在文本、推理和编码智能方面，达到了GPT-4 Turbo 级别的性能，同时在多语言、音频和视觉能力方面创下了新高。在文本评估中，GPT-4o 几乎碾压一众模型，包括Claude 3 Opus，Gemini Pro 1.5，甚至是Llama 3 400B。GPT-4o 在零样本的COTMMLU（常识问题）上创造了88.7%的新高分。与传统的5 个样本，没有使用COT 的MMLU 评测中，GPT-4o 更是创下了87.2%的新高分。
　　投资建议：AI 大模型本质应落脚垂类应用，国内大模型正快速追赶美国先进水平，中文大模型的突破有望为下游AI 应用注入新的活力，看好AI+应用产品力与商业化落地进程。建议关注以下标的：AI+应用侧：1）安全：永信至诚、深信服；2）办公：金山办公、福昕软件；3）法律：金桥信息、华宇软件、通达海；4）医疗：润达医疗；5）教育：佳发教育、欧玛软件、新开普；6）金融：同花顺、新致软件；7）邮箱：彩讯股份；8）传媒：掌阅科技、华策影视；9）数据：海天瑞声；10）电商：焦点科技；11）OA：致远互联、泛微网络；12）ERP：用友网络、金蝶国际。算力侧：1）算力基础：润泽科技、亚康股份、海光信息、寒武纪、龙芯中科；2）服务器：中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。
　　风险提示：商业化后表现不及预期，用户付费意愿低，行业技术迭代速度较快。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

看全文

写评论已有条评论跟帖用户自律公约