传媒互联网周报:OPENAI发布GPT-4O生图功能 DEEPSEEK-V3完成版本升级

2025-03-30 18:55:03 和讯  太平洋证券郑磊
OpenAI GPT-4o 生图功能发布,Agents SDK 支持MCP 协议OpenAI 发布GPT-4o 原生生图功能。不同于传统图像生成的自回归技术,逐步生成图像的每个像素或部分来构建图像,GPT-4o 生图采用非自回归技术,直接生成整个图像,这使得模型能够一次性理解和处理图像的整体结构和细节,实现细节和一致性的提升。从生成实例来看,GPT-4o 生图具备通过多轮对话逐步完善图像并保持多次生成的一致性、准确将文字嵌入图像、多样化风格适应等功能。目前,GPT-4o 可在ChatGPT 中直接生成图像。此外,OpenAI 对开发者工具箱Agents SDK 进行重大更新,支持MCP 服务协议,为大模型连接不同的数据源和工具提供了标准化的方法。开发者可直接通过MCP 协议调取各种外部的数据和工具,降低为Agent 接入新工具和服务的开发难度和集成成本。
DeepSeek-V3 完成版本升级,阿里开源Qwen-2.5 系列模型DeepSeek 完成小版本升级,最新版本号DeepSeek-V3-0324。该版本与DeepSeek-V3 使用相同的基础模型,通过改进后训练方法实现性能提升。具体来看:1)推理能力提高:在数学、代码类测评得分超过GPT-4.5;2)前端开发能力增强:生成代码的可用性更高、视觉效果更美观;3)中文写作升级:基于R1 的写作水平优化,同时提升中长篇文本创作的内容质量;4)中文搜索能力优化:报告生成类指令输出的内容更详实准确、排版更清晰美观;5)工具调用、角色扮演、问答闲聊等亦实现能力提升。此外,阿里开源Qwen2.5-VL-32BInstruct以及全模态大模型Qwen2.5-Omni-7B。其中,Qwen2.5-VL-32B 在强化学习的框架下实现性能优化,回复更符合人类主观偏好、数学推理能力提升、在图像解析以及视觉逻辑推导等任务中表现出更强的准确性和细粒度分析能力。
核心观点
我们认为,近期OpenAI 发布GPT-4o 生图模型、开发者工具箱AgentsSDK 支持MCP 协议表明目前海外厂商不仅关注于底层模型的性能提升,同时亦开始推动模型与应用场景的深度结合,如GPT-4o 生图有望助力设计、广告等场景的创意实现,支持MCP 协议有望降低Agent的开发难度和集成成本。而国内厂商仍主要集中于利用强化学习的工程优化红利,持续推进大模型性能迭代。
风险提示
AI 技术发展不及预期、政策监管、行业竞争加剧的风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王治强 HF013)

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读