计算机行业定期报告：大模型硝烟再起 DEEPSEEK、通义千问、GOOGLE、OPENAI先后迎来更新

2025-03-30 16:20:04 和讯华福证券钱劲宇

投资要点：
DeepSeek-V3 模型更新，各项能力全面进阶
据DeepSeek 官微，3 月25 日，DeepSeek V3 模型已完成小版本升级，目前版本号DeepSeek-V3-0324，DeepSeek-V3-0324 与之前的DeepSeek-V3 使用同样的base 模型，仅改进了后训练方法。私有化部署时只需要更新checkpoint 和tokenizer_config.json（tool calls 相关变动）。模型参数约660B，开源版本上下文长度为128K（网页端、App 和API 提供64K 上下文）。
通义千问Qwen2.5-Omni-7B 正式开源，展现全模态优异性能据阿里云开发者官微，3 月27 日，通义千问Qwen2.5-Omni-7B 正式开源。作为通义系列模型中首个端到端全模态大模型，可同时处理文本、图像、音频和视频等多种输入，并实时生成文本与自然语音合成输出。Qwen2.5-Omni 以接近人类的多感官方式「立体」认知世界并与之实时交互，还能通过音视频识别情绪，在复杂任务中进行更智能、更自然的反馈与决策。目前，开发者和企业可免费下载商用Qwen2.5-Omni，手机等终端智能硬件也可轻松部署运行。
谷歌发布“最先进复杂任务模型”Gemini 2.5 Pro，支持原生多模态据量子位，3 月26 日，赶在OpenAI 直播之前，谷歌发布Gemini 2.5Pro。谷歌介绍，相较于Gemini 2.0 Flash Thinking 这个谷歌首个推理模型，Gemini 2.5 在基础模型和后训练技术上都有改进。不仅是在大模型竞技场上一举拿下高分，在各种推理、数学、科学、编程基准上，Gemini2.5 Pro 都表现出色，属于是编程能跟Claude 3.7 Sonnet 掰手腕，数学能跟Grok 3 相媲美。
OpenAI 放出GPT-4o 原生多模态图像生成功能据InfoQ，3 月26 日，OpenAI 发布了GPT-4o image generation，图像生成技术模型。此初始版本仅专注于图像创建，并将在ChatGPTPlus、Pro、Team 和Free 订阅层中提供。值得注意的是价格，OpenAI声称与GPT-4 Turbo 相比，价格降低了50%。更直观的对比是，GPT-4o 成本恰好是10 倍GPT-3.5；4o 是5 美元/ 百万输入token和15 美元/ 百万输出token。3.5 是0.50 美元/ 百万输入token和1.50 美元/ 百万输出token。价格下降尤其引人注目，因为OpenAI 承诺也将向免费ChatGPT 用户提供该模型——这是他们第一次直接向非付费客户提供“最佳”模型。
风险提示
市场需求不及预期，人工智能技术发展不及预期，政策发布不及预期，大模型商业落地不及预期的风险等。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：贺翀）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

【广告】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约