投资要点:
DeepSeek-V3 模型更新,各项能力全面进阶
据DeepSeek 官微,3 月25 日,DeepSeek V3 模型已完成小版本升级,目前版本号DeepSeek-V3-0324,DeepSeek-V3-0324 与之前的DeepSeek-V3 使用同样的base 模型,仅改进了后训练方法。私有化部署时只需要更新checkpoint 和tokenizer_config.json(tool calls 相关变动)。模型参数约660B,开源版本上下文长度为128K(网页端、App 和API 提供64K 上下文)。
通义千问Qwen2.5-Omni-7B 正式开源,展现全模态优异性能据阿里云开发者官微,3 月27 日,通义千问Qwen2.5-Omni-7B 正式开源。作为通义系列模型中首个端到端全模态大模型,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。Qwen2.5-Omni 以接近人类的多感官方式「立体」认知世界并与之实时交互,还能通过音视频识别情绪,在复杂任务中进行更智能、更自然的反馈与决策。目前, 开发者和企业可免费下载商用Qwen2.5-Omni,手机等终端智能硬件也可轻松部署运行。
谷歌发布“最先进复杂任务模型”Gemini 2.5 Pro,支持原生多模态据量子位,3 月26 日,赶在OpenAI 直播之前,谷歌发布Gemini 2.5Pro。谷歌介绍,相较于Gemini 2.0 Flash Thinking 这个谷歌首个推理模型,Gemini 2.5 在基础模型和后训练技术上都有改进。不仅是在大模型竞技场上一举拿下高分,在各种推理、数学、科学、编程基准上,Gemini2.5 Pro 都表现出色,属于是编程能跟Claude 3.7 Sonnet 掰手腕,数学能跟Grok 3 相媲美。
OpenAI 放出GPT-4o 原生多模态图像生成功能据InfoQ,3 月26 日,OpenAI 发布了GPT-4o image generation,图像生成技术模型。此初始版本仅专注于图像创建,并将在ChatGPTPlus、Pro、Team 和Free 订阅层中提供。值得注意的是价格,OpenAI声称与GPT-4 Turbo 相比,价格降低了50%。更直观的对比是,GPT-4o 成本恰好是10 倍GPT-3.5;4o 是5 美元/ 百万输入token和15 美元/ 百万输出token。3.5 是0.50 美元/ 百万输入token和1.50 美元/ 百万输出token。价格下降尤其引人注目,因为OpenAI 承诺也将向免费ChatGPT 用户提供该模型——这是他们第一次直接向非付费客户提供“最佳”模型。
风险提示
市场需求不及预期,人工智能技术发展不及预期,政策发布不及预期,大模型商业落地不及预期的风险等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:贺翀 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论