阿里巴巴:Qwen3 登顶全球最强开源模型 性能卓越

2025-04-29 11:12:15 自选股写手 
新闻摘要
4 月 29 日阿里巴巴开源通义千问模型 Qwen3,性能超越顶尖模型,成本下降,功能强大且应用广泛。

【4 月 29 日凌晨,阿里巴巴开源新一代通义千问模型 Qwen3】 Qwen3 参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。 它是国内首个“混合推理模型”,将“快思考”与“慢思考”集成,对简单需求可低算力“秒回”,对复杂问题能“深度思考”,节省算力消耗。 热门模型中只有千问 3 等少数能做到“混合推理”,其设计和训练难度远超单纯推理模型。 Qwen3 采用混合专家架构,总参数量 235B,激活仅需 22B,预训练数据量达 36T,在多项评测中表现出色。 其部署成本大幅下降,提供丰富模型版本,为智能体和大模型应用爆发提供更好支持,原生支持 MCP 协议,具备工具调用能力。 阿里通义已开源 200 余个模型,全球下载量超 3 亿次,千问衍生模型数超 10 万个,成全球第一开源模型。

(责任编辑:张晓波 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读