通义千问Qwen3-VL家族新增2B、32B模型 全线覆盖视觉语言理解场景

2025-10-22 15:12:12 智通财经 
新闻摘要
智通财经APP获悉,10月22日,阿里巴巴-W旗下通义千问团队宣布,Qwen3-VL家族再扩列,新增2B与32B两个密集模型尺寸,从轻量级到甜品级,全线覆盖视觉语言理解场景。截至目前,Qwen3-VL共开源四款Dense模型以及两款MoE模型。通义千问表示,每个模型都提供两种版本 Instruct版本响应更快、执行更稳,适合对话与工具调用;Thinking版本强化长链推理与复杂视觉理解,能“看图思考”,应对高难任务更出色

智通财经APP获悉,10月22日,阿里巴巴-W(09988)旗下通义千问团队宣布,Qwen3-VL家族再扩列,新增2B与32B两个密集(Dense)模型尺寸,从轻量级到甜品级,全线覆盖视觉语言理解场景。截至目前,Qwen3-VL共开源四款Dense模型以及两款MoE模型。

通义千问表示,每个模型都提供两种版本:Instruct 版本响应更快、执行更稳,适合对话与工具调用;Thinking 版本强化长链推理与复杂视觉理解,能“看图思考”,应对高难任务更出色。

据介绍,Qwen3-VL-32B在 STEM、VQA、OCR、视频理解、代理任务等方面的表现优于 GPT-5 mini 和 Claude 4 Sonnet,仅使用 32B 参数即可匹敌高达 235B 的模型,甚至在 OSWorld 上击败了它们。而Qwen3-VL-2B则在小体量下释放惊人表现,能跑在极限端侧设备上,开发者实验、部署都更轻盈。

从识图、写文,到推理、创作,Qwen3-VL 让“看懂世界”变得更轻、更快、更聪明。

截至目前,Qwen3-VL共开源 2B、4B、8B、32B四款Dense模型以及30B-A3B、235B-A22B两款MoE模型,每款模型均推出Instruct和Thinking两大版本,以及12个模型相应的FP8量化版,累计24个Qwen3-VL开源权重模型均可在魔搭社区和Hugging Face免费下载商用。

(责任编辑:刘静 HZ010)

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读