通义千问Qwen3-VL家族新增2B、32B模型全线覆盖视觉语言理解场景

2025-10-22 15:12:12 智通财经

新闻摘要

智通财经APP获悉，10月22日，阿里巴巴-W旗下通义千问团队宣布，Qwen3-VL家族再扩列，新增2B与32B两个密集模型尺寸，从轻量级到甜品级，全线覆盖视觉语言理解场景。截至目前，Qwen3-VL共开源四款Dense模型以及两款MoE模型。通义千问表示，每个模型都提供两种版本 Instruct版本响应更快、执行更稳，适合对话与工具调用;Thinking版本强化长链推理与复杂视觉理解，能“看图思考”，应对高难任务更出色

智通财经APP获悉，10月22日，阿里巴巴-W(09988)旗下通义千问团队宣布，Qwen3-VL家族再扩列，新增2B与32B两个密集(Dense)模型尺寸，从轻量级到甜品级，全线覆盖视觉语言理解场景。截至目前，Qwen3-VL共开源四款Dense模型以及两款MoE模型。

通义千问表示，每个模型都提供两种版本：Instruct 版本响应更快、执行更稳，适合对话与工具调用;Thinking 版本强化长链推理与复杂视觉理解，能“看图思考”，应对高难任务更出色。

据介绍，Qwen3-VL-32B在 STEM、VQA、OCR、视频理解、代理任务等方面的表现优于 GPT-5 mini 和 Claude 4 Sonnet，仅使用 32B 参数即可匹敌高达 235B 的模型，甚至在 OSWorld 上击败了它们。而Qwen3-VL-2B则在小体量下释放惊人表现，能跑在极限端侧设备上，开发者实验、部署都更轻盈。

从识图、写文，到推理、创作，Qwen3-VL 让“看懂世界”变得更轻、更快、更聪明。

截至目前，Qwen3-VL共开源 2B、4B、8B、32B四款Dense模型以及30B-A3B、235B-A22B两款MoE模型，每款模型均推出Instruct和Thinking两大版本，以及12个模型相应的FP8量化版，累计24个Qwen3-VL开源权重模型均可在魔搭社区和Hugging Face免费下载商用。

（责任编辑：刘静 HZ010）

【免责声明】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约