4 月 17 日,字节开源多模态智能体 UI-TARS-1.5,在 7 个基准中获 SOTA 表现,具长时推理等能力。
【字节Seed智能体模型UI-TARS-1.5开源】4月17日讯,豆包大模型团队发布并开源了一款基于视觉-语言模型构建的多模态智能体UI-TARS-1.5。该智能体能够在虚拟世界高效执行各类任务,已在7个典型的GUI图形用户评测基准中取得SOTA表现,还首次展现了在游戏中的长时推理能力和在开放空间中的交互能力。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论