AI系列跟踪(40):AYA-23开源推进多语言能力 腾讯元宝开启大模型生态发展新范式

2024-06-04 10:45:04 和讯  长江证券高超/范超/杨云祺
事件描述
  加拿大的独角兽AI 公司Cohere 开源了多语言模型Aya-23,包含8B 和35B 两个版本,其中Aya-23-35B 在所有评估任务和涵盖的语言中取得了最好成绩。腾讯推出C 端AI 助手APP 腾讯元宝,基于腾讯自研的混元大模型,并接入腾讯体系内的资源,为用户提供丰富的AI 服务。
  事件评论
  开源模型能力突出,助力多语言技术发展。Cohere 公司开源了多语言大模型Aya-23,在模型性能和语言覆盖度上实现了平衡。1)拥有广泛的语言支持能力。Aya-23 模型基于Cohere Command 系列,使用包含23 种语言的文本数据进行训练。模型支持23 种语言,包括阿拉伯语、中文(简体和繁体)、捷克语、荷兰语、英语等,覆盖全球约一半的人口。多语言的覆盖使模型能够服务于更广泛的用户群体。2)在多项多语言任务中表现突出。Aya-23 模型在多语言机器学习理解(MMLU)基准测试中表现出色,尤其在非欧洲语言中表现突出,Aya-23-35B 模型在阿拉伯语、印地语和越南语上的准确率相比Mixtral-8x7B-Inst 分别提高了12.1%、10.0%和6.5%。在数学问题解决能力测试(MGSM)中,Aya-23 系列模型相比于同类基线模型表现优异,Aya-23-8B 模型在7 种语言上的平均得分高于Gemma-1.1-7b。在翻译任务(FLORES)和摘要任务(XLSum)中,Aya-23 系列模型同样优于其他相似规模的模型。模型强大的能力或能够为多语言翻译、内容生成和数据分析等场景提供技术支持。3)模型开源有望推动技术发展。Aya-23 模型的开源链接已在Hugging Face 平台提供,模型开源有助于推动多语言处理技术的发展,有望为AI 技术在多语言内容创作、本地化服务等领域的应用提供新的机遇。
  深度整合生态资源,促进内容生态正向循环。腾讯推出元宝APP,依托腾讯混元大模型的强大技术支持与微信庞大的内容资源构建竞争优势。1)释放混元大模型潜力。混元大模型持续迭代,参数规模已从千亿升级至万亿,预训练语料从万亿升级至7 万亿tokens,整体性能相比Dense 版本提升超过50%。模型能力持续提升,为腾讯元宝APP 提供强大的技术支撑。2)应用场景丰富。腾讯元宝支持图片、文件、语音等多种输入格式,能够一次性解析最多10 个文档和多个链接,提供高效的信息处理能力。腾讯元宝能够通过AI 搜索快速获取信息、AI 总结高效处理文档、AI 写作结构化输出等助力工作场景,提升信息处理效率;并能够通过创建AI 智能体、克隆声音、作图绘画、创意头像、AI 识图等功能丰富生活场景。3)深度整合优质内容生态。腾讯元宝接入微信搜一搜等腾讯系搜索引擎,并通过AI 搜索增强,确保内容的高时效性。腾讯元宝AI 搜索所覆盖的内容涵盖了微信公众号等资源,能够精准搜索到微信公众号中的优质内容。此外,腾讯内部已有超600 个业务及场景接入腾讯混元,有望形成优质内容与生成质量的正向循环。
  海内外厂商持续发力,开源大模型的技术优化与国内厂商的优质生态整合,均有助于AI应用的加速发展。我们认为AI 技术及应用领域持续突破,建议持续关注AI 在广告、电商、影视、游戏和教育等各领域的商业化落地。
  风险提示
  1、AI 技术发展不及预期风险;
  2、内容监管风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读

          【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。