传媒行业快报:通义千问2.5发布 中文大模型纵深突破

2024-05-10 19:55:07 和讯  华金证券倪爽
  投资要点
  热点事件:5 月9 日,阿里云正式发布通义千问2.5,中文性能全面赶超GPT-4Turbo,成为目前最强中文大模型。同时,通义千问最新开源的1100 亿参数模型在多个基准测评收获最佳成绩,超越Meta 的Llama-3-70B,成为开源领域最强大模型。国内大模型持续迭代突破,对标海外顶尖技术,或深度赋能国内AI 生态,长效赋能商业落地和内容创作。
  通义千问2.5 强势追赶GPT-4 Turbo,中文大模型迭代突破。过去一年多里,在激烈而又多变的行业竞争态势中,通义千问坚持基础模型技术研发路线。从通义千问2.1 至通义千问2.5,最新版本大模型在理解能力方面提升了9%、在逻辑推理方面提升了16%、在指令遵循方面提升了19%,在代码能力领域亦实现了10%的提升。据权威基准OpenCompass 测评结果显示,通义千问2.5 得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得此等佳绩。目前,其开源模型下载量已经超700 万。国内开源大模型再创佳绩,持续推动大模型开源风潮,极大推进应用落地进程,赋能创新性开发和内容生产。
  Qwen1.5-110B 发布, 开源领域实现强势赶超。1100 亿参数开源模型Qwen1.5-110B 在MMLU、TheoremQA、GPQA 等基准测评中超越Meta 的Llama-3-70B,在HuggingFace 开源大模型排行榜Open LLM Leaderboard 上进入榜首,展现其在开源领域极强的竞争力。为顺应不同场景用户需求,通义已推出参数规模横跨5 亿到1100 亿的8 款大语言模型。0.5B、1.8B、4B、7B、14B 等小尺寸模型可便捷地在手机、PC 等端侧设备部署;中等尺寸如32B 则试图在性能、效率和内存占用之间找到最具性价比的平衡点;72B、110B 等大尺寸模型则支持企业级和科研级应用。其中, 多款产品曾在Open LLMLeaderboard 榜单实现登顶,在开放研究机构LMSYS Org 推出的基准测试平台Chatbot Arena 上位居Top 10。中文大模型坚持开源路线,利好国内AI 生态,本地化AI 加持更有利于加速商业化,赋能内容发展。
  通用领域持续迭代催化,赋能垂类应用发展。5 月9 日,小米旗下AI 助手“小爱同学”与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态AI 生成能力,并在小米汽车、手机等多类设备落地;此外,微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。AI 落地进行时,看好通用模型赋能下AI 加速落地。
  持续关注大模型赋能AI 商用落地。建议关注:昆仑万维、天娱数科、因赛集团、蓝色光标、天下秀、美图公司、天娱数科、世纪天鸿、元隆雅图、视觉中国、顺网科技、中文在线、巨人网络、恺英网络、捷成股份、值得买、返利科技等。
  风险提示:政策不确定性、AI 应用落地不及预期、版权授权潜在争议风险等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读

          【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。