传媒行业快报：通义千问2.5发布中文大模型纵深突破

2024-05-10 19:55:07 和讯华金证券倪爽

　　投资要点
　　热点事件：5 月9 日，阿里云正式发布通义千问2.5，中文性能全面赶超GPT-4Turbo，成为目前最强中文大模型。同时，通义千问最新开源的1100 亿参数模型在多个基准测评收获最佳成绩，超越Meta 的Llama-3-70B，成为开源领域最强大模型。国内大模型持续迭代突破，对标海外顶尖技术，或深度赋能国内AI 生态，长效赋能商业落地和内容创作。
　　通义千问2.5 强势追赶GPT-4 Turbo，中文大模型迭代突破。过去一年多里，在激烈而又多变的行业竞争态势中，通义千问坚持基础模型技术研发路线。从通义千问2.1 至通义千问2.5，最新版本大模型在理解能力方面提升了9%、在逻辑推理方面提升了16%、在指令遵循方面提升了19%，在代码能力领域亦实现了10%的提升。据权威基准OpenCompass 测评结果显示，通义千问2.5 得分追平GPT-4 Turbo，是该基准首次录得国产大模型取得此等佳绩。目前，其开源模型下载量已经超700 万。国内开源大模型再创佳绩，持续推动大模型开源风潮，极大推进应用落地进程，赋能创新性开发和内容生产。
　　Qwen1.5-110B 发布，开源领域实现强势赶超。1100 亿参数开源模型Qwen1.5-110B 在MMLU、TheoremQA、GPQA 等基准测评中超越Meta 的Llama-3-70B，在HuggingFace 开源大模型排行榜Open LLM Leaderboard 上进入榜首，展现其在开源领域极强的竞争力。为顺应不同场景用户需求，通义已推出参数规模横跨5 亿到1100 亿的8 款大语言模型。0.5B、1.8B、4B、7B、14B 等小尺寸模型可便捷地在手机、PC 等端侧设备部署；中等尺寸如32B 则试图在性能、效率和内存占用之间找到最具性价比的平衡点；72B、110B 等大尺寸模型则支持企业级和科研级应用。其中，多款产品曾在Open LLMLeaderboard 榜单实现登顶，在开放研究机构LMSYS Org 推出的基准测试平台Chatbot Arena 上位居Top 10。中文大模型坚持开源路线，利好国内AI 生态，本地化AI 加持更有利于加速商业化，赋能内容发展。
　　通用领域持续迭代催化，赋能垂类应用发展。5 月9 日，小米旗下AI 助手“小爱同学”与阿里云通义大模型达成合作，强化其在图片生成、图片理解等方面的多模态AI 生成能力，并在小米汽车、手机等多类设备落地；此外，微博、众安保险、完美世界游戏等企业也宣布接入通义大模型，将大模型应用于社交媒体、保险、游戏等领域。AI 落地进行时，看好通用模型赋能下AI 加速落地。
　　持续关注大模型赋能AI 商用落地。建议关注：昆仑万维、天娱数科、因赛集团、蓝色光标、天下秀、美图公司、天娱数科、世纪天鸿、元隆雅图、视觉中国、顺网科技、中文在线、巨人网络、恺英网络、捷成股份、值得买、返利科技等。
　　风险提示：政策不确定性、AI 应用落地不及预期、版权授权潜在争议风险等。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

看全文

写评论已有条评论跟帖用户自律公约