一、基础能力测试:混元 VS Claude 3 VS Mistral1、数学能力: Claude 3 >混元 > Mistral。测试3道高数题、1道线代题、1道概率题,Claude 3 正确率为80%,混元正确率为60%,Mistral 正确率为40%。
2、编程能力:混元 >Claude 3 = Mistral。测试数据分析、编写应用程序、贪吃蛇、爬虫,共5道编程题。编程1次运行成功率混元为80%,Claude 和 Mistral 均为40%
二、应用:腾讯内部诸多应用均已接入混元大模型1、截至2023年9月7日,超过50个腾讯内部业务接入混元。2023年10月27日,增长至180个。其中包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等核心业务和产品。
2、腾讯会议:在会议界面接入“AI小助手”,仅付费用户可用。可以总结会议纪要,并对会议内容进行提问,能够回答并给出依据。
3、腾讯文档:加入“AI智能助手”,功能划分为教育教学、职场办公、营销策划、生活娱乐、大学生专区五个板块,共13+29+10+10+5=67种功能。
4、QQ浏览器:右上角接入PDF阅读助手,可上传文档并提问;上传英伟达年报,无法总结文档内容,但可以回答答案位于第14页的问题。
三、投资建议及风险提示:
1、我们看好国产大模型的迭代能力。随着llama 3开源,国产大模型能力或进一步增强。建议关注:1、平台公司:腾讯控股(混元大模型领跑)、阿里巴巴(领投月之暗面和MiniMax);2、AI内容公司:阅文集团(IP龙头)、哔哩哔哩(UGC内容)。
2、风险提示:AI模型能力进步不及预期、AI厂商竞争加剧
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论