传媒行业快报:DBRX发布 持续关注商用AI落地进度

2024-03-28 20:11:27 和讯  华金证券倪爽
  投资要点
  热点事件:3 月27 日,初创公司Databricks 发布公告并推出开源AI 模型DBRX。
  据测试结果,DBRX 或将成为迄今为止全球最强大的开源大型语言模型(LLM),超越Meta 的Llama 2。不同赛道的AI 大模型高频迭代,有望催化上游供给和下游需求进一步提升;“百模争流”或正逐渐演变为“多线作战”,细分赛道竞争持续白热化,战况如火如荼。
  DBRX 测试表现优异,开源大型语言模型王座或将易主。DBRX 采用transformer架构,包含1320 亿参数,共16 个专家网络组成,每次推理使用其中的4 个专家网络,激活360 亿参数。据公司官网的实验数据,对比Meta 公司的Llama2-70B、法国MixtralAI 公司的Mixtral 以及马斯克旗下xAI 开发的Grok-1 等主流开源模型,DBRX 在语言理解、编程、数学和逻辑方面均以优势胜出。语言理解:DBRX 得分73.7%,高于GPT-3.5 (70.0%)、高于Llama 2-70B (69.8%)、Mixtral (71.4%)以及Grok-1 (73.0%)。编程能力:DBRX 得分70.1%,远超GPT-3.5 (48.1%),高于Llama 2-70B (32.3%)、Mixtral (54.8%)以及Grok-1(63.2%)。数学领域:DBRX 得分66.9%,高于GPT-3.5 (57.1%),高于Llama2-70B (54.1%)、Mixtral (61.1%)和Grok-1 (62.9%)。由此可见,DBRX 在语言理解、编程、数学和逻辑等方面或已对目前业内领先的开源大模型实现超越。
  头部语言大型模型王座或易主,有望催化赛道竞争加剧,赋能下游产业,催化内容和应用端落地。
  提质增效,降低硬件门槛,轻量化有望持续赋能端侧,长效利好C 端内容生产。
  DBRX 是基于斯坦福MegaBlocks 开源项目构建的混合专家模型,平均只用激活360 亿参数来处理token,可实现极高的每秒处理速度,效率极高。据官方团队介绍,DBRX 是在12 万亿Token 的文本和代码上预训练的16×12B MoE LLM,其支持的最大上下文长度为32k Tokens,其推理速度比LLaMA2-70B 快了近200%,总参数和活动参数数量比Grok 小约40%。由于大幅的精简和提质增效,该模型甚至有望在64GB RAM 的机器设备上运行。降低运行成本有望进一步放低C 端使用门槛,为进一步落实商用AI 提供借鉴参考。
  投资建议:大模型迭代催化,关注AI 商用进度。商用垂类模型建议关注:因赛集团、易点天下、捷成股份、华策影视、蓝色光标、电广传媒、值得买、人民网、中广天择、元隆雅图、国脉文化等;内容端建议关注:中文在线、掌阅科技、世纪天鸿、视觉中国等;大模型和AI 端侧应用建议关注:昆仑万维、美图公司、心动公司等;游戏领域受益建议关注:腾讯控股、网易-S、巨人网络、恺英网络、掌趣科技、汤姆猫、电魂网络、中手游、盛天网络、凯撒文化等。
  风险提示:政策不确定性、AI 应用落地不及预期、AI 版权授权潜在风险等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读

        【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。