软件与服务行业:AI产业速递(33):LLAMA3.1正式发布 开源引领新时代

2024-07-29 19:10:08 和讯  长江证券宗建树
  事件描述
  7 月23 日,Meta 正式发布Llama 3.1 开源大语言模型,并提供8B、70B 及405B 参数版本,并在多项基准测试中,超越GPT-4o 和Claude 3.5 Sonnet。
  事件评论
  性能比肩闭源大模型,Llama 3.1 成为最强开源大模型。虽然Llama 3.1 在HumanEval和MMLU-social sciences 方面却落后于GPT-4o,但其在GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem 和winograd 等多项基准测试中均优于GPT-4o(目前市面上的性能领先者),并有望通过调优进一步优化其性能。同时,Llama3.1 系列改进了推理能力及多语言支持,上下文长度提升至128K,在模型性能上已经可以与 GPT-4、GPT-4o、Claude 3.5 Sonnet 等领先的闭源模型相媲美。
  以开源求发展,开源或成为AI 发展重要路径。Meta 此次公布了一份92 页的技术报告,其中包含预训练数据、过滤、退火、合成数据、缩放定律、基础设施、并行性等大量模型细节,使开发者更详尽的了解Llama 3.1。随着开源大模型在性能上迅速缩小与开源大模型的差距,开源大模型或将获得更多开发者的支持,进而在开放性、可修改性和成本效率方面取得领先。截至目前,所有Llama 版本的总下载量已超过3 亿次,开源或将成为AI产业发展的重要推动力。
  大模型性能不断提升的同时,对算力的要求也逐步提升。在Llama 系列大模型迭代的过程中,GPU 的用量也在不断增长。早期的Llama 1 使用了2048 块GPU;Llama 2 使用了4096 块GPU;此次Llama 3.1 405B 使用了超过 16000 块H100 GPU,使用了超过15 万亿个token 进行训练,进行了3.8 × 10次浮点运算(FLOPs),超过 Llama 2 的最大版本近 50 倍。在目前Scaling Laws 仍持续生效的情况下,参数量的指数级增长仍将带动算力需求的进一步提升。
  大模型持续快速迭代,开源或成为未来AI 发展重要组成部分。当前时点,人工智能将持续迅猛发展,快速迭代。随着开源大模型被更多的开发者使用,或将推动AI 生态的繁荣发展,算力作为AI 产业基础设施仍将最先受益。建议关注国产大模型龙头企业:科大讯飞,以及国产算力产业链龙头企业和神州数码。
  风险提示
  1、AI 技术发展不及预期;
  2、AI 模型下游需求不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读