Meta 正式发布 Llama3.1,性能媲美顶尖闭源模型,扎克伯格强调开源,阐述其对开发者、Meta 和世界的好处。
【Meta 正式发布 Llama3.1 ,开源大模型引发行业震动】
美国太平洋时间 7 月 23 日,Meta 正式发布 Llama3.1,这是开源领域性能顶级的大模型系列。
发布前一天,Llama3.1 在开发者社区中“惨遭泄露”,包括模型信息和 405B 模型的磁力。
Llama3.1 正式发布的信息和爆料一致,共有 8B、70B 和 405B 三个尺寸,上下文长度提升到 128K。
根据 Meta 提供的基准测试数据,405B 性能可媲美 GPT-4 和 Claude3.5。
Llama3.1 在超过 15 万亿个 token 的数据上训练,用了 16000 块 H100,预训练数据截至 2023 年 12 月。
为保证训练稳定,只用了 Transformer 模型架构,这使 Llama3.1 能保持短上下文窗口的高质量输出。
扎克伯格强调将开源进行到底,还发表了开源宣言,认为开源路线利大于弊。
Meta 致力于开源 AI,Llama3.1 的发布被视为行业转折点。
获取 Llama3.1 的为:https://llama.meta.com/
最新评论