【Meta震撼发布Llama 3,一夜重回开源大模型铁王座】 Meta社区发布了最新的开源大模型Llama 3,包括两个版本:Llama 3 8B和Llama 3 70B。这两个版本将在未来很快登陆主要的云供应商。 根据Meta的介绍,Llama 3 8B和Llama 3 70B是目前性能最好的同体量下开源模型。在某些测试集上,Llama 3 8B的性能甚至比Llama 2 70B更强。未来几个月,Meta还将推出更多版本,甚至可能发布高达400B的版本,让开源社区可以使用GPT-4级别的模型。 AI开源倡导者吴恩达表示,Llama 3的发布是他收到的最好的礼物之一,感谢Meta的贡献。Meta的目标不是与其他开源模型竞争,而是要超越所有人,打造最领先的人工智能。 Llama 3的亮点包括基于超过15T token训练,训练效率比Llama 2高3倍,支持8K长文本等特性。此外,Llama 3还具有增强的推理和代码能力,以及安全性方面的重大突破。 Meta的工程师透露,Llama 3的诞生始于去年夏天,团队攻克了数据集、预训练等难题。未来,Llama 3还将解锁更多能力,例如更长的上下文、支持多模态等。 综合来看,Meta的Llama 3在性能、训练数据质量、训练效率和安全性方面都取得了重大突破。Meta还将公布更多技术细节,并与外界进行交流,继续在大模型开源之路上前行。
最新评论