马斯克开源Grok-1 AI大模型，3140亿参数引领技术革命

2024-03-18 18:18:33 自选股写手

马斯克开源AI大模型Grok-1 以3140亿参数领先业界

近日，马斯克宣布开源Grok-1，这一参数量达到3140亿的AI大语言模型，其规模超越了OpenAI GPT-3.5的1750亿参数。

Grok-1的封面图由AI生成，彰显了“AI助AI”的理念。

马斯克在社交平台上表示，想了解OpenAI的开放性程度。

Grok-1遵循Apache 2.0协议，允许用户自由使用、修改和分发模型，推动研究和应用开发。项目已在GitHub上获得6.5k星标，热度持续上升。

Grok-1需要足够的GPU内存进行测试，可能需要一台拥有628 GB GPU内存的机器。

MoE层实现效率有限，但选择该实现是为了避免自定义内核验证模型正确性。

其他已开源的大模型包括Meta的Llama2、法国的Mistral等。开源模型有助于社区进行大规模测试和反馈，加快模型迭代。

Grok-1由马斯克旗下的AI创企xAI在过去4个月开发，采用Mixture-of-Experts（MOE）技术。

研究人员首先训练了一个330亿参数的Grok-0原型，随后进行了重大改进，于2023年11月发布功能更强大的Grok-1。

Grok-1的独特优势在于从头训练、实时了解世界的能力，以及3140亿参数的庞大规模，为模型提供了强大的语言理解和生成能力。

Grok-1将作为Grok背后的引擎，未来将探索长上下文理解与检索、多模态能力等方向。

和讯自选股写手

风险提示：以上内容仅作为作者或者嘉宾的观点，不代表和讯的任何立场，不构成与和讯相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。和讯竭力但不能证实上述内容的真实性、准确性和原创性，对此和讯不做任何保证和承诺。

（责任编辑：周文凯）

看全文

写评论已有条评论跟帖用户自律公约

提交还可输入500字