【全球最强大模型易主,Claude 3 引起热议】Anthropic推出Claude 3系列模型,包括Claude 3 Opus、Sonnet和Haiku。这三款模型在推理、数学、编码、多语言理解和视觉处理等方面表现优异。
其中,超大杯Opus展现出卓越性能,在知识测试MMLU、推理测试GPQA、基础数学测试GSM8K等基准测试中均超越了GPT-4和Gemini 1.0 Ultra。而中杯Haiku主打响应速度和性价比,性价比远超GPT-4。大杯Sonnet在速度和智能处理能力上实现了飞跃。
值得注意的是,Claude 3突出的新增能力在视觉识别方面,能处理多种视觉资料。此外,Claude 3在安全性和可靠性上也有所提升,严格遵循人工智能安全等级2(ASL-2)的标准。
Opus在大量数据中准确检索信息的能力达到了近乎完美,甚至能识别人为插入的信息。同时,Opus在处理开放式问题时的正确率明显提升。
Anthropic还计划为Claude 3新增引用功能,验证答案的正确性。整个系列模型支持超过100万个tokens的处理,具有强大的上下文窗口能力。
在网友测试中,Opus表现优异,尤其在细节还原和多模态能力方面。然而,与GPT-4相比,Opus在信息丰富度上还有提升空间。
Claude 3的发布引起了高度关注,人们纷纷期待GPT-5的出现。目前Opus和Sonnet已经开放,Haiku即将推出。该系列模型已在Anthropic的API中集成,开发者可以注册并使用这些模型。
最新评论