DeepSeek:发布新模型 参数达 6710 亿

2025-04-30 19:21:15 自选股写手 

快讯摘要

DeepSeek 30 日在 AIHuggingFace 发布新模型 DeepSeek-Prover-V2-671B,参数达 6710 亿,具多项优势。

快讯正文

【DeepSeek 于 AIHuggingFace 发布新模型 DeepSeek-Prover-V2-671B】30 日,DeepSeek 在 AIHuggingFace 推出新模型。据悉,该模型使用更高效的 safetensors 文件格式,支持多种计算精度,参数达 6710 亿,或为去年发布的 Prover-V1.5 数学模型升级版本。其在模型架构上使用 DeepSeek-V3 架构,采用 MoE 模式,有 61 层 Transformer 层、7168 维隐藏层,支持超长上下文,最大位置嵌入达 16.38 万,还采用 FP8 量化,能减小模型大小,提高推理效率。

(责任编辑:刘畅 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    推荐阅读