DeepSeek:发布新模型 参数达 6710 亿

2025-04-30 18:51:15 自选股写手 

快讯摘要

4 月 30 日,DeepSeek 发布新模型 DeepSeek-Prover-V2-671B,参数达 6710 亿,具多项优势。

快讯正文

【4 月 30 日,DeepSeek 在 AIHuggingFace 发布新模型 DeepSeek-Prover-V2-671B】据悉,该模型使用更高效的 safetensors 文件格式,支持多种计算精度,参数达 6710 亿。其为去年发布的 Prover-V1.5 数学模型升级版本,采用 DeepSeek-V3 架构和 MoE 模式,有 61 层 Transformer 层、7168 维隐藏层。同时支持超长上下文,最大位置嵌入达 16.38 万,并采用 FP8 量化,能减小模型大小,提高推理效率。

本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担

(责任编辑:刘畅 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    推荐阅读