2 月 21 日,华泰证券称 DeepSeek 在 V3 优化算法,国产算力适配模型效果佳,海外算力受限或促国产算力优化。
【2 月 21 日,华泰证券指出重要趋势】DeepSeek 在 V3 中运用了比 CUDA 更底层的 PTX 来优化硬件算法,PTX 是 CUDA 编译的中间代码,在 CUDA 和最终机器码间起桥梁作用。NSA 采用了 OpenAl 提出的 Triton 编程语言高效编写 GPU 代码,Triton 底层可调用 CUDA 及其他 GPU 语言,包括 rocm 以及国产算力芯片语言,如寒武纪的思元 590 芯片和海光信息的深算一号(DCU)内置的 HYGONISA 指令集。LLM 的训练短期内虽未完全脱离 CUDA 生态,但 DeepSeekNSA 的推出使其初步呈现出与 CUDA 解耦的趋势,为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力已很好适配了 DeepSeek-R1 等国产模型,并取得高效推理效果,华泰证券认为,伴随海外算力受限,针对国产算力的优化或有持续进展,值得重视。
本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论