华为:将发布UCM技术实现高吞吐低时延体验

2025-08-12 17:27:45 自选股写手 

快讯摘要

2025金融AI推理论坛上,华为将发布创新技术UCM,可实现高吞吐、低时延推理体验,降推理成本

快讯正文

【华为将在论坛发布AI推理创新技术UCM,实现高吞吐、低时延体验】 在2025金融AI推理应用落地与发展论坛上,华为将发布AI推理创新技术UCM。UCM是一款以KVCache为中心的推理加速套件,它融合了多类型缓存加速算法工具,能分级管理推理过程中产生的KVCache记忆数据,扩大推理上下文窗口,进而实现高吞吐、低时延的推理体验,降低每Token的推理成本。据悉,推理体验直接影响用户与AI交互时的感受,涵盖回答问题的时延、答案的准确度以及复杂上下文的推理能力等方面。

本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担

(责任编辑:郭健东 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    推荐阅读