您的当前位置:首页 > 百科 > 华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本 正文
时间:2025-08-23 23:25:37 来源:网络整理 编辑:百科
新浪科技讯 8月12日下午消息,在2025金融AI推理应用落地与发展论坛上,华为联合中国银联共同发布AI推理创新技术UCM推理记忆数据管理器),实现高吞吐、低时延的推理体验。在当今数字化时代,AI发展
新浪科技讯 8月12日下午消息,发布在2025金融AI推理应用落地与发展论坛上,推理吞吐n推华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),创新实现高吞吐、技术低时延的现高推理体验。
在当今数字化时代,低时低AI发展日新月异。延推验降大模型训练的理体理成热潮尚未消退,AI推理体验却已悄然成为AI应用的发布关键。中信建投在2025WAIC期间发布的推理吞吐n推白皮书指出,AI正从训练向推理的创新结构性转变而快速增长。在这样的技术大背景下,AI推理体验的现高重要性愈发凸显。
推理体验直接关系到用户与AI交互时的低时低感受,包括回答问题的延推验降时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。
据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。
责任编辑:郭栩彤
奥运冠军带货土鸡蛋?总台曝光AI克隆声音乱象2025-08-23 23:21
美职联爆2场冷平 足彩任九开14741注569元2025-08-23 22:48
[新浪彩票]足彩第25101期任九:莫尔德捍卫主场2025-08-23 22:41
乐弈场第64场周赛 张宏其获积分/实力双榜冠军2025-08-23 21:51
治理雾霾污染的英语作文2025-08-23 21:39
[新浪彩票]足彩25101期冷热指数:盖斯哥德堡防平2025-08-23 21:25
英国公开赛舍夫勒领先4杆 李昊桐第二冲击大满贯2025-08-23 21:18
南京清源围棋学校专场 於之莹尹渠助江苏22025-08-23 21:05
外媒评《黑神话:钟馗》:有实机前应理性看待!2025-08-23 21:03
精选足篮专家:肥荣中头奖+55注任九豪揽516万2025-08-23 20:49
突发事故后,青海省委书记、省长紧急调度救援2025-08-23 23:18
京沪大战前申花续约斯卢茨基的 释放了哪些信号?2025-08-23 23:00
梭子鱼锦标赛杰拉德领先3分实现首胜 范鲁彦亚军2025-08-23 22:38
英国公开赛业余选手全部出局 华裔房毅森最为遗憾2025-08-23 22:16
开拓者队记:杨瀚森低位运球不能太多 他在恶补英语2025-08-23 21:48
中信杯女子围甲战罢六轮 杭州云林决破积12分领跑2025-08-23 21:38
乐弈场第64场周赛 张宏其获积分/实力双榜冠军2025-08-23 21:35
北京国安足协杯客场挑战青岛西海岸 不能再有闪失2025-08-23 21:28
名人励志故事:宋濂读书2025-08-23 21:13
梭子鱼锦标赛杰拉德与霍伊并列领先 争取美巡首胜2025-08-23 20:44