您的当前位置:首页 > 娱乐 > 华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本 正文
时间:2025-08-23 20:49:31 来源:网络整理 编辑:娱乐
新浪科技讯 8月12日下午消息,在2025金融AI推理应用落地与发展论坛上,华为联合中国银联共同发布AI推理创新技术UCM推理记忆数据管理器),实现高吞吐、低时延的推理体验。在当今数字化时代,AI发展
新浪科技讯 8月12日下午消息,发布在2025金融AI推理应用落地与发展论坛上,推理吞吐n推华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),创新实现高吞吐、技术低时延的现高推理体验。
在当今数字化时代,低时低AI发展日新月异。延推验降大模型训练的理体理成热潮尚未消退,AI推理体验却已悄然成为AI应用的发布关键。中信建投在2025WAIC期间发布的推理吞吐n推白皮书指出,AI正从训练向推理的创新结构性转变而快速增长。在这样的技术大背景下,AI推理体验的现高重要性愈发凸显。
推理体验直接关系到用户与AI交互时的低时低感受,包括回答问题的延推验降时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。
据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。
责任编辑:郭栩彤
2025精英童模超级联赛表演嘉宾邹逸辰 荣获主题赛冠军2025-08-23 20:24
打击证券造假力度加大 半年罚没款超去年全年2025-08-23 20:21
一图读懂丨什么是猴痘,如何做好防控?2025-08-23 20:13
百日千万招聘专项行动提供岗位数突破千万2025-08-23 20:08
2025精英童模超级联赛全球总决赛 小超模苏荷斩获网络人气冠军2025-08-23 20:05
医者说丨靳建旭:因病施策 提高癌症患者生活质量2025-08-23 18:54
8月13日人民币对美元中间价报7.1479元 下调21个基点2025-08-23 18:54
未来可期!中国女排夺得U17世锦赛冠军2025-08-23 18:53
李依桦强势包揽长三角马术青少年联赛1.10米级别冠亚军2025-08-23 18:39
北方降水过程持续 川渝高温酷热天气短期内难缓解2025-08-23 18:38
产科门诊护士述职报告2025-08-23 19:56
新疆霍尔果斯口岸客流爆棚!互免签证助力跨境游2025-08-23 19:18
我国海水养殖业不断向深远海、机械化、智能化转变 助力“耕海牧渔”挺进深蓝2025-08-23 19:04
行业“内鬼”明码标价,30万条业主信息被卖!2025-08-23 18:54
大豆与拉面结合的营养冷面吃法:韩式豆浆面2025-08-23 18:51
法甲身价排行:大巴黎11.6亿欧第1 占总比超3成2025-08-23 18:47
转变观念 在实践中探索体能训练的科学方法2025-08-23 18:35
[新浪彩票]足彩第25111期任九:卡拉巴赫赢球2025-08-23 18:26
我有一个秘密I Have a Secret2025-08-23 18:22
赛羊盛会,激情飘移,尚义之战!2025-08-23 18:20