华为推出新一代AI数据基础设施 破解智能体应用"存算失衡"难题

(问题)当前,智能体应用企业侧热度攀升,但“能做演示、难以落地”仍是普遍感受;一上,中心侧推理多轮交互、长上下文场景下易出现响应变慢、吞吐下降等情况,用户体验和业务连续性受到影响;另一上,分支机构与边缘场景虽需求旺盛,却常因部署周期长、成本高、运维复杂而推进缓慢。此外,全球存储市场处于价格波动上行阶段,叠加企业算力与数据投入扩张,使不少项目在预算约束下更趋谨慎。 (原因)业内人士认为,智能体时代的关键矛盾正在从“模型能力”转向“数据供给与推理效率”。企业数据规模大、模态杂、更新快,但数据从原始资料到可被模型稳定调用的知识,需要完成解析、标引、表征、检索与治理等系统工程;在推理侧,长序列与多轮对话对缓存与IO提出更高要求,若缺少高效的缓存调度与存算协同,就会出现重复计算多、首字时延高等问题;在能力侧,智能体需要记录任务中间状态并沉淀经验,缺少可管理的“工作记忆”和“长期记忆”,容易在复杂流程中丢失上下文,影响准确性和可控性。 (影响)上述因素叠加,使智能体应用从试点走向规模化时面临三重压力:一是“数据有量无用”,企业私域数据难以转化为可检索、可追溯的有效知识;二是“越用越慢”,推理效率难以支撑高并发与长对话,业务高峰期体验波动明显;三是“落地成本高”,尤其在分支与边缘场景,软硬件集成、交付和运维的复杂度抬高了总体拥有成本。若这些短板不能及时补齐,智能体在客服、办公、研发、运维等高频场景的规模化推广将受到制约。 (对策)针对上述痛点,华为在发布会上提出以“数据底座升级”带动智能体落地提速的思路,分别面向中心推理与分支边缘推出两类产品方案。 在中心侧,华为发布AI数据平台,聚焦知识供给、推理加速与记忆管理三项能力,并通过统一缓存管理机制实现协同调度。其一,平台提供面向企业数据的知识库能力,通过多模态解析与融合检索,将分散的数据资源转化为模型可直接调用的知识条目,提升检索准确性与可用性。其二,平台引入面向推理的KV Cache加速能力,采用分层缓存思路构建可扩展的缓存池,减少重复计算与跨层搬运带来的开销,降低首字时延并提升吞吐。其三,平台提供记忆库能力,支持对任务过程状态与历史交互经验的沉淀与调用,增强智能体在复杂流程中的连续性与一致性。 在边缘侧,华为推出FusionCube A1000 AI超融合一体机,面向分支机构、园区等场景强调一体化交付与简化运维,以降低部署门槛、缩短上线周期,帮助企业在更多业务单元实现“可复制、可推广”的智能体应用。 (前景)业界普遍认为,未来企业智能体的竞争将更多体现为“数据工程能力+推理效率+安全治理”的综合能力。随着上下文长度持续增长、数据模态持续扩展、业务对实时性与可控性要求不断提高,数据基础设施将从通用存储走向面向推理与知识管理的专用化、平台化演进。与此同时,边缘侧的落地需求将与中心侧形成互补:中心侧追求规模推理与统一治理,边缘侧强调就近处理与低时延服务。通过在中心与边缘两端同时补齐数据与推理短板,有望推动智能体从单点试用转向跨部门、跨地域的规模化应用,并带动企业数据治理与IT架构深入升级。

数据是AI的基础,基础设施是AI的支撑。华为此次解决方案正是抓住了该关键。当AI从实验室走向实际应用时,数据基础设施的完善至关重要。通过将企业数据转化为可用知识、增强智能体记忆能力并简化边缘部署,华为为AI规模化应用扫清了障碍。这不仅是一次产品创新,更是对AI时代企业应用新模式的积极回应。随着类似方案的推广,AI智能体有望从小范围试点走向广泛应用,成为推动经济社会发展的重要力量。