华为发布全新AI数据基础设施
3月17日,在2026华为数据存储新春发布会上,华为正式发布针对AI推理场景的全新AI数据基础设施,包含面向中心推理场景的AI数据平台,和面向分支边缘推理场景的FusionCube A1000 AI超融合一体机,旨在推动AI推理体验全面升级,并显著降低推理部署门槛,加速AI商业正循环。
过去几年,AI历经多轮演进,已迈入了以推理为核心的全新阶段。当下,企业正面临两大变化:一是数据类型与规模持续扩展,从文本为主转向多模态格式混合,体量从TB级跃升至EB级;二是企业核心资产从“数据”转变为“知识”与“记忆”,被实时调用以支撑智能体自主决策。这些正全面重塑AI数据基础设施,成为AI行业化落地的关键。
面向中心推理场景
华为推出AI数据平台
为解决推理业务中知识质量不足、长序列推理体验差以及推理记忆缺失的三大瓶颈,华为发布AI数据平台,整合知识库、KV Cache加速和记忆库,并结合UCM技术实现调度与管理,破除企业AI的数据门槛,加速智能体应用落地。
华为存储产品线副总裁、闪存领域总裁 谢黎明
知识库:实时生成知识、高精度检索知识
企业数据在不断变化与更新,如果知识转化不及时,会导致模型的推理决策结果不精准。华为AI数据平台采用端到端的解析优化、表征优化与检索优化,提供一个可敏锐捕捉源端数据变化的AI数据管道,并通过多模无损解析、Token级编码等方式,将文本、图片、视频等资源转化成海量细颗粒度的知识,结合多维度检索与重排序,实现超95%知识检索精度。
KV Cache加速:容纳海量历史数据,加速推理响应
在长文本长序列、多用户多并发的推理过程中,大量的KV Cache数据存不下、系统响应迟缓,导致推理体验恶化。华为AI数据平台针对性提供了全局分层缓存能力,让记忆数据在On-chip memory、DRAM、外置SSD存储三层间按需流动,显著扩充KV Cache存储池,同时融合多种稀疏注意力算法,避免重复计算,大幅扩展上下文窗口,实现首Token时延降低90%。
记忆库:高效管理上下文记忆,让模型越用越聪明
当前,大模型普遍缺乏持久的记忆,会遗忘多步骤的中间结果和长期沉淀的历史经验,无法真正实现自我进化。华为AI数据平台提供精准的记忆萃取与召回能力,实现上下文状态保持、信息凝练。记得越多,推理就越精准,模型应用才能“越用越聪明”。
本次发布的AI数据平台可提供一体化和独立式两大部署模式。一体化部署以OceanStor A800为全栈一体机底座;独立式部署采用“数据引擎节点+OceanStor Dorado”架构,可在现有存储系统上新增数据引擎节点,保护历史投资,支撑业务平滑转型。
面向分支边缘推理场景
华为发布FusionCube A1000 AI超融合一体机
如今,大量的数据是在分支边缘场景产生的,针对传统分支边缘场景进行智能化改造过程中所面临的部署复杂、成本高昂、效率低下等问题,华为推出FusionCube A1000 AI超融合一体机,通过集成化与智能化交付,助力AI快速部署与高效运行。
华为存储产品线副总裁、虚拟化领域总裁 张伟力
FusionCube A1000采用通算与智算融合一体化架构,实现AI部署“开箱即用”。其内置的AI平台预集成了数据处理、模型训练与推理全流程能力,基础设施部署与应用上线周期显著缩短80%。同时,FusionCube A1000具备统一运维、安全运营的能力,实现全栈管理、健康监测、故障快速定位定界,为智能体稳定高效地运行提供安全保障。
此外,FusionCube A1000支持边缘与中心协同运行,打破数据孤岛,形成智能体从感知到自主决策的闭环。分支边缘侧产生的数据将回传至中心,在中心侧不断丰富语料、完成模型增训,模型更新后可一键下发至边缘侧,实现模型能力的持续优化与共享。同时,FusionCube A1000支持算力的动态切分与调度,可同时运行多个不同的AI模型,并依据业务优先级智能分配资源,单卡算力利用率提升约30%。其内置平台还支持知识库与记忆库的协同构建,数据飞轮无感运转,持续提升AI模型输出的准确性与实用性。
此次发布的华为AI数据平台与FusionCube A1000,实现了从中心到边缘的AI推理全场景覆盖,为AI技术广泛行业化落地注入新动能。华为数据存储将持续深耕创新,赋能AI全路径,助力企业兑现AI商业价值。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
我国算力规模与质量协同跃升,行业赋能效益加速释放
当前,以大模型为代表的人工智能应用驱动全球计算技术进入新一轮创新爆发期,先进计算硬件、软件、算法之间深度融合、协同演进,量子计算、类脑计算等前沿计算架构加快突破,算力需求呈现指..[详细]
如何推进算电协同,筑牢绿色高效硬底座?
随着AI浪潮的快速发展推进,全社会对算力的需求持续扩大,今年的《政府工作报告》也重点提出,要深化拓展“人工智能+”,实施超大规模智算集群、算电协同等新基建工程。在AI算力需求井喷的..[详细]
平时不戴眼镜的高通卡图赞,谈可穿戴设备杀手级AI应用
“我本人不戴眼镜,只在户外戴太阳镜。所以对我来说,可能挂坠或项链这类形态会更舒服,我可以戴在胸前,随时都能完成视觉交互。”卡图赞随后又以个人视角表..[详细]
聚焦两会|以AI赋能新质生产力,人工智能的责任是为人民服务
在“十五五”规划开局的2026年,人工智能作为科技创新与新质生产力的关键支撑,被全民热议、全社会所关注,并在两会上被提升至战略高度。委员代表们集体围绕AI治理、产业创新、民生应用、人..[详细]
MWC2026 爆火关键词:U6GHz 到底是什么?一文看懂
近日巴塞罗那MWC2026大会火热召开,全球最新的ICT科技集体亮相,令人目不暇接。各大厂商在介绍新技术、新产品时,不约而同地强调了对AI的支持能力和价值。[详细]
聚焦两会|具身智能落地场景全面扩容,产业堵点待打通
2026年开年,具身智能成为科技与产业领域的高频热词。从央视春晚舞台上人机共武,到 MWC2026 巴塞罗那展上中国机器人企业集体亮相的全球秀场,舞台与展会的高光背后,是国产具身智能从技术演..[详细]
我国系统推进自动驾驶政策法规体系建设,加速产业发展
近日,中国信息通信研究院(简称“中国信通院”)政策与经济研究所、人工智能与经济社会研究中心联合发布《自动驾驶战略与政策观察(2025年)——推动自动驾驶全场景落地,抢占科技发展制高..[详细]
专题|2026世界移动通信大会
2026年3月2日至5日,世界移动通信大会(MWC)在西班牙巴塞罗那Fira Gran Via会展中心拉开帷幕。本届展会以“The IQ Era”(众智启新)为主题,向世界展示AI与通信深度融合的无限可能。..[详细]
MWC26启幕:AI+通信深度融合,重构行业价值逻辑
三月的巴塞罗那,科技盛宴如期而至。3月2日至5日,世界移动通信大会(MWC26)将拉开帷幕,恰逢展会落户当地20周年,这场全球通信行业的开春盛事,正承载着定义下一个十年科技革命和产业变革..[详细]













