华为超节点:用系统创新重构 AI 算力新范式
飞象网讯 (计育青/文)伴随着AI的快速崛起,专为AI提供充足算力支撑的“超节点”技术在2025年迅速走红,华为先后推出了基于昇腾芯片的万卡超节点产品和50万卡、百万卡超节点集群产品,阿里、字节、腾讯、浪潮等企业也陆续发布了自己的超节点解决方案。
近日,华为计算产品线营销运作部部长张爱军在接受记者采访时表示,华为正在与合作伙伴一道,通过“集群+超节点”创新,为全球AI产业提供真正大规模、高效、开放合作的算力支撑。
“超节点”是AI算力的解决之道
当前AI技术演进正呈现出两个大趋势,一是多模态走向融合统一,二是各行各业全面拥抱AI。从单模态大语言模型到多模态融合统一,需要AI能够统一处理文本、图片、视频、声音等不同类型的数据信息,从而像人类一样,更加全面地认识、理解现实世界。不过多模态时代的到来也带来了不少新的挑战,比如AI模型需要理解、生成的上下文长度将从K级迈入兆级,模型训练需要的数据规模将从10TB级增长到100TB级,竞争加剧导致AI模型更新换代周期从半年缩短到一两个月。另一方面,各行各业都在积极引入AI技术,它们对AI算力提出了更多细化的要求,比如金融风控工作期待AI识别、反馈的时延不能高于20毫秒,新兴的AI代理应用需要在执行多任务协同、多轮推理迭代的同时快速响应用户。这两大趋势都对算力基础设施提出了更高的要求。
面对爆炸式增长的算力需求,人们不能继续依赖单颗芯片的性能提升,必须通过发展多芯片互联技术、构造大规模计算节点来解决问题。传统集群计算方案主要利用现成技术,通过服务器堆叠、以太网联接的模式来提升算力规模,不过由于服务器之间带宽不足、时延大,导致集群规模越大,算力的利用率反而越低。与此同时,算力集群的规模扩张还导致系统总体可靠性下降,一个环节出问题就会连累整个集群的运行中断,使得算力设施难以充分释放自身的价值。张爱军表示,这需要引入新的互联协议、计算架构,从而突破服务器扩展的硬件限制,满足未来规模算力供给。“超节点就是为此提供的解决方案,可以让AI训练更高效、时延更短、可靠性更高。”张爱军说。
“大带宽+低时延+内存统一编址”才是真“超节点”
传统的高性能计算设备就是一台以CPU为核心、采用单一操作系统的大型机或服务器,卡间互联采用PCIe或以太网方式,跨服务器互联带宽多为200-400Gb/s,时延一般在几十微秒,难以满足千亿参数AI模型训练所需。“超节点”则是多个分布式设备各自搭载操作系统,通过新的技术互联形成一个逻辑上的整体,各个分布式设备上的计算单元、存储单元、内存单元等形成资源池,供逻辑上的整体统一调用。
张爱军表示,“超节点”方案中的每个CPU、NPU或内存单元都可以平等地进行互联,互联通道不再采用传统的PCIe模式,而是以全新的协议、总线能力来服务AI计算的高需求。因此张爱军认为,真正的超节点应具备三个核心特征,即大带宽、低时延、内存统一编址。
超节点借助高效的互联协议打破传统架构限制,支持更大规模AI芯片的高效协同,支持更大范围、更高流量的数据传输。以华为昇腾 384超节点产品为例,系统集成了384个昇腾NPU和192个鲲鹏CPU,与传统服务器架构相比,其通信带宽提升了15倍、RTT通信时延从7微秒降到了3微秒。超节点的大带宽、低时延不仅局限在单台服务器内部,还可以扩展到整机和跨机柜的大规模集群,整个超节点范围内都可以灵活并行切分资源、匹配业务需求。实测表明,在DeepSeek、Qwen等多模态、MoE模型训练中,超节点的性能是传统集群的3倍以上。
“内存统一编址”是指超节点内所有互联设备的内存地址全局唯一,无论数据位于哪台设备、哪块内存,都只有一个“全局地址”,CPU、NPU/GPU之间可以直接通过这个地址访问。这使得大模型训练中频繁的参数同步操作可以直接通过内存语义通信完成,提升小包数据传输、离散随机访存通信效率,并在超节点域内实现更大的共享内存池。昇腾384超节点已经实现了128TB的全局内存统一编址。
大带宽、低时延、内存统一编址三大能力相互协同,才能真正实现让集群像一台计算机一样工作,成为真正的超节点。相比之下,一些AI算力设施仍然在AI处理器间以PCIe+RoCE协议互联,跨服务器带宽、时延受限,且不支持“内存统一编址” 能力,本质上仍然是传统服务器的堆叠,不是真正的“超节点”。
需求无止境,创新才有未来
在已经过去的2025年,业界对AI算力的建设和发展一直存在争议,既有算力不足的呼吁,也有算力过剩的忧虑。张爱军认为,与实际需求相比,现有AI算力还远远不够。“从行业用户到个人用户,使用AI越来越多,token用量一直呈现指数级增长。”张爱军说,“据统计,2025年国内平均每天消耗300万亿token,未来可能突破每日千万亿token。”
要满足快速增长的需求,必须坚持创新。在2025年,华为不仅推出了创新的新一代超节点智算产品,还率先将智能计算的超节点技术引入到了通用计算领域,发布了全球首款通算超节点。张爱军表示,其实通用计算与智算一样,都需要不断提高性能表现,因此也都是大带宽、低时延、统一内存编址等新技术的用武之地。
张爱军告诉记者,华为面向超节点开发的高速互联协议灵衢是完全开放的,有兴趣的企业和个人都可以到灵衢官网下载详尽的技术资料,业界所有开发者都可以获取这项技术,在此基础上打造自己的超节点产品。“华为希望这些新技术、新能力可以为更多的企业选用,从而打造一个完整的产业生态,共同努力为数字化、智能化时代提供坚强的算力支撑。”张爱军说。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
盘点2025|光纤光缆:周期性放缓之下,确定性开始凸显
在2025年,光纤光缆厂商们习惯于用“周期性”一词来描述当前的困难,相比于宽带普及、4G升级换代带来的流量需求猛增这一巨大业务增长。可如今在刷着短视频、看着带货的新日常生活常态下,尽..[详细]
盘点2025|人工智能:破局前行、以智启新,同赴人机共生新未来
2025年,人工智能行业迎来技术迭代与价值落地的双重关口。这一年里既延续着近年来的高速增长态势,也迎来从野蛮生长向规范提质的深刻转型。 [详细]
盘点2025|算力行业:量质齐升的进阶之路
在数字经济加速渗透全球经济社会各领域的今天,算力已成为继电力、水资源之后的关键生产要素,是支撑数字中国建设、推动高质量发展的核心基础设施。算力的规模与质量直接决定了数字经济的发..[详细]
盘点2025|芯片:AI依旧是挖潜点,应用进一步多样化
时至2025年年底,人们已经开始渐渐习惯,有事听听AI给出的参考意见。其背后的算力支撑也在逐步加强,像是更先进的制程,以及向更多端侧设备的拓展。另一方面,AI又一石激起千层浪,机遇与需..[详细]
盘点2025 | 从5G到6G:深耕与突破并行,开启智能连接新纪元
2025年,全球通信产业站在了一个关键的历史交汇点。这一年既是“十四五”规划的收官年,5G建设成果全面转化的验收年,也是“十五五”规划启幕,6G布局从技术探索迈向工程落地的奠基之年,更..[详细]
盘点2025|量子信息:三大领域技术持续演进,产业发展未来可期
以量子计算、量子通信和量子精密测量为代表的量子信息技术是挑战人类调控微观世界能力极限的世纪系统工程,是对传统技术体系产生冲击、进行重构的重大颠覆性创新,将引领新一轮科技革命和产..[详细]
盘点2025|2025年智能终端趋势洞察:AI重构体验,超级终端时代加速到来
2025年,全球智能终端行业站在了技术革新与生态重构的十字路口。AI技术的规模化渗透、折叠屏形态的成熟落地、跨设备协同的深度演进,正在重塑终端产品的价值逻辑与市场格局。[详细]
2026手机市场开局遇寒流 市场结构悄然生变
2026年伊始,尚处于温和复苏阶段的全球智能手机市场,便遭遇了一记“寒流”。据媒体消息,受上游供应链存储涨价影响,多家手机厂商近日下调全年整机订单数量,小米、OPPO下调超20%,vivo下调..[详细]
2026十大AI技术趋势:应用拓展、模式探索与底层技术齐头并进
在2025年,人工智能技术不仅继续向着更快、更强、更多能的方向发展,还在向着小而精的新方向发展,并因此得以大步走出实验室,以令人吃惊的速度快速融入各行各业的业务应用。时间进入2026年..[详细]
XR3.0时代,产业已迈入发展“快车道”
虚拟(增强)现实(简称XR)是新一代信息技术的重要前沿方向,是数字经济的重大前瞻领域,将深刻改变人类的生产生活方式,各国政府重视该领域的发展布局,美韩持续推进沉浸式技术战略,我国..[详细]













