英伟达发布Rubin芯片,算力提升五倍,市场万亿美元

3月16日,英伟达创始人黄仁勋在圣何塞SAP(191.63, 1.69, 0.89%)中心的GTC 2026年度大会上正式发布Vera Rubin AI加速平台。这款芯片采用台积电(340.23, 1.92, 0.57%)3纳米制程,集成3360亿颗晶体管,较上一代Blackwell的2080亿提升超过六成。 命名来自已故美国天文学家薇拉·鲁宾——她以发现暗物质证据著称。芯片以她命名,暗示着英伟达对这个时代的野心。
黄仁勋在主题演讲中宣布,Vera Rubin平台已全面投产,并以具体数字重新定义AI算力的量级:Blackwell与Rubin架构的综合采购订单,预计在2027年前达到1万亿美元规模——这一数字是去年英伟达自己预测的整整两倍。

六芯协同,Rubin重塑AI超算标准
Rubin并非单一芯片,而是英伟达精心设计的六芯协同平台。Vera Rubin超级芯片将一颗Vera CPU与两颗Rubin GPU封装于同一处理器,其余四颗芯片——NVLink 6交换机、ConnectX-9超级网卡、BlueField-4数据处理器和Spectrum-6以太网交换机——共同构成完整的AI工厂基础设施。
核心性能数字令全场震动:Rubin GPU采用台积电3纳米工艺制造,集成3360亿个晶体管,搭载288GB HBM4内存,内存带宽达22TB/秒。推断算力以FP4精度计算高达50 PFLOPS,是Blackwell的5倍;训练算力35 PFLOPS,超出Blackwell 3.5倍。整个Vera Rubin NVL72机架配备260TB/秒的NVLink 6带宽——据英伟达称,这已超过整个互联网的带宽总量。
效率同样是重头戏。英伟达声称,Vera Rubin平台在推断token成本上较Blackwell降低10倍,训练混合专家(MoE)模型所需GPU数量减少75%。黄仁勋将其定义为“算力工厂革命”:与Grace Blackwell相比,Vera Rubin每瓦特可交付的性能提升10倍。
硬件形态同样迎来颠覆性变化。全新NVL72机架实现100%液冷,采用无线缆模块化托盘设计,安装时间从Blackwell时代的两小时压缩至五分钟。
Rubin Ultra:2027年的更大赌注
演讲台上,黄仁勋展示了Rubin Ultra系统的内部构造,正式为2027年的下一代产品拉开序幕。Rubin Ultra将采用全新的Kyber机架架构,以竖向而非横向排列的方式集成144颗GPU,以提升密度并降低延迟。
已披露的规格数字同样惊人:Rubin Ultra的NVL576配置将在单一机架内整合576颗GPU,FP4推断算力跃升至15 ExaFLOPS,是Rubin NVL144的四倍。内存升级为HBM4e,整机内存容量达365TB。功耗方面,单机架将达到600千瓦量级。英伟达预计Rubin Ultra将于2027年下半年量产交付。
这意味着英伟达将维持其严格的年度迭代节奏:Blackwell(2024)、Blackwell Ultra(2025)、Rubin(2026)、Rubin Ultra(2027)、Feynman(2028)。
云巨头竞相入局,部署时间表浮出水面
Rubin已进入量产状态,但正式交付要等到2026年下半年。首批部署名单已经敲定:AWS、谷歌(304.42, 2.96, 0.98%)云、微软(399.95, 4.40, 1.11%)Azure、甲骨文(155.97, 0.86, 0.55%)云(OCI),以及CoreWeave、Lambda、Nebius、Nscale等英伟达云合作伙伴,均列于首批采购方阵营。
微软承诺将部署Vera Rubin NVL72机架系统,用于包括未来Fairwater AI超级工厂在内的新一代AI数据中心建设。CoreWeave将从2026年下半年起把Rubin系统整合进其AI云平台。制造商方面,台湾广达已确认初批机器最早可于2026年8月交付客户。
智能体时代的野心与扩张
此次GTC的核心叙事是AI从工具向“智能体”的范式转移。黄仁勋用大量篇幅阐释OpenClaw——这款由奥地利开发者彼得·施坦因贝格尔打造、OpenAI已将其开源的AI代理框架。他将OpenClaw类比于Windows对个人电脑的意义,英伟达同步推出与OpenClaw结合的NemoClaw开源项目,定位为“智能体计算机的操作系统”。
英伟达的版图还在向太空延伸。黄仁勋宣布推进Vera Rubin Space-1计划,目标是在轨道上建设数据中心,算力相当于H100的25倍。这家公司正将自己从芯片供应商重新定位为整个AI时代的基础设施缔造者。
演讲中还有一处值得关注的细节:黄仁勋发布了Nvidia(183.22, 2.97, 1.65%) Groq 3语言处理单元(LPU)。去年12月,英伟达斥资200亿美元完成对AI芯片初创公司Groq的资产收购,堪称英伟达史上最大收购案。这款推断专用芯片预计于今年三季度开始出货,被视为英伟达在推断市场对抗AMD(196.58, 3.19, 1.65%)的新武器。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
我国算力规模与质量协同跃升,行业赋能效益加速释放
当前,以大模型为代表的人工智能应用驱动全球计算技术进入新一轮创新爆发期,先进计算硬件、软件、算法之间深度融合、协同演进,量子计算、类脑计算等前沿计算架构加快突破,算力需求呈现指..[详细]
聚焦315|揭秘通信安全风险 这份“避坑指南”请收好!
每年的国际消费者权益日,通信安全和互联网治理领域都会成为焦点话题。今年央视3·15晚会再度曝光了AI技术滥用等行业乱象,直指新消费领域所面临的治理挑战。[详细]
如何推进算电协同,筑牢绿色高效硬底座?
随着AI浪潮的快速发展推进,全社会对算力的需求持续扩大,今年的《政府工作报告》也重点提出,要深化拓展“人工智能+”,实施超大规模智算集群、算电协同等新基建工程。在AI算力需求井喷的..[详细]
平时不戴眼镜的高通卡图赞,谈可穿戴设备杀手级AI应用
“我本人不戴眼镜,只在户外戴太阳镜。所以对我来说,可能挂坠或项链这类形态会更舒服,我可以戴在胸前,随时都能完成视觉交互。”卡图赞随后又以个人视角表..[详细]
聚焦两会|以AI赋能新质生产力,人工智能的责任是为人民服务
在“十五五”规划开局的2026年,人工智能作为科技创新与新质生产力的关键支撑,被全民热议、全社会所关注,并在两会上被提升至战略高度。委员代表们集体围绕AI治理、产业创新、民生应用、人..[详细]
MWC2026 爆火关键词:U6GHz 到底是什么?一文看懂
近日巴塞罗那MWC2026大会火热召开,全球最新的ICT科技集体亮相,令人目不暇接。各大厂商在介绍新技术、新产品时,不约而同地强调了对AI的支持能力和价值。[详细]
聚焦两会|具身智能落地场景全面扩容,产业堵点待打通
2026年开年,具身智能成为科技与产业领域的高频热词。从央视春晚舞台上人机共武,到 MWC2026 巴塞罗那展上中国机器人企业集体亮相的全球秀场,舞台与展会的高光背后,是国产具身智能从技术演..[详细]
我国系统推进自动驾驶政策法规体系建设,加速产业发展
近日,中国信息通信研究院(简称“中国信通院”)政策与经济研究所、人工智能与经济社会研究中心联合发布《自动驾驶战略与政策观察(2025年)——推动自动驾驶全场景落地,抢占科技发展制高..[详细]
专题|2026世界移动通信大会
2026年3月2日至5日,世界移动通信大会(MWC)在西班牙巴塞罗那Fira Gran Via会展中心拉开帷幕。本届展会以“The IQ Era”(众智启新)为主题,向世界展示AI与通信深度融合的无限可能。..[详细]













