NVIDIA 宣布推出 Cosmos 世界基础模型和物理 AI 数据工具的重大更新
美国加利福尼亚州圣何塞—— GTC ——太平洋时间2025年3月18日——NVIDIA今日宣布推出全新NVIDIA Cosmos™世界基础模型(WFM)的重大更新,该模型引入了开放式、可完全定制的物理AI开发推理模型,让开发者以前所未有的方式控制世界生成。
NVIDIA还推出了两款由NVIDIA Omniverse™和Cosmos平台提供支持的新蓝图,为开发者提供用于机器人和自动驾驶汽车后训练的大规模可控合成数据生成引擎。
1X、Agility Robotics、Figure AI、Foretellix、Skild AI和Uber是首批采用Cosmos的企业,可更快、更大规模地为物理AI生成更丰富的训练数据。
“正如大语言模型改变了生成式和代理式AI,Cosmos世界基础模型是物理AI的一项重大突破,”NVIDIA创始人兼CEO黄仁勋表示。“Cosmos为物理AI带来了一个开放式、可完全定制的推理模型,为机器人和物理工业领域的突破性发展带来了机遇。”
用于合成数据生成的Cosmos® Transfer
Cosmos Transfer WFM能够吸收结构化视频输入,如分割图、深度图、激光雷达扫描、姿态估计图和轨迹图等,以生成可控、逼真的视频输出。
Cosmos Transfer可简化感知AI训练,将Omniverse中创建的3D仿真或真值转换为逼真视频,用于大规模可控合成数据生成。
Agility Robotics将是最早采用Cosmos Transfer和Omniverse进行大规模合成数据生成,用以训练其机器人模型的公司之一。
Agility Robotics首席技术官Pras Velagapudi表示:“Cosmos为我们提供了一个在真实世界可采集的数据之外,扩展逼真训练数据的机会。我们很期待看到使用新平台解锁的新性能,同时充分利用我们已有的基于物理学的仿真数据。”
用于自动驾驶汽车仿真的NVIDIA® Omniverse Blueprint借助Cosmos Transfer放大基于物理传感器数据的变化。借助该蓝图,Foretellix可以通过为不同驾驶数据集改变天气和光照等条件来丰富行为场景。Parallel Domain也正在使用该蓝图将类似的变更应用于他们的传感器仿真。
用于合成操作运动生成的NVIDIA GR00T Blueprint结合了Omniverse和Cosmos Transfer,可大规模生成多样化数据集,利用OpenUSD驱动的仿真,将数据采集和增强时间从数天缩短到数小时。
Cosmos Predict用于智能世界生成
一月在CES上宣布的Cosmos Predict WFM能够通过文本、图像和视频等多模态输入生成虚拟世界状态。新的Cosmos Predict模型将支持多帧生成,在给定开始和结束输入图像的情况下,预测中间行为或运动轨迹。这些模型专为后训练而打造,可使用NVIDIA开放的物理AI数据集进行定制。
借助NVIDIA Grace Blackwell® NVL72系统及其庞大的NVIDIA NVLink™域的推理计算能力,开发者可以实现实时世界生成。
1X正在使用Cosmos Predict和Cosmos Transfer来训练其新型人形机器人NEO Gamma。机器人大脑开发商Skild AI正在利用Cosmos Transfer增强其机器人的合成数据集。此外,Nexar和Oxa正在使用Cosmos Predict来升级其自动驾驶系统。
用于物理AI的多模态推理
Cosmos Reason是一个开放式、可完全定制的WFM,具有时空感知能力,它使用思维链推理来理解视频数据,并能够预测交互结果,如一个人走进人行道或一个盒子从架子上掉下来。
开发者可以使用Cosmos Reason来提升物理AI数据标注和管理,增强现有世界基础模型或创建新的视觉语言动作模型。他们还可以对其进行后训练,构建高级规划器,以指导物理AI如何完成所需操作。
加速物理AI的数据管理和后训练
基于其下游任务,开发者可以在NVIDIA DGX™ Cloud上使用原生PyTorch脚本或NVIDIA NeMo™框架对Cosmos WFM进行后训练。
Cosmos开发者还可以使用DGX Cloud上的NVIDIA NeMo Curator来加速数据处理和管理。Linker Vision和Milestone Systems正将其用于管理海量视频数据,训练用于视觉智能体的大视觉语言模型,这些智能体基于NVIDIA AI Blueprint进行视频搜索和总结。Virtual Incision正在探索将其部署在未来的手术机器人中,而Uber和Waabi正在推动自动驾驶汽车的开发。
推动负责任的AI和内容透明度
根据NVIDIA一贯的可信AI原则,NVIDIA在所有Cosmos WFM中都采用开放式护栏。此外,NVIDIA正在与Google DeepMind合作,将SynthID集成到水印中,帮助识别Cosmos WFM NVIDIA NIM™微服务的AI生成结果。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
5G-A赋能机器人火炬接力:中国移动以技术革新点亮全运科技盛宴
2025年11月,第十五届全国运动会将在粤港澳三地盛大启幕。这场赛事不仅是体育健儿的竞技场,更是前沿科技落地应用的“试验田”。其中,11月2日的机器人火炬接力作为本次全运会的核心创新亮点..[详细]
轻薄机型出师未捷身先死,长使业绩泪满襟
当iPhone Air宣布上市当天,随着各路评测内容解禁,一个显眼的标题也随之出现,那就是“注定停产”。轻薄机型的出现一方面让人们看到厂商正在挖掘全新市场空间,另一方面也勾起了小尺寸机型..[详细]
智能未来:宇宙为你闪烁
未来十年,你家的电表可能再也不用换电池,自动驾驶汽车能"看到"几公里外的路况,甚至海洋深处的传感器都能实时传回数据。这些不是科幻,而是刚刚在无锡物博会上发布的《2025全球..[详细]
智能IP广域网成为筑牢智算产业发展根基的关键一环
随着国家加速推动智算产业高质量发展,网络支撑能力已成为产业进阶的核心抓手,而作为关键基础设施的智能IP广域网,正凭借其在算力调度、数据传输中的核心作用,成为筑牢智算产业发展根基的..[详细]
大中华区市场失守 苹果寄望AI驱动未来增长
苹果公司公布的2025 财年第四季度财报呈现“冰火两重天”态势:全球营收1024.66亿美元同比增长 8%,净利润274.66亿美元同比激增86.4%,毛利率攀升至 47.18%。但作为第三大市场的大中华区却成..[详细]













