从精神到肉体,AI走向真实环境需要世界模型
飞象原创(魏德龄/文)生活在数据中心里的人工智能,在很多人心目中似乎已经变成了无所不知的存在,可一旦给他们装上躯体,哪怕是汽车的轮子,却难以做到无所不能,甚至路都走不稳。有趣的是,即便是刚出生的婴儿,他们喜欢进行的第一个尝试,便是不断把玩具、餐具等任何物品,从高处扔向地面,从中了解到这个万有引力的物理世界,但这却是大语言模型仅仅可以讲述,却并不真正懂得的简单物理常识。
图灵奖得主杨立昆就在近期接受外媒访谈时举了这样一个例子,当询问洗车店在100米外是否该走路去时,LLM可能建议步行(因为它只看距离),却忽略了“车必须开进店”这一物理前提。
能够解决这一人工智能尴尬表现的关键,其实并非进一步对大语言模型进行训练,而是正在被越来越多人所提及,能够预测行动后果,在抽象空间中进行规划的世界模型。
具备物理常识的世界模型
试想一下现代人类在出门时会自然而然地思索什么?今天下不下雨,用不用带把伞。如果路面有雪,一定要穿双防滑的鞋子。出门时还要多加小心,如果滑倒摔跤了会很疼。这正是我们大脑中的种种物理常识正在进行工作的结果。
世界模型已被业界看作是人工智能能否进一步实现场景落地的关键技术门槛之一。它是一种能够理解物理规律、具备时空认知能力的AI模型。
与仅在数字世界处理文本或符号的传统AI(如大语言模型)不同,世界模型能理解重力、生物学、空间几何等物理规律。例如,它知道下雨路会滑,或者自行车失去重心会跌倒。基于此,世界模型可以首先理解当前环境,接着预测下一步可能发生的状况(如开冰箱后下一步是拿瓶子),最后基于预测进行行动规划。
也就是说,世界模型具备一种更接近于人类的抽象空间预测能力,它不要求生成每一个像素的细节,而是在抽象的语义表征空间中预测未来的状态,这使得它能像人类一样忽略无关的纹理和光照,专注于与决策相关的关键信息。
世界模型有望成为老司机
回到当下的实际应用案例,对于辅助驾驶而言,如今尽管汽车可以实现一定程度的自我控制,遇到危险情况知道刹车或躲避,但只要试乘过的人,都能发现它们的表现没有所谓老司机级别的驾驶,乘坐起来舒适。而世界模型的思考分析能力,似乎可以实现更具人性化的线性刹车或松油滑行的操作。
世界模型的出现,针对性地解决了当前以大语言模型(LLM)和视觉-语言-动作模型(VLA)为代表的AI在实际应用中的核心缺陷。现有的VLA模型在实际部署时非常脆弱,光线或视角的微小变化就可能导致成功率大幅下滑,世界模型通过内部模拟机制,在行动前预测后果,从而提高行动的稳健性。
未来完全自动驾驶和具身机器人的核心底座正是世界模型。例如在驾驶场景中,当下雨的时候路会滑,当处于有重力加速度的斜坡时会发生什么情况,当车子如果是前面车靠近的时候它的速度跟偏幅多快可能会撞上,这种物理理解就好像是已经有了一个基础的方程式;或是在具身智能场景中,世界模型可以让机器人能进入工厂“打螺丝”或处理复杂的仓储物流任务,真正与物理世界互动。
世界模型到专家型智能体
Gartner预测,世界模型将推动AI智能体从简单的任务自动化向高度自主的“专家型智能体”转变。
“专家型智能体”拥有更高的自主性,无需人工监督即可自动完成工作,其复杂性相对较高,具备接近人的理解能力、高度适应性和推理能力,它不仅可以与第一方,也可以与外部第三方智能体协作。
“专家型智能体”通过具备对物理世界的抽象理解能力,可以更好地投入到现实工作中。例如,在国外某地的风力发电机维护中,通过引入Archetype AI的Newton模型,世界模型可以在没有历史故障样本的情况下,仅凭对物理环境的感知就预知异常。
与身体和头脑一起长大的人类不同,人工智能先拥有了一个超大容量,但又消耗巨大的大脑,可它所接触的真实世界,还仅仅来自隔着一层纱的网络数据,正在打开的物理世界大门,将会对思想带来进一步升级。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
总有人比时代早十年:跨越AI边界,迎接人机共生新纪元
如何打破人工智能这一词汇带来的思维局限?刚刚落幕的2026年第八届北京智源大会上,汇聚了2位图灵奖得主、8位院士、30余位青年科学家,以及40多位AI企业的CEO和产学研顶尖专家。他们来自Meta..[详细]
世界杯中的“黑科技”:中国智造又火了
北京时间6月12日凌晨,美加墨世界杯正式拉开帷幕,场内是激情与速度,而场外是硬核科技。在这场足球与科技的双重盛宴中,中国智造强势出圈,官方用球智能传感、AI转播、高清传输等前沿科技的..[详细]
全新反电信网络诈骗宣传矩阵正式成立
全新反电信网络诈骗宣传矩阵正式成立,将整合主流媒体、行业协会、基础电信企业、互联网企业等反诈宣传资源,开展系列反诈宣传工作。矩阵将打通线上线下宣传渠道,多形式、多角度普及反诈技..[详细]
高阶智驾普及战:从“有”向“优”升级
曾几何时,高阶智驾是30万元以上高端新能源车的专属标签,普通消费者只能仰望。但在2026年,这一格局正在被迅速改写。当高阶智驾下探到十万元级别,行业竞争的底层逻辑已悄然生变——高阶智..[详细]
当智能体融入汽车,融合架构成为AI想象力的关键
当汽车开始安装上大屏幕的时候,业界便明确表示,汽车的电子化绝非“1+1”般简单,除了把屏幕放在四个轮子上,还要考虑增加的芯片、电路、安全性等要素。如今,当座舱已经成为一个“智能生活..[详细]
深耕三大核心赛道,亨通向未来产业冲刺
亨通集团一季度营收、净利润大幅增长,光纤产能与海外订单持续放量;落地全球首条S+C+L三波段多芯光缆、空芯光纤商用等标杆项目,领跑算力与光通信赛道;携手华为、中国移动深化战略合作[详细]













