必读视频专题飞象趣谈光通信人工智能低空经济5G手机智能汽车智慧城市会展特约记者

中国科学院自动化所研究员王金桥:多模态大模型迈入主动交互新时代丨2025移动通信高质量发展论坛

2025年11月22日 09:50CCTIME飞象网

11月21日,以“非凡‘十四五’ 聚力启新程”为主题的2025移动通信高质量发展论坛在湖北武汉举办。中国科学院自动化研究所副总工程师、武汉人工智能研究院院长王金桥在论坛上作题为《多模态大模型:迈入主动交互新时代》的主旨发言。

王金桥表示,多模态大模型已成为AI产业应用的主要方向。从感知理解到生成创造,大模型技术成为通用智能技术的主流探索方向。当前,大模型在“大算力、大数据、大参数”的驱动下持续升级。然而,仅靠增大参数量带来的性能提升已日渐平缓。因此,发展重点正从规模扩张转向智能体、合成数据和推理计算等新方向。这种计算范式的转变,也导致了模型在推理和“思考”过程中的算力需求显著增加。

王金桥介绍,人工智能的发展路径是从生成式AI到AI智能体,再到物理交互的AI。在生成式AI阶段,数据决定智能模型的高度;在AI智能体阶段,记忆决定Agentic的应用规模;在物理AI阶段,环境决定模型自演进。

对于中美两国在人工智能上的差距,王金桥表示,中美两国之间的差距快速缩小,在LMSYS聊天机器人竞技场中,2024年1月,美国顶级模型的表现比最佳中国模型高出9.26%;而到2025年2月,这一差距缩小至仅为1.7%。我国人工智能创新水平已经进入世界第一梯队,2020年,全球AI期刊论文中引用中国论文的比例达到20.7%,首次超过美国的19.8%。

王金桥表示,目前的差距主要体现在硬件、数据、技术和人才上。在硬件上,高端AI算力资源不足,同时也缺乏足够的资金来支撑智算集群的高昂训练与运营成本;在数据上,中文高质量数据资源小于英文,差距达到20-30倍,需要高质量数据清洗;在技术上,通用基础大模型开发是一个系统工程,需具备分布式训练、模型优化等技术经验与工程化能力;在人员上,把know-how数据转化成Q&A的能力,需要大量的工程师。

2024年图灵奖得主、“强化学习之父”理查德·萨顿说过:“2024年人类数据正在迅速逼近极限,智能体将越来越多地通过与世界的交互来进行学习,潜力将远超以往。”

对此,王金桥表示,新一代人工智能研究体系已经形成。AI基础研究范式正从传统数据智能向大数据智能、跨媒体智能、群体智能、混合增强智能、自主智能等人工智能五大形态转变。新一代人工智能基础研究框架推动人工智能基础理论创新,知识引导、视觉知识、群智涌现、混合增强智能等多学科交叉发展。

王金桥介绍了紫东太初多模态大模型的发展和应用情况。紫东太初多模态大模型4.0现已具备多模态理解、文本数学、逻辑思维、视觉问答、GUI智能体、工具调用六大能力,对标GPT-4.1-nano、GPT-4o等先进模型。在服务科学研究上,紫东太初多模态大模型打造了面向科研全流程的科学智能平台,可自主规划及调用超过300个科学计算工具,实现工具的协同编排和便捷调用,可自动识别科研任务、智能编排并调度最优工具链,提升科研流程效率,支持用户灵活接入自有智能体与工具,快速搭建专属科研应用。在服务千行百业上,基于多模态大模型构建的长江流域模拟器,可以实现对长江流域绿色发展水平的评估,并对水生态、防洪、航运、供水等进行实时监测预警。

编 辑:霏雯
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
推荐阅读

精彩视频

精彩专题

关于我们广告报价联系我们隐私声明本站地图

CCTIME飞象网 CopyRight © 2007-2025 By CCTIME.COM

京ICP备08004280号-1 电信与信息服务业务经营许可证080234号 京公网安备110105000771号

公司名称: 北京飞象互动文化传媒有限公司

未经书面许可,禁止转载、摘编、复制、镜像