每日微信报
人物专访监管
制造芯片
6G 运营
大数据物联网
移动互联网量子
云计算互联网
报告卫星

中国科学院自动化所研究员王金桥：多模态大模型迈入主动交互新时代丨2025移动通信高质量发展论坛

2025年11月22日 09:50CCTIME飞象网

11月21日，以“非凡‘十四五’ 聚力启新程”为主题的2025移动通信高质量发展论坛在湖北武汉举办。中国科学院自动化研究所副总工程师、武汉人工智能研究院院长王金桥在论坛上作题为《多模态大模型：迈入主动交互新时代》的主旨发言。

王金桥表示，多模态大模型已成为AI产业应用的主要方向。从感知理解到生成创造，大模型技术成为通用智能技术的主流探索方向。当前，大模型在“大算力、大数据、大参数”的驱动下持续升级。然而，仅靠增大参数量带来的性能提升已日渐平缓。因此，发展重点正从规模扩张转向智能体、合成数据和推理计算等新方向。这种计算范式的转变，也导致了模型在推理和“思考”过程中的算力需求显著增加。

王金桥介绍，人工智能的发展路径是从生成式AI到AI智能体，再到物理交互的AI。在生成式AI阶段，数据决定智能模型的高度；在AI智能体阶段，记忆决定Agentic的应用规模；在物理AI阶段，环境决定模型自演进。

对于中美两国在人工智能上的差距，王金桥表示，中美两国之间的差距快速缩小，在LMSYS聊天机器人竞技场中，2024年1月，美国顶级模型的表现比最佳中国模型高出9.26%；而到2025年2月，这一差距缩小至仅为1.7%。我国人工智能创新水平已经进入世界第一梯队，2020年，全球AI期刊论文中引用中国论文的比例达到20.7%，首次超过美国的19.8%。

王金桥表示，目前的差距主要体现在硬件、数据、技术和人才上。在硬件上，高端AI算力资源不足，同时也缺乏足够的资金来支撑智算集群的高昂训练与运营成本；在数据上，中文高质量数据资源小于英文，差距达到20-30倍，需要高质量数据清洗；在技术上，通用基础大模型开发是一个系统工程，需具备分布式训练、模型优化等技术经验与工程化能力；在人员上，把know-how数据转化成Q&A的能力，需要大量的工程师。

2024年图灵奖得主、“强化学习之父”理查德·萨顿说过：“2024年人类数据正在迅速逼近极限，智能体将越来越多地通过与世界的交互来进行学习，潜力将远超以往。”

对此，王金桥表示，新一代人工智能研究体系已经形成。AI基础研究范式正从传统数据智能向大数据智能、跨媒体智能、群体智能、混合增强智能、自主智能等人工智能五大形态转变。新一代人工智能基础研究框架推动人工智能基础理论创新，知识引导、视觉知识、群智涌现、混合增强智能等多学科交叉发展。

王金桥介绍了紫东太初多模态大模型的发展和应用情况。紫东太初多模态大模型4.0现已具备多模态理解、文本数学、逻辑思维、视觉问答、GUI智能体、工具调用六大能力，对标GPT-4.1-nano、GPT-4o等先进模型。在服务科学研究上，紫东太初多模态大模型打造了面向科研全流程的科学智能平台，可自主规划及调用超过300个科学计算工具，实现工具的协同编排和便捷调用，可自动识别科研任务、智能编排并调度最优工具链，提升科研流程效率，支持用户灵活接入自有智能体与工具，快速搭建专属科研应用。在服务千行百业上，基于多模态大模型构建的长江流域模拟器，可以实现对长江流域绿色发展水平的评估，并对水生态、防洪、航运、供水等进行实时监测预警。

编辑：霏雯

飞象网版权及免责声明:
1.本网刊载内容，凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有，未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载，请必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和飞象网来源。
2.凡注明“来源：XXXX”的作品，均转载自其它媒体，在于传播更多行业信息，并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题，请在相关作品刊发之日起30日内与本网联系，我们将第一时间予以处理。
本站联系电话为86-010-87765777，邮件后缀为cctime.com，冒充本站员工以任何其他联系方式，进行的“内容核实”、“商务联系”等行为，均不能代表本站。本站拥有对此声明的最终解释权。

中国科学院自动化所研究员王金桥：多模态大模型迈入主动交互新时代丨2025移动通信高质量发展论坛

彩云之南，向新而行：解锁数智云南新场景、新活力

折痕有望消灭，但折叠屏手机又添新课题？

从规模破局到质效突围：5G工厂迈入量质齐升新赛道

信息光子技术产业正加速发展，并进入重要战略机遇期

中国信通院正式发布2026深度观察十大趋势

精彩视频

精彩专题