7月26日,在2025世界人工智能大会“AI焕新 产业共赢”企业人工智能产业发展论坛上,中国移动正式发布了原创提出并自主打造的多模型和智能体聚合及服务引擎MoMA(Mixture of Models and Agents),这是中国移动充分发挥自身优势禀赋、构建特色智能服务模式、加快实现人工智能全要素运营的标志性创新成果。

MoMA通过标准化接口自动感应和探索各类模型、智能体和工具,实现动态路由、智能规划、精准调度,提供高准确、高安全、高可靠、高效能的大模型推理服务。在模型回复质量持平的条件下,MoMA动态路由和调度九天各参数模型相较于固定大参数模型平均每百万使用量的推理速度提升42%,在数学、代码等典型场景中,速度提升为134%。
MoMA技术架构主要涵盖三大组成部分:MoMA模型、MoMA引擎及MoMA协议。MoMA模型,依据模型探测能力、智能体探测能力及对用户意图的识别理解,精准解析用户输入判断模型和智能体依赖关系及能力范围,自动选择最优方案,构建“实时感知-动态调整-持续验证”的循环链路,更好的适应数据变化、业务需求和环境波动,做最懂模型和智能体的模型;MoMA引擎,调度对象多样化,构建React模式,通过中心调度、权限集中的形式,实现主智能体、用户及智能体的多样化调度。通过分布式AI资源池,自动完成任务拆分与分发,实现去中心化调度以及模型、智能体的快速拓展,实现全局灵活调度,服务主动推送;MoMA协议,中国移动创新设计一套特色接入标准,既兼容业界通用MCP/A2A/OpenAI服务规范,又支持企业私有化需求,增强移动认证及安全通信等能力。
目前MoMA已应用于中国移动的灵犀智能体2.0,助力灵犀智能体2.0全面升级为跨领域、多任务、自规划的通用型智能体,为用户在“办公、生活、出行、家庭、通信”等多元化场景中提供特色服务。MoMA也将作为中国移动平台级MaaS服务的中枢引擎,可以紧扣行业应用场景需求,自动匹配及调用最优专家模型和专用智能体,解决行业客户大模型技术选型难、使用成本高、替换难度大等普遍痛点。
MoMA引擎的推出,是中国移动强化人工智能时代“供给者、汇聚者、运营者”定位的全新实践。通过MoMA引擎,中国移动将构建起百模互联、千智协同的全新产业协同生态,为我国人工智能产业形成能力聚合倍增和优质普惠服务的全新发展范式起到基础性和关键性驱动效应。