中国信息通信研究院“方升”智测研讨会在京召开 共绘AI评测生态新蓝图
2026年2月3日,中国信息通信研究院“方升” 智测研讨会在京成功召开。本次会议以“人工智能评测体系的技术创新与产业实践”为核心议题,旨在推动构建科学、系统、可信的AI评测生态,为我国人工智能产业的高质量发展提供有力支撑。石景山园管委会区科委主任高延娜、中国信息通信研究院副院长魏亮出席会议并致辞。同时,本次研讨会汇聚了来自北京市经信局、石景山区政府相关部门,以及哈尔滨工业大学、北京航空航天大学、清华大学、中科院自动化所等高校与科研机构,并吸引了一批领军企业及行业协会代表,共计200余位专家与业内人士共襄盛会。

多方齐聚,共谋AI评测新发展
会议伊始,石景山园管委会区科委主任高延娜在致辞中表示,石景山区正加速向智能时代转型,已构建起“主导+特色+未来”梯次发展的现代化产业体系。2025年,石景山区地区生产总值达1379.4亿元,同比增长6.5%,软件和信息技术服务业实现增加值625亿元,增长11.3%,为人工智能产业发展奠定了坚实基础。石景山区通过全面谋划布局、注重数智创新、拓展应用场景三大举措,联合信通院共建人工智能大模型及软硬件评测工信部重点实验室,构建全链条评测服务体系,打造AI创新高地。

北京市石景山园管委会区科委主任 高延娜
中国信通院副院长魏亮在致辞中强调,党中央、国务院高度重视人工智能产业高质量发展,构建统一、科学、权威的基准测试体系对牵引技术创新、加速应用落地、增强国际话语权具有重要意义。他介绍,中国信通院在工信部指导下研发的“方升”大模型基准测试体系已完成从1.0到3.0的升级,形成了覆盖基础属性、通用能力、行业应用与未来智能的全维度评测框架,并已向部委报送多轮测试报告,为决策提供了重要参考。未来,研究院将持续完善评测体系、强化技术平台支撑,并与产学研各界深化协同,共建开放的人工智能评测生态。

中国信息通信研究院副院长 魏亮
前沿分享,洞察AI技术新趋势
研讨环节,多位专家带来了前沿研究成果分享。哈尔滨工业大学人工智能研究院院长刘劼带来了《智能体+的思考与实践》主题报告,剖析了智能体技术的演进路径与应用挑战,提出了CEDAR通才智能体体系结构,为智能体的规范化发展提供了新思路。北京航空航天大学软件学院院长胡春明聚焦《智能化软件认识与实践探索》,探讨了人工智能对软件形态、开发范式的深刻影响,以及智能化软件的可信保障路径。中科院自动化所副总工程师、紫东太初大模型中心常务副主任王金桥分享了多模态人工智能的发展趋势,并介绍了紫东太初大模型在国产化适配、多模态交互等方面的实践成果。清华大学计算机系副研究员、人工智能研究院院长助理苏航则阐述了数据驱动的世界模型路径演进,展现了物理智能与具身智能的前沿探索。

此外,高等教育出版社信息技术部主任杨京峰介绍了教育大模型基准测试能力体系建设情况,提出了业务驱动的龙凤教育大模型架构。中国信通院人工智能研究所平台与工程化部副主任李荪发布了政务大模型基准测试能力体系,联合多方构建政务评测数据集,推动政务大模型安全合规落地。
权威发布,揭示AI评测新成果
会上,中国信通院人工智能研究所所长魏凯发布了《2025“方升”基准测试观察》。据介绍,“方升”3.0体系涵盖基础属性、通用能力、任务能力、行业能力、未来高级智能能力五大层次,已形成780多万条动态更新的测试数据,为模型选型与应用提供了科学依据。
评测结果显示,语言大模型基础能力国内模型进展显著,推理能力上国内模型仍有差距,代码能力则表现优异。具体来看,谷歌的Gemini 3 Pro位列大语言推理能力榜单第一名,OpenAI的GPT-5.2和阿里巴巴的Qwen3-max-thinking位居第二和第三,其中Qwen3-max-thinking是国内最好的推理模型。月之暗面的Kimi K2.5和深度求索的DeepSeek-V3.2-Thinking分别排名国内第二和第三。在代码任务方面,Anthropic的Claude 4.5模型排名代码榜单首位,月之暗面的Kimi2.5在国内模型中表现最优。
共建生态,携手推动AI评测新发展
会议还举行了第二批“方升”行业基准测试体系共建仪式。中央财经大学、中国农业大学、中国海洋大学、北京第二外国语学院、北京工业大学、中国信通院、中国司法大数据研究院、高等教育出版社、中医四诊数智装备研发北京市重点实验室、中车工业研究院、南钢人工智能研究院、中移齐鲁创新院、青岛港国际股份有限公司、枫清科技等14家单位代表上台参与启动,将携手研制贴近真实业务场景的评测基准,推动大模型从“表现优异”迈向“应用卓越”。

第二批 “方升” 行业基准测试体系共建启动仪式
专题研讨,深化AI评测技术协作
本次研讨会同步设立了六场专题研讨会,围绕基础模型评测、全模态和世界模型评测、智能体测试、代码大模型基准测试、数据集质量评估、行业模型评估等议题开展了闭门研讨。与会专家深入交流,共同探索AI评测技术的新路径、新方法,为推动我国人工智能评测体系的建设与发展提供了重要交流平台。
此次“方升”智测研讨会的成功举办,不仅展示了我国在人工智能评测领域的最新成果,也为产学研各界搭建了一个开放、协同、可持续的交流平台。未来,中国信通院将继续深化面向AGI、产业应用与工程效能的评测能力建设,联合产学研各界共建开放、协同、可持续的人工智能评测生态,为我国大模型技术创新与行业落地提供权威、科学的评测支撑,助力我国人工智能产业健康有序发展。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
盘点2025|光纤光缆:周期性放缓之下,确定性开始凸显
在2025年,光纤光缆厂商们习惯于用“周期性”一词来描述当前的困难,相比于宽带普及、4G升级换代带来的流量需求猛增这一巨大业务增长。可如今在刷着短视频、看着带货的新日常生活常态下,尽..[详细]
盘点2025|人工智能:破局前行、以智启新,同赴人机共生新未来
2025年,人工智能行业迎来技术迭代与价值落地的双重关口。这一年里既延续着近年来的高速增长态势,也迎来从野蛮生长向规范提质的深刻转型。 [详细]
盘点2025|算力行业:量质齐升的进阶之路
在数字经济加速渗透全球经济社会各领域的今天,算力已成为继电力、水资源之后的关键生产要素,是支撑数字中国建设、推动高质量发展的核心基础设施。算力的规模与质量直接决定了数字经济的发..[详细]
盘点2025|芯片:AI依旧是挖潜点,应用进一步多样化
时至2025年年底,人们已经开始渐渐习惯,有事听听AI给出的参考意见。其背后的算力支撑也在逐步加强,像是更先进的制程,以及向更多端侧设备的拓展。另一方面,AI又一石激起千层浪,机遇与需..[详细]
盘点2025 | 从5G到6G:深耕与突破并行,开启智能连接新纪元
2025年,全球通信产业站在了一个关键的历史交汇点。这一年既是“十四五”规划的收官年,5G建设成果全面转化的验收年,也是“十五五”规划启幕,6G布局从技术探索迈向工程落地的奠基之年,更..[详细]
盘点2025|量子信息:三大领域技术持续演进,产业发展未来可期
以量子计算、量子通信和量子精密测量为代表的量子信息技术是挑战人类调控微观世界能力极限的世纪系统工程,是对传统技术体系产生冲击、进行重构的重大颠覆性创新,将引领新一轮科技革命和产..[详细]
盘点2025|2025年智能终端趋势洞察:AI重构体验,超级终端时代加速到来
2025年,全球智能终端行业站在了技术革新与生态重构的十字路口。AI技术的规模化渗透、折叠屏形态的成熟落地、跨设备协同的深度演进,正在重塑终端产品的价值逻辑与市场格局。[详细]
“易中天”组合业绩狂飙:高速光模块成增长引擎
谁能想到,马年的春节还没有过,光器件行业的春天就先来了。而坐上火箭的光纤价格,竟成为光器件行业开启狂飙增长的序幕。2026年1月,G.652.D单模光纤价格创下近七年新高,平均价格突破40元/..[详细]
华为超节点:用系统创新重构 AI 算力新范式
伴随着AI的快速崛起,专为AI提供充足算力支撑的“超节点”技术在2025年迅速走红,华为先后推出了基于昇腾芯片的万卡超节点产品和50万卡、百万卡超节点集群产品,阿里、字节、腾讯、浪潮等企..[详细]
2026手机市场开局遇寒流 市场结构悄然生变
2026年伊始,尚处于温和复苏阶段的全球智能手机市场,便遭遇了一记“寒流”。据媒体消息,受上游供应链存储涨价影响,多家手机厂商近日下调全年整机订单数量,小米、OPPO下调超20%,vivo下调..[详细]













