中国信通院云计算与大数据研究所何宝宏:面向AI,数据技术体系正朝着“数智融合”方向演进
飞象网讯 12月13日,在“2026中国信通院深度观察报告会”上,中国信息通信研究院云计算与大数据研究所所长何宝宏就面向AI的数据发展分享了自身思考和见解。

数据的规模、质量决定大模型的上限
谈及在AI大模型发展中,数据扮演的角色,何宝宏分别从AI和数据的发展两个角度进行了解答。他表示,早期的人工智能是基于规则,和数据关系不大;而这一波以大模型为代表的人工智能,数据扮演着非常核心的角色。
从数据的角度来看,大数据上一波的核心驱动主要是推荐算法,典型的应用包括一些用户画像,风险控制、市场获客等;而这一波数据的热潮主要是以人工智能驱动,可以说数据在这一波人工智能大模型的发展中,起着非常核心的作用。“数据的规模、数据的质量决定着大模型的上限,所以能看到数据是重中之重。”
人工智能发展对数据提出新的需求和挑战
2025年以来,人工智能的发展呈现出一些新特征,对数据也提出了一些新需求。比如语言大模型,它的边际效应递减已经非常明显,所以语言大模型要进一步提高它的能力,就需要更高质量的数据。另外一方面,除了语言大模型,越来越多的关注点开始转向了多模态,无论是对语言大模型的持续优化,还是对多模态模型等数据都提出了一些新的需求、新的挑战。
何宝宏指出,为了进一步提高语言大模型的能力,就需要发展更高质量、覆盖范围更广的数据。为了提升语言大模型推理能力,围绕推理甚至应用如Agent等,需要结合场景和应用等一些私域的、行业的、专有的数据。对于多模态大模型的发展来说,就不能仅仅只有文字类,还需要音频、视频等,这些数据如何对齐,在数据发展中也提出新的需求和挑战。
数据技术正以体系化的方式发生巨大变革
在何宝宏看来,为应对这些新需求、新挑战,数据技术正以体系化的方式发生巨大变革。
具体来看,一方面,现有数据体系需面向人工智能进行定制化转型与适配。以数据治理为例,以往通用的治理模式,如今需结合人工智能的专用场景进行调整优化;即便是已有的DataOps体系,也需要衍生出面向AI的专属分支(DataOps For AI),重点推进数据安全治理等相关工作,本质上是现有数据领域工作向AI适配的转型。
另一方面,人工智能的发展也催生了数据领域的新情况、新问题,这是以往未曾出现的。当前这一波人工智能以生成式AI为核心,其生成的结果本身也属于数据范畴。随着近年来生成式AI的快速迭代,如今的数据格局已发生改变——人类产生的数据、传统互联网数据与AI合成/生成的数据日益交融,难以精准区分。后续,如何应对AI合成数据带来的挑战,尤其是如何规范AI合成数据在模型训练与迭代中的应用,已成为数据领域亟待解决的新课题。
何宝宏进一步讲到:“除了数据资源层面的变化,数据技术层面也需同步迭代升级。”受上述数据资源体系变革的驱动,数据技术正迎来一系列新调整:在数据存算领域,宏观层面上存算架构逐步向分布式、存算分离的方向发展,而面向本地或就近数据处理的需求,近存计算模式也愈发重要;同时,由于数据体量激增,需根据数据“温度”(热数据、温数据、冷数据)进行分级存储,对应的存储介质也需随之优化。在数据库技术领域,人工智能的发展同样提出了新要求——随着AI向多模态方向演进,传统单模态数据库已显现出效率偏低、成本偏高的问题,因此向量数据库、多模态数据库成为技术升级的重要方向。
最后,何宝宏强调,受人工智能技术发展的驱动,当前数据技术正经历全方位的巨大变革,其核心目标是实现数智深度融合。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
1ms城市算网筑基:四川千行百业数智焕新
当前,人工智能引领的新一轮科技革命和产业变革正加速推进,各行各业都在尝试以大数据、AI模型来升级业务,这对算力基础设施及其提供服务的灵活性提出了更高的要求。为更好地支持各行各业的..[详细]
手机轻松畅玩PC游戏?G胖引发玩家大猜想
PC游戏在手机上游玩不是新鲜事,PC游戏通过模拟器在手机上游玩也不是什么新鲜事,然而Steam亲自下场,让Arm设备能够运行PC设备,就绝对是一件值得关注的事了。毕竟前有SteamOS的成功,甚至能..[详细]
中国具身智能机器人市场呈六大发展趋势,2030年市场规模将达770亿美元
根据国际数据公司(IDC)发布《中国具身智能机器人应用市场分析与典型应用实践,2025》报告显示,在政策、资本与产业链的三重驱动下,中国具身智能机器人市场已完成从“技术突破”到“价值落..[详细]
中国电信柯瑞文:智能领航、智惠共生,全面拥抱人工智能推动数智生态高质量发展
当前,人工智能正以前所未有的广度和深度融入经济社会各领域,重塑生产方式、生活方式乃至治理模式。作为建设网络强国、科技强国、数字中国的重要力量,中国电信主动把握以人工智能为代表的..[详细]
趁AI之势 开数智新局 中国电信战略升级按下“AI+”加速键
12月5日,中国电信 2025 数智科技生态大会在广州正式启幕。本届大会由中国电信携手广大生态伙伴共同打造,以 “智能领航,智惠共生” 为主题,全面展示了中国电信 “五位一体” 智能云体系的..[详细]













