Cloudera:备份与安全,本质是AI经济学问题
Cloudera大中华区技术总监刘隶放
IDC《Global DataSphere Forecast》报告预计,到2028年,全球数据量将增长至393.9 ZB。其中,中国市场数据量到2029年将增长至136.12 ZB。这一增长趋势给业务连续性、数据保护与治理以及维护成本带来了更大压力,也使得“韧性”演变为一个AI经济学问题,每新增一个需要保留和保护的数据集,都会增加存储、备份运营、合规成本,以及下游 AI 质量与修复等方面的支出。
随着世界备份日(World Backup Day)和世界云安全日(World Cloud Security Day)的临近,真正的问题不在于企业是否备份了更多数据或增加了更多云安全控制措施,而在于这些投入能否以经济可持续的方式提升业务韧性。备份不能被视为一种可以无限扩容的保险。如果缺乏清晰的数据保留策略和有力的治理机制,数据韧性项目将耗费大量资金、增加运营负担,并且难以证明其合理性。当务之急是在业务中断发生时,企业首先应以适当的保护级别保护关键数据,从而实现预期的恢复结果。
有治理,韧性才能“有的放矢”
了解数据资产全貌是实现有效数据韧性的起点。企业需要清楚掌握现有数据的具体情况、使用方式以及对应的恢复要求。如果缺乏这种可视性,所有数据往往会视为同等重要,从而导致备份环境规模过大、恢复优先级不明确。
治理机制为企业提供了将数据保护列为优先事项的基础。企业根据业务影响对数据集进行分类后,便可以相应地分层设定保护级别。对于其他非关键数据,可以采用成本更低的保护方式,或缩短其保留期限。
界定关键数据并不仅仅是技术问题,还取决于业务承诺以及中断后可能带来的后果,例如监管处罚、合同义务、运营风险或声誉损失。当企业基于治理角度做出韧性决策时,数据保护与保留便不再是默认的IT配置,而是与业务风险精准匹配后的审慎选择。
别再为劣质数据买单
当数据治理优先级不清晰时,许多企业往往倾向于“以防万一”地保留并备份数据。随着时间推移,这种做法会积累大量几乎没有运营价值的信息。
根据《2025埃森哲中国企业数字化转型指数》报告,在中国,仅有29%的企业认为自身数据质量表现优异,反映出大多数企业仍面临数据过于分散、数据质量待提高等挑战。然而,企业仍在持续存储和保护这些低质量数据,导致备份规模不断扩大、恢复过程日益复杂。备份环境越大,在恢复可信业务运行前需要验证和恢复的数据就越多,其影响远不止基础设施成本。
在采用AI驱动工作流的企业中,这种影响可能会被放大。治理不善的数据往往直接流入分析管道和AI模型,从而引入噪声,降低洞察结果的可靠性。最终形成一个恶性循环,企业不仅需要投入资源存储和保护低价值数据,还需要再次投入更多资源来纠正这些数据在下游系统中引发的问题,从而“付出双重成本”。
恢复测试是检验治理决策在生产中是否有效的关键
只有在能够带来可靠恢复结果的前提下,治理策略才具有实际意义。定期进行数据恢复与灾难恢复测试,可以验证保护层级是否真正符合业务优先级。这些测试通常能揭示关键信息,例如某些已备份的数据在恢复中并未发挥作用,或某些系统需要比最初设想更高等级的保护。测试还可以揭示数据管道之间隐藏的依赖关系,通过数据血缘关系帮助团队按正确顺序进行恢复,从而在无需恢复全部数据的情况下,尽快恢复可信的运营。
企业领导可以通过跟踪一组指标即可抓住工作重点。这些指标包括灾难恢复计划是否定期测试、恢复时间目标是否明确设定、测试结果是否持续达标,以及每一轮测试后是否落实改进措施。
随着时间推移,这将形成一个强化治理的反馈闭环。恢复测试所获得的洞察为指导清理工作、策略更新和运营改进提供了依据,帮助企业保持备份环境的高效性,并与业务需求持续保持一致。
减少数据蔓延,避免累计韧性成本
在混合云和多云环境中,缺乏控制的数据复制会增加需要进行安全保护、治理和备份的数据量。当数据分散在过多的系统、副本及未受管控的路径中时,也会提高AI 应用的整体成本。
因此,将数据迁移至第三方SaaS平台或外部服务应被视为一项深思熟虑的治理决策,而非权宜之计。一旦数据离开受控环境,其可见性将下降,控制措施更难执行,恢复工作也更难协调。
跨环境的一致性同样重要。本地部署与云平台需要采用统一的治理方式,避免因碎片化管理和保护而导致的数据集重复、备份环境臃肿。如Iceberg REST Catalog 协议等开放标准,可以通过提升引擎和数据目录之间的互操作性,减少仅为实现跨平台使用而额外复制数据的需求。
其结果是重复数据减少、数据所有权和保留策略更加清晰,备份占用空间更小、更整洁,维护成本也更低。
企业领导的关注要点
世界备份日与世界云安全日应该提醒我们,现代企业的韧性并不意味着对数据不断复制或堆砌控制措施,而在于通过有针对性、受管控的决策,帮助企业避免为冗余、过时、琐碎甚至根本未知的数据支付不断增长的费用。
治理机制能够优化备份支出、缩短恢复时间并提升AI 的可靠性。借助这一机制,企业将不再为那些企业不了解、不需要、甚至一开始就不应该保留的数据支付高昂的保护成本。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
刘烈宏:以高质量数据赋能AI创新,加快培育智能经济新形态
当前,人工智能发展正经历着一场前所未有的加速演进,一个又一个热点事件接连涌现。在技术创新与商业应用的双轮驱动下,人工智能产业规模持续增长,从去年春节DeepSeek开源模型出圈,到机器..[详细]
AI赋能中小企业仍处于初期探索阶段
新一代人工智能正在全球范围蓬勃兴起,成为新一轮科技革命和产业变革的战略性技术和重要驱动力量。开展人工智能赋能中小企业高质量发展研究,既是人工智能技术推进规模化商业化应用、加速向..[详细]
华为启动“乾坤 · 众智同行”计划:与伙伴共同创造、共同受益,把中国方案带向世界
AI大潮汹涌而来,千行百业都在向云端、向智能化迁移,期待新的ICT技术方案能够带来更高的工作效率、更好的服务品质、更理想的用户体验。不过每个行业的应用场景不同,每个企业的服务对象和市..[详细]
5G-A大上行成产业共识,差异化体验赋能行业升级
数据显示,截止2026年1月,全球已有374个运营商部署5G网络,为各国用户提供了更好的体验,也涌现了很多新的需求,比如高清直播需要大上行,人群密集场所需要大容量,工业智能化需要低时延等..[详细]
6G时代的智能设备:反思自身、协同彼此、共同推理
经历了MWC26,很多人都对6G有了更加直观的认识,如同5G时代的高速率、低时延、广连接,6G给出的答案是连接、广域感知和高性能计算。不过,正如5G当初所畅想的智能工厂与万物互联,6G自然也需..[详细]
黄仁勋:需要更多Token与工程师,这是AI革命的开工典礼
3月17日,在美国加州圣何塞开幕的GTC 2026大会上,英伟达创始人兼CEO黄仁勋开始了备受瞩目的主题演讲。来看他演讲的观众需要排队,现场人山人海。这场演讲不仅有黄仁勋对过去二十年技术积累..[详细]
我国算力规模与质量协同跃升,行业赋能效益加速释放
当前,以大模型为代表的人工智能应用驱动全球计算技术进入新一轮创新爆发期,先进计算硬件、软件、算法之间深度融合、协同演进,量子计算、类脑计算等前沿计算架构加快突破,算力需求呈现指..[详细]
如何推进算电协同,筑牢绿色高效硬底座?
随着AI浪潮的快速发展推进,全社会对算力的需求持续扩大,今年的《政府工作报告》也重点提出,要深化拓展“人工智能+”,实施超大规模智算集群、算电协同等新基建工程。在AI算力需求井喷的..[详细]
平时不戴眼镜的高通卡图赞,谈可穿戴设备杀手级AI应用
“我本人不戴眼镜,只在户外戴太阳镜。所以对我来说,可能挂坠或项链这类形态会更舒服,我可以戴在胸前,随时都能完成视觉交互。”卡图赞随后又以个人视角表..[详细]













