云灾备建设指南 (2024) 云计算开源产业联盟 ━━2024年5月━━ -0- 版权声明 本报告版权属于云计算开源产业联盟,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:云计算开源产业联盟”。违反上述声明者,本联盟将追究其相关法律责任。 ■编委会: 马飞、苏越、陈凯、周倩、金天骄、朱正秋、徐礼长、王赛钰、赖志强、谢枫、王骏翔、杨磊、杨梅、田园、王立波、高健凯、司华、胡洋、赵文敬、林墅、李伟明、李昊楠等。 报告在编写过程中,历经内容起草、模型构建、调研访谈、数据分析、征求意见等阶段,得到了诸多单位的大力支持,包括:中国信息通信研究院、浙江移动、上海数腾软件科技股份有限公司、上海爱数信息技术股份有限公司、中远海运科技股份有限公司、中电信数智科技有限公司、浪潮数据技术有限公司、曙光云计算集团有限公司、杭州美创科技股份有限公司等。由于数据来源以及样本企业数量限制,无法考察领域内全部企业,本报告如有不足之处欢迎指出。 前言 随着云计算成为产业数字化的重要技术底座,企业通过大力建设更加灵活、可靠的云灾备系统来有效预防和减少灾难或意外故障的风险,实现业务的快速恢复,保护企业核心数据,提升客户信任和企业竞争力。然而,企业在云灾备建设的过程中,仍然面临着数据恢复有效性难以保障、管理体系仍不完善、产品兼容性较差、副本数据缺乏利用等挑战,极大影响了企业云灾备建设效能。 为了探明我国各行业企业云灾备建设的发展现状,推动产业高速发展,促进产业良好生态形成,助力云灾备产业规模化落地,中国信息通信研究院牵头编制《云灾备建设指南(2024)》。本报告总结了云灾备的发展历程与背景,洞察并分析了企业云灾备建设过程中面临的诸如技术、产品、管理体系等方面的困难与挑战,并归纳云灾备的建设路径,旨在为企业提供云灾备建设全流程的参考。 目录 一、云灾备概述1 (一)云灾备发展背景1 (二)云灾备发展历程2 (三)云灾备的优势4 二、云灾备产业不断发展,灾备建设仍面临诸多问题6 (一)灾备环节存在技术难点,数据恢复有效性难以保证6 (二)云服务故障频发,云灾备管理体系建设仍需完善7 (三)灾备产业上下游难以兼容,亟需加强产品适配8 (四)灾备数据缺乏利用,数据价值有待挖掘9 三、五大措施夯实企业云灾备建设之路10 (一)云灾备建设需求分析,保障灾备建设可行性10 (二)云灾备建设规划设计,提升全流程建设效能11 (三)云灾备建设方案实施,稳妥高效推进云灾备建设12 (四)云灾备建设赋能数据管理,技术创新助力降本增效13 (五)云灾备建设效果评估,促进企业灾备能力持续提升13 四、企业云灾备建设实践14 (一)芜湖市政务云同城异构灾备建设案例14 (二)厦门市政务云多云异构灾备云建设案例17 (三)浙江某连锁餐饮企业云上跨AZ灾备建设案例20 五、云灾备发展展望23 (一)灾备系统兼容性不断加强,灾备行业生态日益开放.23 (二)灾备数据应用场景不断扩展,聚焦挖掘数据新价值.24 (三)依托云灾备标准体系,逐步提升云灾备建设成熟度.24 一、云灾备概述 (一)云灾备发展背景 云灾备的发展主要源于信息化时代对数据安全与业务连续性的迫切需求。传统灾备行业已发展近半个世纪,从手动磁带备份的计算机发展初期,到远程磁盘备份、建立异地数据备份中心,再到实时备份数据保护,灾备技术的发展伴随着底层基础架构不断演进。 企业数据量爆炸式增长、数据价值不断提升,云灾备价值逐步显现。在数字化时代,企业面临着日益庞大和多样化的数据流,而这些数据不仅是信息的载体,更是企业的重要战略资源。因此,如何有效地管理、保护和恢复这些数据变得尤为关键。数据量的急剧增长,传统灾备压力激增,面临着备份和恢复时间长、管理复杂度高、灾备场景受限等问题,而云计算作为新一代信息技术的核心引擎为传统灾备行业注入了新的活力。云灾备将生产数据灾备到弹性伸缩、按需付费的云服务平台,成为了适应云计算和大数据时代下的新灾备理念。随着云计算技术的不断成熟,云灾备的应用优势突出,灾备云化 转型提速。云计算技术的发展不仅为灾备建设提供了灵活可扩展的数据存储和恢复能力,还显著降低了灾备建设的成本和复杂性。在这种趋势下,越来越多的企业开始认识到灾备云化的重要性,纷纷加快灾备云化转型的步伐。通过利用云服务提供商的先进技术和资源,企业能够实现更高效的数据保护,确保在面临灾难时能够快速恢复业务运 行。云计算技术的成熟为云灾备的发展注入了强大动力,推动着灾备云化转型进入一个新的快速发展阶段。根据IDC统计,2023年中国数据灾备市场收入达到7.3亿美金,同比增长11.8%;未来五年,中国数据灾备市场预计将以10.2%的复合年增长率增长,市场规模预计在2028年达到13亿美元。各行业的云灾备热度也持续上涨,在政务、金融、电信、医疗、教育等领域均有落地应用,其中政务云建设成熟度最高,在行业应用中占比达到50%以上。 数据合规性相关政策正推动灾备体系逐渐成熟。近些年,国家出台了一系列相关政策和法律法规,灾备建设和业务系统的连续性也越来越受到企业重视。《中华人民共和国网络安全法》明确规定关键信息基础设施需要“对重要系统和数据库进行容灾备份”,并“制定网络安全事件应急预案”。“等保2.0”二级及以上的安全通用要求里均规定需要提前制定备份及恢复策略,确保灾备系统的可用性和可靠性,并且等级保护对象范围在传统系统的基础上纳入了云计算这一新型数字基础设施。2023年,工业和信息化部等六部门联合发布了《算力基础设施高质量发展行动计划》重要文件,明确提出到2025年重点行业核心数据和重要数据的灾备覆盖率要达到100%。可以预见,合规性要求的提高,将很大程度上推动灾备行业及云灾备技术的发展,并对关键行业带来重要影响。 (二)云灾备发展历程 云灾备的发展历程分为三个阶段。第一阶段(2006-2012),技术 探索阶段。在云计算概念尚未普及的早期阶段,一些技术先驱开始探索利用云计算技术来改善灾备解决方案。这一阶段的云灾备主要局限于一些基础的概念探索和实验性的应用,尚未形成成熟的商业产品和解决方案。例如2006年,亚马逊网络服务发布AmazonS3(SimpleStorageService),提供的一种对象存储服务,是首个商业化的云存储服务之一,为开发者和企业提供了可扩展、安全、可靠的存储方案,云存储的发展为云灾备的产生奠定了基础。 第二阶段(2012-2018),技术演进阶段。灾备技术的早期阶段使用数据复制技术以存储搭配备份软件的方式,通过客户端软件对目标应用数据定期获取,提供多副本冗余以进行数据保护。传统备份技术稳定,但受限于备份数据不能直接挂载使用,因此在业务连续性方面较为薄弱。随着技术发展,CDP(ContinuousDataProtection)技术通过实时备份数据的变化,提供了较短的恢复点目标(RPO)和恢复时间目标(RTO)。这种持续的数据保护方式为组织提供了更高的数据恢复保障。CDM(CopyDataManagement)是在CDP基础上的进一步发展。CDM采用首次完全备份,随后采用永久增量备份方式。它利用CBT(ChangedBlockTracking)等块修改追踪技术获取增量数据,在备份期间将增量数据与之前的全量数据合成,形成新的全量备份。CDM的核心理念是减少数据备份和恢复的冗余,从而提高备份和恢复的效率和可靠性。随着云计算技术的逐渐成熟和普及,云灾备开始从简单的数据备份向更全面的灾备解决方案发展。 第三阶段(2018-至今):服务化与行业应用阶段。云服务提供商 不断完善其产品和服务,并提供灾备即服务(DRaaS),简化了灾备的建设和管理。DRaaS是云灾备技术的更进一步的发展,将灾难恢复功能提供为一种云服务。DRaaS提供商在超大规模云环境中提供解决方案,客户可根据需求在云端备份数据和应用程序,快速恢复业务以最大程度减少停机时间和数据丢失。随着云灾备技术的普及和发展,越来越多的企业将其整合到业务流程中,特别是在金融、电信等业务连续性要求极高的领域,云灾备成为了不可或缺的一环。 在金融领域,随着金融科技的迅猛发展,各类金融机构对于数据安全和业务连续性的需求日益增加。云灾备技术的应用使得金融机构能够更加高效地应对各种风险和灾害,保障资金流动和交易安全。同时,通过云灾备,金融机构还能够更好地满足监管机构对于数据备份和灾备计划的要求,提高整体合规性。 电信行业也是云灾备技术的重要应用领域之一。作为信息基础设施的重要组成部分,电信网络的稳定性和可靠性对于整个社会的运行至关重要。通过云灾备,电信运营商能够更好地应对自然灾害、网络攻击等风险,保障通信网络的稳定运行,为用户提供持续、可靠的通信服务。 总的来说,随着云灾备技术的日益成熟,其在各个行业中的应用将更加普及,成为保障企业业务连续性和安全性的关键工具。这一广泛应用的背后,是云灾备技术本身的诸多优势所驱动。 (三)云灾备的优势 云灾备可以为政企提供高效、灵活的灾备解决方案,保障业务连 续性并应对不可预见的灾难事件。云灾备采用创新的灾备服务模式,涵盖了传统物理主机、虚拟主机等IT系统,向私有云或公有云等云端化灾备转变,以及新业务形态下灾备端云化和云与云之间的灾备等,从而满足企业在多云环境中的灾备需求,保障系统遭受灾难时数据安全、业务快速恢复。相比较以往的灾备方式,云灾备具有众多优势。 云灾备结合云平台的计算、存储和网络等丰富资源,具备明显成本优势。首先云灾备产品支持按需使用,按量付费,云灾备采用云基础设施或DRaaS模式,允许用户根据实际需求选择重要的系统和数据进行备份,用户只需为实际使用的资源量付费,有效减少了资源浪费,提高了效率。传统的灾备解决方案需要建立和维护昂贵的物理设备和基础设施,而云灾备则可以灵活地调整资源,大大降低了成本。 其次,云灾备方案具备高可靠性,云灾备采用分布式架构和虚拟化技术,在多个地理位置备份和复制数据。在灾难期间,通过网络和物理隔离技术确保数据的完整性;同时采用多副本机制来保证数据可靠性,当本地数据中心出现故障后,业务流量直接切换至云上灾备中心,并立即恢复业务,从而保证了高可用环境下业务不间断运行。 同时,云灾备覆盖了全生命周期的灾备服务,DRaaS服务通常由专业的服务提供商托管和管理,客户无需担心灾备解决方案的日常维护和管理工作,降低了灾备使用与维护门槛,减轻了IT团队的负担。此外,跨地理容灾能力也是云灾备的一大优势,许多云服务提供 商具有全球数据中心的分布,企业可以轻松地将数据备份到不同地理位置的数据中心,实现跨地区灾备,从而提高数据的安全性和可靠性。 综上所述,云灾备可以为企业提供更高的业务连续性、数据可用性和灾备容灾能力,同时降低总体成本和管理负担,为政企数据资产和业务系统提供高性价比的全方位保障。 二、云灾备产业不断发展,灾备建设仍面临诸多问题 (一)灾备环节存在技术难点,数据恢复有效性难以保证企业建设云灾备的过程中,在备份、验证、演练、容灾和恢复环 节仍面临一系列挑战。首先,在备份环节,现有数据备份大多为文件 级备份,但文件级备份需要解析文件类型,会占用源机的大量资源,因此企业被迫对其做定时备份。也有企业尝试进行磁盘块级备份,但其技术门槛较高。其次,在验证环节,企业对于非结构化数据,如办公文档、文本、图片等数据的验证只能采取人工查看的方式,打开每个文件进行验证。但随着数据量的增大,这种方式会占用大量的人力资源且费时费力。对结构化数据如SQL等数据库的验证则更为困难,需要搭建一套与原环境一样的数据库才能打开进行校验,其成本和技术门槛较高,因此企业一般不对其做验证。对于演练环节,目前大多数企业做演练需要搭建海量环境,解决历史补丁、中间件、各种复杂逻辑以及配置文件的问题。花费大量的人力、物力、财力,还需要保障全量数据的传输完成,才能进行演练。但演练带来的风险却是企业无法承受的,因此对大多厂商来说演练较为困难。最后,在恢复环节,很多企业面临将业务从备机回切到主生