多云数据存储白皮书 (2023年) 2023年3月 参编单位 中国信息通信研究院阿里云计算有限公司华为技术有限公司京东云计算有限公司 北京火山引擎科技有限公司天翼云科技有限公司 中移(苏州)软件技术有限公司中电信数智科技有限公司 联通数字科技有限公司新华三技术有限公司 曙光信息产业(北京)有限公司浪潮电子信息产业股份有限公司联想凌拓科技有限公司 中电云数智科技有限公司上海道客网络科技有限公司 杭州飞致云信息科技有限公司北京佳杰云星数据科技有限公司云宏信息科技股份有限公司 安超云软件有限公司 北京星辰天合科技股份有限公司上海爱数信息技术股份有限公司深圳市杉岩数据技术有限公司深圳市泛联信息科技有限公司 华瑞指数云科技(深圳)有限公司上海霄云信息科技有限公司 甲骨文(中国)软件系统有限公司北京焱融科技有限公司 深圳大普微电子科技有限公司四川启睿克科技有限公司 序言 很高兴看到这本集合产业界众多代表编写的白皮书隆重发布。国家对于数据要素愈加重视,势必加快企业数字化转型,推动企 业上云用数赋智,政务云、行业云、国资云等快速发展,进一步催化云计算市场服务需求。数据存储是云的数据载体,构建先进可靠的多云数据存储能够促进数据要素的共享,流动,保障数据安全。 这本《白皮书》系统地梳理了多云时代的驱动力和面临的数据挑战,提出了多云数据存储的应对措施和发展趋势。构建多云统一的数据底座促进数据跨云共享,增强智能分级存储使能数据跨云流动,通过面向容器的存储创新助力应用上云改造,发展新型存算架构实现云计算基础架构的扁平分层和灵活组装,提升数据应用的效率,降低能耗,提高数据存储的安全可信能力保障数据的不丢失、不泄露。我们相信这是一次非常有价值的研究,对于相关决策部门、企业界、学术界具有很好的启示和参考意义。 数据成为企业发展的核心资源,上云用数赋智是企业数字化转型的“助推器”。期待在“政产学研用”多方力量的共同努力下,云和数据存储的生态将不断加强和优化,多云数据存储技术创新将不断深入,为数据基础设施建设提供关键和强有力支撑。 中国工程院院士 目录 一、多云数据存储发展背景1 (一)数字经济提速,云计算蓬勃发展1 (二)云化转型深入,企业使用多云成为新常态2 (三)数据价值凸显,数据存储成为多云关键底座6 二、多云数据存储现状8 (一)多云数据存储发展迅速,呈现三大特点8 (二)多云数据存储是上云用数的助推器9 三、企业上云用数面临的挑战11 (一)多云数据流动难11 (二)跨云数据共享难13 (三)数据安全保护难13 (四)多云应用改造难14 (五)数据应用能效低14 四、多云数据存储发展趋势16 (一)面向多云构建统一数据底座,扩大数据共享应用16 (二)数据存储智能分级能力增强,使能数据跨云流动19 (三)数据存储面向容器持续演进,助力应用云化改造21 (四)以数据为中心新型架构兴起,提升数据应用能效24 (五)边缘加速向超融合架构演化,云边协同不断深入27 (六)安全可信数据存储部署加快,保障数据可靠安全30 (七)数据存储节能技术逐渐成熟,促进绿色低碳发展32 五、总结与展望36 图目录 图12022年全球企业多云调研情况3 图22022年中国企业多云调研情况3 图3典型企业多云应用情况示意图4 图4企业多云架构数据底座示意图6 图52016-2022年数据存储全球市场规模8 图6多云数据流动面临诸多挑战12 图7多云趋势下有状态应用云化改造越来越深入14 图8跨云统一数据管理示意图18 图9全局文件系统示意图19 图10企业多云分级协同示意图20 图11有状态容器数据持久化示意图22 图12容器应用级高可用示意图24 图13传统云计算IT架构与新型云计算IT架构示意图25 图14云边端协同示意图28 图15安全可信数据存储示意图30 图16绿色数据存储示意图33 图17多协议互通减少数据搬迁示意图34 图18多云数据存储助力企业上云用数37 一、多云数据存储发展背景 (一)数字经济提速,云计算蓬勃发展 云计算作为信息技术发展和服务模式创新的集中体现,已成为企业及产业实施数字化转型的重要基础。自2006年云计算概念推出以来,云计算功能日趋完善,种类日趋多样,近年来,我国高度重视云计算产业发展,在上云用云政策牵引、数字经济提速等因素驱动下,我国云计算市场持续高速增长,2012年以来年均增速超过30%,成为全球增速最快的云计算市场之一,2021年市场规模已达3,229亿元。 政策牵引深度上云用云。国务院、工信部先后发布了《云计算发展三年行动计划》《推动企业上云实施指南》《“十四五”数字经济发展规划》等系列政策措施促进企业深度上云用云,实施上云用云行动,促进数字技术与实体经济深度融合,赋能传统产业转型升级。我国上云企业已累计超过380万家,云计算在推进经济社会数字化转型中发挥了重要作用。 数字经济提档加速。2002年到2011年,中国数字经济增速低于同期GDP平均增速,数字经济仅仅是国民经济的一部分。2012年以来,我国数字经济规模占GDP的比重不断提升,数字经济年均增速显著高于同期GDP平均增速,中国数字经济规模保持高速增长。近几年,我国在数字经济关键领域加快部署,“东数西算”工程加快实施,国家算力网络加快构建,以5G、人工智能为代表的技术进步和 产品创新快速演进,加速与垂直行业深度融合,应用场景迸发,在数字产业创新能力提升带动下,产业数字化转型实现了提档加速。 (二)云化转型深入,企业使用多云成为新常态 企业云化已经成为全球共识,对于大型企业,选择云化可以进一步提升IT建设水平。对于中小企业,则可以实现信息化管理节约资金投入,避免陷入复杂IT架构建设的窘境。我国云计算应用已从互联网拓展至政务、金融、工业、医疗、交通等传统行业。互联网和信息服务业已基本实现云计算的深化应用。金融、政务、交通等云化改造能力持续加深。能源、医疗、工业等行业的核心系统的云化改造逐步向核心系统推进。随着企业云化演进的不断实践,企业在持续探索选择最佳建设模式。最初,单一云平台被企业广泛采用,但随着云平台支撑的业务类型增多,单一云平台的架构也暴露出诸多问题。一方面不同的云厂商各有各的特长,另一方面,单一云供应商也增加了企业对数据安全的担忧,因此多云战略正在逐步成为最优的企业云战略。所谓多云,是指企业使用多个异构云供应商来提供统一的计算/存储服务,以提升云基础设施能力、控制成本,架构上通常包含两个或以上公有云或者私有云。 根据Flexera的2022年云趋势报告1,89%的企业在IT架构上选择多云战略,其中80%的企业选择混合云,企业IT架构日益复杂化, 1Flexera2022年云趋势报告:https://www.flexera.com/blog/cloud/cloud-computing-trends-2022-state-of-the-cloud-report/ 多云战略已经是当下大多数上云企业的选择。多云既具备公有云的灵活性、规模优势与创新能力,又可满足企业的数据安全监管及深度控制诉求,同时也满足用户不断追求更高性价比的诉求,逐步成为最优的企业云战略。 图12022年全球企业多云调研情况 根据信通院调研,在国内,已经有近九成企业选择多云,其中 63.4%企业使用混合云,25.3%的企业采用多公有云或者多私有云。 76%的企业使用2~4种云,其中使用3种云的企业占比35%,使用 4种云的企业占比20%。 图22022年中国企业多云调研情况 比如如下典型企业,同时在使用2~5种云: 图3典型企业多云应用情况示意图 国内不仅民营企业积极部署多云IT架构,央国企近些年也加快了多云的建设,并对外赋能。据统计,到2021年,近98家中央企 业已建成私有云1053个、公有云238个,业务系统上云率已经达到 52.15%。 多云可以让企业拥有最佳选择权,可以在三五个解决方案中选择最优方案,可以从根本上降低系统性风险。同时,企业可以随时做好准备,把其中一朵云的服务,迁移到另一朵云,以应对不可接受的价格上涨、业务中断等问题,如下四个因素是驱动企业选择多云的主要因素。 优势互补 多家云厂商优势互补:不同的公有云和私有云厂商都有自己在 IaaS,PaaS,SaaS某些方面的优势,企业正在试图根据自身业务诉求, 选择将不同的业务应用部署在相应的云平台,以期获得最佳的IT技术组合。 公有云和企业自建数据中心优势互补:公有云资源具备良好的弹性,按需申请、释放,适合企业快速开展各类不确定和创新业务;为了保证企业数字化竞争力,企业的核心业务又要求IT平台的差异化能力,加上核心数据私密性和管控的诉求,企业会选择在企业数据中心自建私有云,提供类公有云的一致性服务体验。 业务与数据安全 企业考虑到业务高可用,通过应用跨云部署避免单云整体性的故障,避免单一基础设施带来的风险。另由于不同业务系统数据安全等级不同,企业不同的业务也选择使用不同的云,如计费、银行核心交易、制造执行等系统多数选择私有云,电子商务、游戏、票务等系统选择公有云或者混合云。跨国企业还需考虑各国法律合规遵从,如欧洲国家要求本地数据不能出境,只能在各个国家选择使用本地公有云。 最优成本组合 企业引入多个云服务商,通过引入竞争争取商业价值,选择最优成本组合的云服务。还可以根据业务场景,每个业务场景选择成本最优的云,获得业务与成本均衡的多云组合。 实现多元化供应 “鸡蛋不能放在同一个篮子里”,对于企业用户,特别是大型企业用户来说,把公司的“生命线”业务完全依托给单个供应商来保障是有 一定风险的。使用多云可以保证企业用户同时具备多个方案可供选择和切换,最大限度地保证了业务稳定性。 (三)数据价值凸显,数据存储成为多云关键底座 数据作为关键生产要素的价值日益凸显,深入渗透到经济社会各领域全过程,为充分发挥我国海量数据和丰富应用场景的优势,促进云计算技术和实体经济深度融合,数据存储的重要性也日益凸显。 图4企业多云架构数据底座示意图 数据存储是云计算的重要组成,是多云架构中数据资源的载体。数据资源是企业的关键生产要素,数据的起点就是把采集的数据进行存储,从而给数据处理和应用提供原材料,支撑企业的数字化运作,产生的各类数据与物理世界完成交互后,最终处理的结果又回到数据存储进行保存,指导模型、算法的精确性和可用性提升。数据存储在多云架构中提供存储资源,供用户任意时间、任意地点通过网络存取 数据,是企业多云架构的数据底座。 数据存储正逐步成为多云架构下数据全生命周期服务与管理的平台。当今社会和企业运行已经表现出高度数据化、数字化,每一个组织、部门甚至个人都是一个数据集。数据存储正在成为这些数据集的统一管理平台,并且为社会治理、企业运营发展提供关键的技术支撑。针对多云架构的数据管理、流动、分析以及绿色低碳发展正在成为数据存储技术的重要实践。 二、多云数据存储现状 (一)多云数据存储发展迅速,呈现三大特点 数据存储是将信息以各种不同的形式存储到介质上的系统,多云数据存储即指云计算IT基础架构中的企业级数据存储系统。简单的说,多云数据存储就是云上数据的智能自动化“仓库”,参考国际上基于用途和应用场景的分类准则,数据存储产品分为分布式存储、集中式存储、数据保护(包含磁带存储、蓝光存储)等类别。 60,000 50,030 50,028 53,456 54,994 55,730 50,000 40,181 42,534 40,000 30,000 20,000 10,000 - 2016 2017 2018 2019 2020 2021 2022 单位:百万美元 企业级数据存储市场发展迅速,2022年市场规模达到557亿美元。云计算是数据存储最为重要的应用场景,在云计算中的数据存储规模占比超过50%,随着企业上云进程不断加快,企业对云平台中的数据存储需求不断释放,数据存储在云计算中的市场规模正在不断提升。 图52016-2022年数据存储全球市场规模 多云数据存储呈现三大