金融数据中心存储顶层架构白皮书 华为技术有限公司 版权所有©华为技术有限公司2024。保留一切权利。 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。 商标声明 和其他华为商标均为华为技术有限公司的商标。 本文档提及的其他所有商标或注册商标,由各自的所有人拥有。 注意 您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。 由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。 华为技术有限公司 地址: 深圳市龙岗区坂田华为总部办公楼邮编:518129网址: http://www.huawei.com客户服务邮箱:support@huawei.com客户服务电话: 0755-285600004008302118 客户服务传真: 0755-28560111 目录 1概述4 2存储目标架构规划原则7 3存储目标架构详细规划9 3.2数据分析-大数据存算分离架构14 4结语36 1概述 1.1背景 近年来,在全球经济增长缓慢,贸易战和地区冲突持续的背景下,金融行业的营收压力增大,资产规模增长显著放缓。借助科技的力量,金融机构的数字化进程在后疫情时代持续深化。一方面,金融机构利用数字化技术持续为客户提供无所不在的智能化体验,以满足多样性的客户需求;另一方面,金融机构也在积极利用智能化技术构建敏锐的业务洞察力,以快速应对各种市场变化。因此,金融服务正从数字化时代走向智能化时代。 1.2金融存储趋势、技术&市场洞察 金融机构一直是率先将新兴IT技术的应用于业务场景的行业。凭借云计算,大数据和人工智能等技术的应用,金融机构正在优化金融服务流程,重塑金融服务模式。 我们看到,随着手机银行和线上支付技术在金融行业的广泛应用,金融服务触达客户的时间和空间进一步扩展,促使金融机构的服务模式从5*8改为7*24不间断服务。而领先的金融机构,已经开始布局人工智能(AI)应用,尤其是大模型技术的研发,利用AI使能业务运营、产品营销、风险控制和客户服务等业务领域,进一步提升金融服务的智能化水平。根据IDC的报告,90%的银行已经开始探索人工智能的应用,AI技术成为银行技术创新的主要方向。 业务应用的需要,也驱动着金融机构的数字基础设施架构的转变。以兼具韧性和灵活的云原生应用,逐步淘汰传统封闭的架构, 重构创新开放的存算分离架构,建设具有高可靠,高扩展性的基础 设施,助力金融服务内容和品质的提升。 1.3金融数据中心存储底座建设总体要求 金融机构需要系统化构建面向未来的金融基础设施,这个目标架构以高可用、高安全、可信合规、绿色低碳为主要特点,支持金融服务的极致体验、业务敏捷、泛在智能和开放创新。基于这些特点,我们认为,主要需要考虑以下几点: □业务分级:将业务系统根据重要性和服务范围进行科学的分类和 分级,通常建议分为3~4档; □硬件架构:交易等关键业务系统采用专业的可靠设备,通过专用资源保障,以存算分离架构在确保稳定低时延的同时,提升系统整 体可靠性;非关键环境可根据TCO、运维习惯和系统扩展性的综合 考虑,选择低等级配置的存算分离架构。 □容灾:传统基础设施采用两地三中心/四中心,云原生系统采用单元化多中心多活; □备份:采用全闪存热备+海量对象存储温备+公有云冷备实现多级备份;采用云上业务、云下备份的方式进行混合多云的数据集中 备份; □归档:采用海量对象温归档+蓝光/磁带/公有云冷归档实现多级归档; □数据&AI:打通数仓、数据湖和AI训练基础设施,通过存算分 离、湖仓一体等实现数智融合;通过超高并发度、高性能存算网的构建实现高效AI模型训练;通过云管边端协同实现全域数据采集和AI推理。 2存储目标架构规划原则 数据中心数据中心存储平台是IT系统的重要支撑平台,存储平台应具有稳定可靠、高性能、灵活运维、弹性伸缩等特点,才能适应未来金融业务的发展。存储目标架构基于以下几方面进行设计: 1、高可靠容灾保障能力:针对不同的存储可靠性级别,设计相匹配的容灾保障方案,选择技术领先、稳定可靠、易于管理的容灾技 术。 2、高吞吐低时延IO处理能力:针对不同的业务类型以及不同的数据模型,采用相匹配的存储平台和存储介质,并预留扩展能力,满 足未来5-8年业务发展对存储系统的性能要求。 3、高效统一运维与管理能力:本次存储平台方案设计,力求将存 储平台运维服务化,使存储平台成为整个分布式云数据中下的存储 云。能够做到灵活调度、资源可视、高效运维。 4、弹性伸缩能力:存储平台的设计应有较强的弹性,能够有力应对互联网业务的突发与多变。 3存储目标架构详细规划 3.1生产交易–存储分离的资源池架构 3.1.1金融行业生产交易场景的趋势和变化 金融行业数字化转型发展,使得金融服务的业务模式发生了显著的变化。从多数银行公布的年报来看,新兴金融服务交易量年度平均增长都在50%以上,而且主要来自网上银行、手机银行和移动支付等新兴技术的应用。因此前端渠道接入系统这类直接面向客户提供服务的请求接入类系统的服务模式正在快速发生变化。新兴的业务模式扩大了金融服务的触达渠道,从传统的线下网点服务扩展到线上服务;延伸了金融服务时长,从原来的5*8小时服务延长到7*24小时不间断业务服务。 另一方面,数字化的深入,凸显数据的重要性,金融行业数十年积累的用户数据和业务数据是重要的数字资产。金融行业在整体数据量方面已经达到了EB(Petabyte,即千万亿字节)级别。以中国为例,根据北京金融信息化研究所(FITI)2023年发布的最新报告,目前金融机构的数据量普遍达到PB级,尤其是国有大型 银行的核心业务系统存储规模也已达到百PB级,并且未来五年预计年均增幅将达到24.33%。 3.1.2金融行业生产交易场景业务需求 这些业务模式变化和数据量的增长,也正在深刻影响并重塑着金融行业的数据中心基础架构。为适应未来业务发展,数据中心基础设施,必须满足业务所需的吞吐性能和可靠性要求,并具备面向未来的扩展性要求: 1、吞吐性能 业务量的激增,对数据基础设施的性能、吞吐量提出了更高要求。从性能上讲,一般业务处理平均有大约50次数据库请求,每次数据库请求约1000次左右存储读写(注:基于银行核心系统的交 易模型)。因此存储读写时延每增加1毫秒,将增加数据库处理1秒 以上的时延,对业务整体增加50秒以上的时延。从吞吐量上讲,中等银行生产业务的峰值交易大约5000笔/秒(即:5000TPS)来估 算,峰值业务处理需要的存储IO请求能力约为1.5M-2.5M的存储 读写。 在高吞吐和高性能需求下,采用存算一体架构,将对无疑是个巨大挑战。服务器CPU算力不但要负责业务处理,还要完成数据可靠性,数据加密和数据压缩等繁琐的数据存储处理,因此服务器的CPU资源捉襟见肘。但是通过存算分离架构,所有数据存储的IO 请求卸载到外置存储系统中处理,既减少服务器CPU的负载,不用 处理存储IO请求,还提升服务器CPU的业务面的处理能力。 2、系统可靠性 服务时间的延长,对整体架构可用性的提出更高要求。金融业务服务时间的中断,往往意味着交易损失,资金损失,最后导致用户的流失。以中等规模银行为例,核心系统交易量一般在1000- 3000笔每秒。因此,系统服务中断和不可用的每一秒,则意味着 1000笔以上的交易损失和用户流失,甚至监管层的惩罚。例如, 星展银行在2023年先后5次大规模中断业务服务,新加坡金管局(MAS)要求其提供16亿美金的额外资本,并在2023年11月对新加坡星展银行做出半年内禁止收购新企业等处罚。 对于数据中心而言,如果要满足整体业务可用性99.999%的 要求,即年停机时间5分钟以内,则数据中心基础架构的可靠性必须要提升到99.9999%以上,即年度故障时间30秒以内。当前,部分金融机构采用基于x86服务器的存算一体架构,该架构在可靠 性上只能达到99%。金融行业统计表明,x86服务器超过5年以上之后,故障率超过0.5%,因此采用服务器本地磁盘的数据库存储,随着数据中心集群规模的扩大,频繁的故障和恢复,会对生产交易系统的业务连续性带来严峻挑战。而在存算分离架构下,服务器只负责数据逻辑处理,所有数据的持久化和可靠性等能力都由存储设备统一完成,即使服务器发生故障,也不影响其他数据库实例计算 节点的数据访问。同时,利用存储的RAID和快照等技术,极大提升整体业务的可靠。 3、系统扩展性 业务种类的增加,对业务之间数据交换更加频繁,各类运营数据和报表系统等从生产系统数据库中获取数据的实时性要求更高。 银行生产交易系统是各类系统运营数据和报表等系统的数据源,如何实时的获取有效的数据,并且对生产系统的业务影响最小,成为各业务系统与生产交易系统之间不可调和的矛盾。在存算一体架构下,必须通过专用ETL工具直接对数据库数据进行操作,对业务系统造成性能干扰,因此只能选择在夜间业务低谷时段抽取数据,对后端系统的实时性造成影响。在存算分离架构下,可充分利用存储的一致性快照和克隆等能力,快速构建生产交易系统的数据库副本,满足各类后端系统对业务数据实时性需求,并且对生产端数据库业务的性能影响最小。比如,每日批量作业希望每日夜间定时从主库上利用存储的一致性快照和克隆等能力,快速生成一个数据库集群,用于每日批批量作业的读写操作。 因此,面向未来,为了满足业务性能,可靠性和扩展性的要求, 基于共享存储池和分层解耦的存算分离架构将是主流的架构选择方向。 3.1.3金融行业生产交易场景目标架构 从金融行业来看,越来越多的金融客户倾向于采用分层解耦、按需分配的统一资源池架构打造生产交易平台,参考架构如下图所示: 该架构具备如下特点: 1、根据业务系统的服务等级,从吞吐性能和可靠性要求,分成不同的等级,一般建议分成3级或者4级。比如Tier1采用物理服务器满足高性能高可靠要求;Tier2满足大部分金融业务处理的通用需求;Tier3满足一般性能和可靠性要求的业务处理,比如开发测试应用。 2、按照不同等级业务系统,分配不同的计算和存储资源。同一等级业务系统分配标准的计算和存储资源,内部通过Quota配额和QoS服务质量的方式来实现应用的隔离和资源保障。 3、能够兼顾物理服务器计算资源、虚拟化平台、容器平台的多样性数据读取需求,提升整体资源利用率和系统可靠性。 4、同一等级的分层解耦资源池,统一采购,统一配置,统一运维,形成标准化体系。 3.2数据分析-大数据存算分离架构 3.2.1金融大数据分析发展趋势和变化 中国金融大数据产业快速发展,成为金融行业业务增长的新引 擎。 近几年,随着移动金融、互联网信贷等新业务形态的出现,金融大数据应用得到长足发展,已经渗透到金融行业的方方面面,广泛应用到营销、风控、运营等多种关键业务中,极大的提升了金融行业的服务水平,大数据已成为金融行业的主要获客渠道。 《IDCPeerScape:金融领域中数据管理分析服务最佳实践案例》报告显示,2023年,中国金融行业大数据市场支出规模达到 29.7亿美元,预计到2027年将增长至64.6亿美元,CAGR达到21.4%。未来几年,金融大数据市场仍将保持较高的增速,是数据管理、数据分析厂商争夺的主要市场,目标客户覆盖大型和中小型 银行、保险、证券、互联网金融等客户。 随着大数据应用的深入,大数据平台从注重数据处理走向注重 数据价值挖掘。 诺贝尔经济学奖获得者罗纳德·科斯(RonaldCoase)曾经说 过,“如果你拷问数据到一定程度,它会坦白一切”,诚然,大数据 +AI时代的到来让这句话有了更多的现实意义,如果说石油滋养了工业时代,那么海量非结构化数据就是