主任: 潘润红 副主任: 黄程林、庄文君 编委会成员(排名不分先后,按姓氏拼音排序): 蔡仕志、陈志刚、戴涛、杜志明、方兴、冯程、冯文忠、郭志军、侯敏、黄海明、李永海、马波勇、马晓煦、苏光牛、王丽静、王新明、王义成、隗华、巫建刚、肖静静、邢磊、徐晓剑、徐翥、杨阳、俞枫、张俊喜、张玮、张晓强、赵培 编写组成员(排名不分先后,按姓氏拼音排序): 白军奎、鲍思佳、毕斓馨、曹平国、陈伟红、程静、从平平、崔安颀、管文琦、郭茁、何格、黄晨晨、黄韦、李凯、李倩、李瑞超、李文彬、李昕哲、林海、刘畅、刘传友、卢强、骆君柱、骆毅、吕伟初、苏强、隋东辉、孙存福、孙腾腾、孙伟、唐思源、王枫、王富国、王辉、王鹏冲、王荣鑫、王帅强、王文清、王栩、王瑜、王子健、伍华、夏文勇、肖淑男、严恒、颜龙、杨锐、杨征涛、张俊成、张子鉴、赵义斌、周日明、邹鹏 主编单位: 北京金融信息化研究所 中国工商银行股份有限公司交通银行股份有限公司 平安银行股份有限公司 国泰君安证券股份有限公司 中国太平洋保险(集团)股份有限公司泰康保险集团股份有限公司 华为云计算技术有限公司中兴通讯股份有限公司 武汉达梦数据库股份有限公司 天津南大通用数据技术股份有限公司腾讯云计算(北京)有限责任公司 北京科蓝软件系统股份有限公司 参编单位: 中国农业银行股份有限公司中国银行股份有限公司 中国建设银行股份有限公司 中国邮政储蓄银行股份有限公司中信银行股份有限公司 招商银行股份有限公司 华夏银行股份有限公司北京银行股份有限公司上海证券交易所 中信证券股份有限公司华泰证券股份有限公司国信证券股份有限公司 中国人寿保险股份有限公司蚂蚁科技集团股份有限公司阿里云计算有限公司 北京东方国信科技股份有限公司 支持单位: 平凯星辰(北京)科技有限公司 2023年2月,习近平总书记在中共中央政治局第三次集体学习会议时强调,“基础软件要从底层和源头抓起,打好科学仪器、操作系统和基础软件攻坚战”。数据库作为构建金融信息系统的关键环节,成为当前金融领域创新及数字化转型的一个难点和焦点。近年来,金融机构不断加大我国成熟数据库产品应用力度,引入不同类型数据库产品在多种业务场景实现应用,在支持金融业务创新发展的同时,逐步提升金融业数据库安全可控能力。 但由于我国数据库产品还存在需要弥补的不足,随着数据库改造逐渐深入到核心系统,带来了选型难度高、实施运维难度大等挑战,亟需加大产用联合攻坚、创新应用模式、研发生态工具,推动我国数据库由“能用”向“好用、易用”迈进。同时,数据能力建设对数据仓库、非关系型数据库也提出了新需求,需要加大数据仓库技术创新,分类推动不同非关系型数据库应用发展,促进产品成熟落地。此外,金融业大量采用了开源数据库,面临开源协议、安全漏洞、知识产权、代码感染、开源停服断供等风险,亟需通过加大开源数据库治理、安全防范、建设行业开源社区等措施进行风险防范。 本报告从行业应用情况入手,围绕当前业界关注的金融核心系统数据库应用、数据能力提升和开源数据库风险防控三个领域,总结发展成效经验,剖析问题与风险,提出发展建议,展望发展趋势,为金融业数据库创新发展提供参考借鉴。 1.概述1 2.金融业数据库应用现状2 2.1金融业数据库应用总体情况2 2.2我国数据库产品在金融业应用取得积极成效5 3.金融业数据库应用重点领域分析7 3.1核心系统数据库应用分析7 3.1.1核心系统对数据库应用提出更为严格需求8 3.1.2当前核心系统数据库应用面临多重挑战9 3.1.3围绕关键环节推动核心系统数据库转型升级11 3.2数据库支持数据能力建设分析14 3.2.1不同类型数据库助力数据能力建设取得积极成效14 3.2.2金融业数字化快速发展对数据库提出新需求15 3.2.3分类推动各类数据库应用创新促进数据能力提升17 3.3开源数据库应用风险分析18 3.3.1开源数据库快速发展并在金融业得到广泛应用19 3.3.2金融业开源数据库面临诸多风险20 3.3.3多措并举防范开源数据库应用风险23 4.金融业数据库应用展望25 4.1我国主流数据库产品成熟度将进一步提升25 4.2金融核心系统数据库转型升级将稳步推进26 4.3新技术与业务场景将推动金融数据库创新发展26 4.4金融业开源数据库应用风险防范仍然不容忽视27 附录:金融业数据库优秀应用案例集28 国家的战略部署及金融科技发展相关的多个专项规划,都对关键软硬件信息技术的突破应用、构建自立自强的数字技术创新体系提出了明确目标和要求。金融机构在数字化转型创新发展中,纷纷加快了信息技术的迭代升级,不断引入包括数据库在内新的技术产品,并持续扩大应用广度和深度,金融业信息技术供应链安全整体水平不断提升。 作为核心基础软件的数据库,始终是金融业关注的焦点,也是难点。近年来,传统集中式、新兴分布式数据库,关系型、非关系型数据库,联机事务处理型(OLTP)、联机分析处理型(OLAP)、混合负载型(HTAP)数据库,商用数据库、开源数据库等在不同业务场景中实现创新应用,推动构建新一代金融IT基础设施,在确保安全稳定的同时,有力支持金融业务创新发展。特别是我国成熟的数据库技术产品在金融业实现了广泛应用,并逐步推动在核心系统应用落地,取得显著成效。 但金融业数据库应用还面临一些挑战。一是随着我国数据库产品应用向核心系统深入,其性能、功能及稳定性与国际商用主流数据库产品还存在一定差距,尚不能完全满足金融业核心系统应用需求;二是数据仓库、非关系型数据库对金融业数据能力建设有着重要作用,随着金融业数字化转型深入推进,对非关系型数据库的需求越来越多,对数据仓库功能、性能、扩展性和安全 性提出更高要求,亟需提升产品能力满足金融业应用需求;三是开源数据库在金融业应用广泛,但存在开源协议、安全漏洞、知识产权、代码感染、开源停服断供、政策不确定性、掌控及服务能力不足等诸多风险。 为推动金融数据库创新发展,以应对面临的挑战和问题,金融信息化研究所组织各方力量,在深入调研、交流研讨基础上,编制《金融业数据库创新发展报告》(2023),对金融业数据库技术应用进行现状梳理、问题分析、建言献策及成果展示,为管理决策提供参考,为金融机构创新发展提供支持,为我国数据库产业发展提供助力,促进金融科技稳步发展和金融数字化转型深入推进。 金融业始终走在IT技术应用和发展变革的前列,根据创新发展和安全可控的需要,金融机构普遍采取“先外围、后核心”的策略推进我国数据库产品的应用落地。随着多种类型的数据库产品在金融领域加快应用,促进了金融业务创新,同时也有力支持了我国数据库产业的发展。 2.1金融业数据库应用总体情况 一是集中式数据库应用占比较高,分布式数据库应用呈现增长趋势。从产品架构看,金融业数据库呈现集中式和分布式并存发展态势。其中,集中式数据库以其较强的功能黏性、优秀的系 统稳定性、良好的软硬适配能力,目前在金融业的应用仍占据绝大多数份额。但随着金融业数字化转型的不断深入,分布式数据库因具备依托通用硬件、弹性扩展、内臵高可用等特征,可更有效支持海量、高并发、高吞吐量的新型金融业务应用系统,在金融业的应用占比相较2022年调研结果实现了5.76%的增长。 二是OLTP数据库应用占比较高,OLAP和HTAP应用需求不断增加。金融业务系统的数据处理分为联机事务处理(OLTP)和 联机分析处理(OLAP)两类。面向客户交易类、业务办理等系统通常选择OLTP类数据库,而报表类、分析类系统通常选择OLAP类数据库。随着金融业数字化进程加快,海量数据让OLTP和OLAP数据库的边界越来越模糊并不断融合,在同一个系统中同时需要OLTP和OLAP能力,即HTAP数据库的需求越来越多。通常HTAP主要应用分为以OLTP为主或以OLAP为主的两种HTAP场景。目前在金融业非融合的OLTP数据库占比仍然较高,为76.83%。同时,不同细分行业中,银行业和证券业应用OLAP和HTAP数据库占比相对较高。详细情况如图1所示。 OLTP、OLAP和HTAP数据库占比情况 金融业 79.48% 10.95%9.52% 银行业 77.48% 11.83%10.63% 证券业 76.17% 12.00%11.83% 保险业 93.93% 5.25%0.82% 0.00%10.00%20.00%30.00%40.00%50.00%60.00%70.00%80.00%90.00%100.00% OLTP数据库占比 OLAP数据库占比 HTAP数据库占比 数据来源:金融信息化研究所图1金融业OLTP、OLAP、HTAP数据库占比情况示意图 三是非关系型数据库在金融业加快探索实践。金融业具有客户量大、业务场景复杂等特点,需要存储处理多种类型数据,如庞大的用户、账户、交易、清算、产品、行情等结构化数据和海 量的图像、视频、语音等非结构化数据。金融业务需要挖掘海量基础数据所蕴含的丰富信息资源,如隐藏的用户偏好、消费习惯、交易习惯、社会关系等,为非关系型数据库提供了丰富的应用场景,加快了非关系型数据库创新应用。目前,非关系型数据库在金融业应用占比已达到14.58%。相对证券业和保险业,银行业应用非关系型数据库占比较高。另外,非关系型数据库中键值数据库和文档数据库应用最广泛,二者之和占所有非关系型数据库比例超过60%;图数据库、向量数据库、时序数据库开始探索应用,其中时序数据库在证券业首先开始应用,占比为4.8%。金融业非关系型数据库应用占比情况如图2所示。 关系型、非关系型数据库占比情况 100.00% 85.42% 89.83% 83.54% 88.23% 80.00% 60.00% 40.00% 20.00% 14.58% 16.46% 10.17% 11.77% 0.00% 金融业 银行业 证券业 保险业 关系型数据库占比 非关系型数据库占比 数据来源:金融信息化研究所图2金融业关系型、非关系型数据库占比情况示意图 四是开源数据库在金融业得到广泛应用。与闭源商业数据库相比,开源数据库具有源码公开、使用成本低、获取途径广、对外开放、功能丰富等特点。这些优点使得开源软件得到广大开发 人员的青睐,使用人员可在原有代码基础上进行业务适配修改,活跃的社区支持也为日益复杂的业务需求贡献了越来越多的解决方案,从而使得开源数据库在金融业实现了广泛应用。目前,约90%的金融机构都应用了开源数据库支撑业务发展,其中主要集中应用在一般业务系统和管理类系统。 2.2我国数据库产品在金融业应用取得积极成效 一是我国数据库产品在金融业应用稳妥推进、持续增长。金融业始终走在IT技术应用和发展变革的前列,根据创新发展和安全可控的需要,金融机构都在以不同的速度和深度尝试应用我 国数据库产品支持业务发展。为确保安全生产、顺利实施,金融机构普遍采取“先外围、后核心”的策略推进我国数据库产品的应用落地,不断拓展应用广度和深度。调研显示,与2022年相比,目前应用我国数据库产品的金融机构数量占比增长约10%,其中,证券业增幅明显。 二是我国数据库在金融业应用优势不断显现。金融业应用我 国数据库产品,可针对特殊业务场景采取定制化改造,增强业务系统的服务能力,加快业务系统的响应速度,提升业务系统的吞吐量,本地化服务优势明显。同时,我国数据库产品在金融业的应用,一定程度上降低了企业成本,实现了降本增效。相比国外数据库高昂的购买费用和后续的技术服务成本,我国数据库产品后续成本投入相对稳定、成本可控。 三是金融业与数据库产业互相促进、发展共赢的成效显著。金融机构在应用我国数据库产品时持续进行产品能力测试,识别产品能力上的缺陷并不断反馈给数据库厂商,推动数据库产品能力提升。而且金融业拥有丰富的业务场景,我国数据库产品在大量的实践应用以及上下游产业的共同发展中,整体数据库能力、 兼容性能力都有明显提高。随着我国数据库产品成熟度的不断提升,加快推动了新一代金融IT基础设施建设,不断夯实金融业数字化创新发展的基石。 随着我国数据库产品在金融业的不断