华西计算机团队 2022年11月24日 分析师:刘泽晶 SACNO:S1120520020002 邮箱:liuzj1@hx168.com.cn 分析师:刘熹 SACNO:S1120522110001 邮箱:liuxi1@hx168.com.cn 请仔细阅读在本报告尾部的重要法律声明 仅供机构投资者使用证券研究报告|行业深度研究报告 数据库:信创的关键环节 ——信创系列专题报告(五) 核心逻辑 核心观点:数据库是IT核心基础软件,是信创发展到中期需要替代的关键环节,随着信创渗透进一步提升,数据库将具备极高的成长弹性。 数据库是IT核心基础软件,未来五年市场规模CAGR达29% 数据库是IT领域核心基础软件之一,是信创的核心品类。在数字经济的发展,新兴技术突破,数据类型丰富等驱动力作用下,我国数据库市场高 景气持续。IDC预计,2025年,中国数据库管理软件市场规模为117.2亿美元,2021-2025年CAGR为29%。 关系型数据库是主要品类,云原生、分布式数据库前景可观 关系型数据库占数据库行业的比重超过60%,是数据库行业的重要品类。关系型数据库类型丰富:1)按部署方式可划分为本地部署、云原生两类。目前,Microsoft、AWS、阿里巴巴、华为、腾讯等云厂商在全球数据库市场份额迅速攀升,至市场前列。2)按架构可划分为集中式和分布式两类,集中式数据库中集群式仍然是主要选择;分布式数据库具备灵活架构、高经济性能、高可用性、易拓展性等优势,前景可观。 党政和行业信创加速渗透,国产数据库将迎来重大发展机遇 我国数据库企业持续扩容,已进入百花齐放的快速发展期。预计“十四五”期间,在数字经济快速发展,信创加速渗透等趋势下,国产数据库将迎来重大发展机遇,或具备相当广阔的替代市场空间:1)按增量市场统计,2021H2,我国关系型数据库市场-本地部署模式中,国外企业合计占比超过40%;2)按存量市场统计,以业务系统数量为计数单位,我国金融行业业务系统数量中,Oracle、DB2、MySQL三类份额超过87%。 投资建议 数据库是信创产业的核心品类。未来,随着国产数据库产品持续迭代升级,以及信创渗透率的持续加深,党政电子政务信创,金融、运营商等行业信创推进下,数据库软件或将迎来新一轮替代潮。相关受益标的包括:太极股份(人大金仓)、中国软件(达梦数据)、海量数据、星环科技、易华录、超图软件、新炬网络等。 1、行业概览:IT核心基础软件,行业景气向上 目录2、结构分析:关系型为主,云、分布式前景好3、国产替代:信创加速渗透,关键行业空间广 4、主要数据库公司介绍 5、投资建议与风险提示 数据库是IT行业的核心基础软件之一,是组织、存储、管理、分析数据的系统,在信息系统的软件和硬件之间起到承上启下的作用。 •数据库(Database,DB)由数据库和数据库管理系统组成,主要指按照一定的数据结构来组织、存储和管理数据的仓库,是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合,能够接受外部请求,对数据进行存取操作,并持久化存储的系统。 •数据库管理系统(DatabaseManagementSystem,DBMS)是对数据库进行统一管理和控制的大型软件,主要由内核组件集和驱动组件构成,其中内核组件集按照功能模块划分为管理组件、存储组件、计算组件和网络组件。 数据库系统架构 从商业到开源和云数据库时代,数据库发展的三个阶段,成就了三种商业形态。根据墨天轮报告, –商业数据库时代:以Oracle、DB2等为代表,成就了商业软件行业; –开源数据库时代:以MySQL、PostgreSQL为代表,成就了开源开放的互联网时代; –云数据库时代:是商业和开源的融合时代,以新的供应和使用模式,成就了云和数字化企业。 数据库产业的三个时代 云数据库 开源数据库 商业数据库 数字经济的发展,数据量的高增、数据结构和来源多元化、以及部署环境的日益复杂等是数据库产业的核心驱动力。 IDC预计,2018-2025年,中国数据量复合增速达30%,2025年将达到48.6ZB,成为全球第一。届时,全球数据量将达到175ZB。 宏观环境促使企业更加重视数据库管理工具 全球数据量预测(ZB)数据结构和来源变得多元化 2021年,全球数据库管理软件市场规模646.2亿美元,同比增长17.4%。中国大陆区占比仅6.7%,增速最快。 2021年全球数据库管理软件市场分区域情况 1.预计2021-2025年中国数据库市场规模CAGR为29%,公有云模式为主 根据IDC数据,(1)全球:2021年,全球数据库管理软件市场规模为646.2亿美元,预计2025年将达到1068.8亿美元,2021-2025年CAGR为13%,其中,公有云模式的数据库占比将从2021年的44%提升至2025年的64%。(2)中国:2021年,中国数据库管理软件市场规模为42.3亿美元,预计2025年将达到117.2亿美元,2021-2025年CAGR为29%,其中,公有云模式的数据库占比将从2021年的64%提升至2025年的74%。 全球数据库市场规模中国数据库市场规模 数据库技术近年来得到了迅速发展,新型硬件、新型交叉学科技术、新型数据模型、安全隐私等因素对数据库技术的发展起到了至关重要的作用,产生了很多的新型数据处理技术,主要包括基于新型硬件的数据管理、智能数据管理、多模数据管理、数据安全和隐私保护。 数据库行业未来发展趋势 1、行业概览:IT核心基础软件,行业景气向上 目录2、结构分析:关系型为主,云、分布式前景好 3、国产替代:信创加速渗透,关键行业空间广 4、主要数据库公司介绍 5、投资建议与风险提示 数据库可以按数据模型、业务负载特征、架构模型、部署模型多种方式进行划分。 数据库的分类 IDC将数据库管理系统软件分为关系型数据库、NoSQL数据库、低代码数据库、导航式(层状)数据库、数据湖管理系统、内存/缓存数据库六大类。 关系型数据库占据主要市场。根据IDC数据,2021年全球数据库管理软件中,关系型数据库占比69.9%,中国市场中,关系型数据库占比64.2%。不同于全球市场情况,中国市场数据湖管理系统占比较高,达21.8%。 IDC数据库管理系统软件分类2021年全球数据库管理软件子市场占比2021年中国数据库管理软件子市场占比 关系型数据库的基础是关系数据模型,由关系数据集、完整性约束规则和关系运算三部分构成。通常情况下,关系数据集用多个表格作为数据结构来表示。用户可以定义表之间的关联。表中的列可以进行连接、并、交、差等关系代数运算。 按业务负载特征进行分类,关系型数据库可分为交易型数据库(OLTP)、分析型数据库(OLAP)和混合负载数据库(HTAP)。交易型数据库满足 处理在线的实时交易事务场景,而分析型数据库满足分析业务场景,混合负载数据库目标是同时处理简单交易和复杂分析场景。 关系型数据库的基本概念 当前部署形态主要分为两种,分别是本地部署和云原生数据库。按照架构分类主要有三类:单机、集群、分布式。其中云原生数据库和分布式数据库受到广泛关注,也成为国内数据库厂商重点突破口和主要发力方向。 关系型数据库按部署方式和架构分类 根据IDC数据,(1)全球:2021年,全球数据库管理软件市场中,Microsoft、Oracle、AWS市占率排名前三,份额分别为32.5%、22.7%、11.5%。(2)中国:2021年,中国数据库管理软件市场中,阿里巴巴、华为、腾讯市占率排名前三,份额分别为28.3%、10.8%、9.9%。 2021年全球数据库管理软件Top10厂商份额2021年中国数据库管理软件Top10厂商份额 根据Gartner数据,2021年,全球数据库市场收入近800亿美元(5201亿元人民币),同比增长22.3%。 云成为数据库的新动能。2021年,托管云服务(dbPaaS)的收入增至392亿美元,现在占DBMS收入总额的49%以上。市场份额显著增长的厂商,都是因为云的优势而获得市场成功。 2017-2021年全球本地部署和云部署数据库规模对比2011-2021年全球数据库管理系统市场份额排名 2017-2021年全球前五的数据管理系统厂商份额 根据IDC数据,2021H2,中国关系型数据库软件市场规模为15.8亿美元,同比增长34.9%。其中,公有云关系型数据库规模8.7亿美元,同比增长48.7%;本地部署关系型数据库规模7.1亿美元,同比增长21.1%。预计到2026,中国关系型数据库软件市场规模将达到95.5亿美元,未来5年CAGR为28.1%。 在本地部署模式市场中,由于利好政策的驱动,本土厂商市场份额都得到迅速扩大。如:在政府行业,达梦数据库、人大金仓在过去一年 中获得了大量的订单;华为在政企、金融行业也获得了突破。总体上看,本土厂商的份额正在快速追赶上Oracle、IBM等国际厂商。 公有云关系型数据库市场集中度更高,前五名厂商占据接近90%的市场份额,或主要系公有云数据库与云产品捆绑销售等原因。 阿里云数据库负责人李飞飞在《数据库的创新与跃迁》高层研讨会上表示,云计算为数据库的架构发展开辟了新技术路径,以及新的商业化场景,让以PolarDB为代表的中国云数据库得以跻身全球第一阵营。 目前,分布式数据库的技术路线选择都是以解决数据容量扩展问题为首要目标,主要方案又分为分库分表+中间件、原生分布式等。 (1)分库分表+中间件,方案其实是由下层的单机数据库提供存储和执行能力,在多个单机数据库上封装了一层中间层来补充分布式能力,统一数据分片规则,管理分布在不同数据库节点的数据,并提供SQL解析来请求转发和结果合并。 (2)共享存储分布式数据库,方案是计算节点独立并且共享一个不带计算功能的存储集群,也叫shared-storage。数据存储的底层是可动态扩展的分布式高性能存储,存算分离架构,计算层和存储层都可以实现动态扩缩容。 (3)去中心化的分布式数据库,方案是每个节点都有独立的计算和存储功能,并且节点之间不共享数据。为了平滑的扩缩容采用了存算分离的架构,分布式集群的每个节点都是独立的节点,通过这个multi-paxos或者multi-raft等共识算法来保证多副本的可用性。 分布式数据库架构示意图 中国数据库厂商呈现差异化布局。但是在未来的落地场景格局上,头部效应将愈加明显,领先的厂商会将覆盖大多数行业,并在不同深度的场景服务上全面布局其分布式数据库的迁移改造解决方案。 在中国市场,分布式数据库发展正处于“爆发期”。根据沙利文报告,从专利申请的数据角度出发,中国的分布式数据库相关专利申请量从2012年的全球占比22%爬升至2021年的76%,中国已经成为了全球分布式数据库的技术创新中心。 根据沙利文报告,金融级数据库市场评分前五的厂商分别为金篆信科GoldenDB、华为云 GaussDB、腾讯云TDSQL、奥星贝斯OceanBase、平凯星辰TiDB。 中国分布式数据库市场综合竞争表现 中国分布式数据库厂商呈现差异化布局态势 NoSQL,是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL数据库的产生就是为了解决大规模数据集合和多重数据种类带来的挑战,特别是大数据应用难题。因为NoSQL数据库去掉了关系数据模型的特性,因此数据之间没有关系,容易进行扩展。此外,得益于NoSQL数据库数据模型的无关系性,数据库的结构变得比较简单,因此更容易支持海量数据的存储和高并发读写,性能比较优秀。 NoSQL数据库的基本概念 NoSQL数据库主要包括键值数据库、图数据库、时序数据库、列簇式数据库、文档数据库、空间数据库、向量数据库、搜索数据库等。 NoSQL数据库的主要分类 1、行业概览