您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:计算机行业深度:华为的数据库之路:内启外拓,蝶变升级 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业深度:华为的数据库之路:内启外拓,蝶变升级

信息技术2024-10-11陈涵泊、王思德邦证券肖***
AI智能总结
查看更多
计算机行业深度:华为的数据库之路:内启外拓,蝶变升级

高斯从内部孵化至共建生态,二十年磨一剑支撑信创数据库发展。华为数据库起源于2001年为解决电信业务数据库需求,从内部打磨完善出发,历经20多年的技术积累并融入华为长期以来的企业服务质量与可信标准,形成在银行、保险等行业核心系统普遍使用的分布式数据库GaussDB,且在2019年宣布将数据库开源为openGauss。两类数据库定位清晰,共同构成当前国产数据库的重要组成部分。GaussDB同时支持分布式和主备部署,面向特定行业提供定制化服务,适合数据库安全与性能较高的客户;openGauss支持主备部署,侧重于开源协作,面向更广泛的用户群体提供标准化和高性能的数据库产品;二者均支持全栈信创能力,和国产CPU、国产操作系统以及中间件有很好的生态兼容。 集中式与分布式数据库路线兼顾,高斯禀赋优势显著。目前,集中式数据库仍为主流,而随着信息技术发展,数据体量与复杂度提升,分布式数据库凭借高并发、易拓展、多地部署等技术要素迎来有利发展条件。金融、电信等行业为应对业务系统的海量数据、高并发等需求,积极推动分布式数据库建设。GaussDB是国内唯一能够做到软硬协同、全栈自主创新的分布式数据库,通过多维度的技术创新,在行业实践中构筑了高可用、高安全、高性能、高弹性、高智能的技术优势,而在数据库替换场景中,又具备易部署、易迁移的特性。通过对比其他分布式数据库,GaussDB的RTO高可用指标领先,同时凭借华为在软硬件领域的优势,在可靠性与性能上都实现了领先优势。openGauss定位为集中式数据库,内核深度融合华为在数据库领域多年的经验,结合企业级场景需求,具备高可靠、高性能、高安全、易运维等技术特点。与国内部分主流集中式数据库对比,openGauss数据库整体技术水平表现较好,支持标准SQL、多字符集等功能。 高斯坚持走自主创新道路 ,有望受益于信创领军于关基行业。根据CCSA TC601,中国数据库市场规模预计到2028年达到930.29亿元,2023-2028年的CAGR为12%。近些年随着国际形势变化以及我国数据库产品竞争力提升,数据库信息安全备受重视,特别国债的落地以及国测标准的确定,有望提升信创供需两方积极性。华为坚持走自主创新道路,GaussDB核心代码100%自主可控,openGauss开源根社区初步形成。从应用领域来看,GaussDB依托丰富产品矩阵和硬核技术优势,在金融行业已建立格局,并在关基领域覆盖11个行业,服务百余家关基企业,帮助客户实现数字化转型;openGauss已跨越生态拐点,下游应用场景广阔,已有超百个客户实践案例,合作伙伴商业应用加速普及,在2023年中国线下集中式数据库市场新增市场份额达21.9%。 从渠道建设来看 ,GaussDB同时通过华为云Stack、华为云直销途径以及合作伙伴转售的方式打通市场,openGauss定位为开源社区,主要通过与合作伙伴共同进行市场布点。 投资建议。我们认为,华为数据库从内部磨练完善出发,衍生出自研商用和开源共进两条道路,通过不断的内部迭代与外部合作伙伴共创,至今已成为千行百业重要的数据基础底座,建议关注已基于openGauss形成了成熟商业发行版的厂商以及相关的技术服务与增值商:海量数据、润和软件、中国软件国际、航天软件、软通动力、科蓝软件、东方国信、长亮科技、星环科技等。 风险提示:技术路线分散,同质化竞争加剧风险;开源社区“断供”,关键核心技术能力不足风险;openGauss生态建设、社区影响力不及预期;国产数据库迁移进度不及预期等。 1.二十余年磨一剑,高斯持续打造世界级数据库 1.1.从内部孵化至共建生态,高斯自研与开源并举 二十余年战略投入,Gauss数据库摘取基础软件皇冠上的明珠。华为进军数据库领域始于2001年,因电信业务快速增长导致客户结算问题频发,依赖国外数据库的弊端显现;面对挑战,华为决定自主编写数据库代码,先在内部使用以确保客户安全,华为坚持以Oracle为标杆,持续打磨,经过多次技术融合和版本迭代,最终推出了强大可靠的分布式数据库GaussDB。目前,GaussDB已在华为内部和银行、保险、证券、能源等行业的核心业务系统得到广泛应用。其发展历程可划分为四个阶段: 2001-2011:内部自用阶段。主要围绕公司的电信业务展开,研发了分布式内存数据库,并应用于自身业务。 2011-2019:联合产品化阶段。华为于2011年底成立实验室,推出了企业级的分布式OLAP数据库、分布式OLTP数据库产品。 2019-2020:云与开源阶段。标志性事件就是2019年5月份,华为面向全球正式发布了以GaussDB为品牌的企业级分布式数据库,开启了与合作伙伴打造数据库产业生态的道路;2019年9月,在华为全联接大会上,华为宣布将开源其数据库产品,开源后命名为openGauss;2020年6月份,openGuass宣布正式开源。 2021-至今:生态构建阶段。2021年以来,GaussDB致力于分享企业级数据管理能力,积极引领生态建设,促进数据库教育事业发展。 图1:GaussDB发展历程 1.2.GaussDB与openGauss定位清晰,合力支撑信创数据库发展 GaussDB侧重于云和分布式特性 , 面向特定行业提供定制化服务,openGauss侧重于开源协作,面向更广泛的用户群体提供标准化和高性能的数据库产品。GaussDB是华为公司倾力打造的自研企业级分布式关系型数据库,该产品支持优异的分布式事务,同城跨AZ部署,数据0丢失,支持1000+扩展能力,PB级海量存储等企业级数据库特性。拥有云上高可用,高可靠,高安全,弹性伸缩,一键部署,快速备份恢复,监控告警等关键能力,能为企业提供功能全面,稳定可靠,扩展性强,性能优越的企业级数据库服务。openGauss作为一款企业级开源关系型数据库,提供面向多核的极致性能、全链路的业务和数据安全、基于AI的调优和高效运维的能力,全面友好开放,致力于构建一个开放的全球合作伙伴生态系统。 GaussDB支持分布式与主备部署,openGauss支持主备部署。在数据库组件上,GaussDB数据库相比openGauss数据库多了协调节点(Coordinator Node)、全局事务管理器(Global Transaction Manager)。组件作为架构实施的物理或逻辑单元 , 对数据库架构有直接影响 , 从而GaussDB数据库与openGauss数据库在架构上有所区别,二者分别呈现为分布式形态整体架构与主备部署整体架构。主备版采用1主2备、1主1备1日志以及单副本的部署形态,其部署主要强调数据的可靠性与业务连续性,适用于数据量不大、增长速度平缓的应用场景,不支持实例扩容;分布式支持独立部署和混合部署,是针对数据量庞大、并发请求高的场景设计的,它可以支持实例的灵活扩展,以应对未来业务增长的需求。 图2:GaussDB分布式部署整体架构 图3:openGauss主备部署整体架构 表1:主备版和分布式版的差异 GaussDB与openGauss在市场定位和架构上的差异,影响了它们在功能特性 、 用户群体等方面的差别,两者合力支撑我国信创数据库的发展。 GaussDB的定位使得其在开发背景和社区支持、功能特性、技术支持与适用场景上,更加侧重满足企业级与关键行业的需求,而openGauss作为开源社区,准入宽松,社区开放,不提供任何商用支持服务,其用户主要是传统上使用免费数据库的客户群 , 或者是自身有强维护能力的企业, 适合大多数场景 ; GaussDB的技术架构则是其能够提供更强大的事务管理和分布式数据处理能力的关键,也是其具备横向扩展能力的原因。两者虽然定位与功能存在差异,然而均支持全栈信创能力,和国产CPU、国产操作系统以及中间件有很好的生态兼容性。 表2:GaussDB与openGauss对比 2.集中式与分布式数据库路线兼顾,高斯禀赋优势显著 2.1.集中式数据库仍为主流,分布式数据库迎来快速发展机遇 信息技术发展使得数据量爆炸式增长,分布式数据库能够有效解决集中式数据库面对大规模数据处理难题应运而生。根据IDC,全球2024年将生成159.2ZB数据,2028年将增加一倍以上,达到384.6ZB,复合增长率为24.4%。 集中式数据库是将数据集中在一台机器上进行处理,被物理地定义到单个位置上的数据库软件;分布式数据库是采用计算机网络将物理上分散的多个数据库单元连接起来组成的一个逻辑上统一的数据库,是在集中式数据库的基础上发展起来的,是分布式系统与传统数据库技术结合的产物,具有透明性、数据冗余性、易于扩展性等特点,适应于存储大规模的数据进行大量的数据处理;还具备高可靠、高可用、低成本等方面的优势,能够突破传统数据库的瓶颈,读取数据和运算的速度更快,满足大规模数据处理和实时数据更新的需求,适应于高并发性、并行运算场景。劣势方面,相比于集中式数据库,分布式数据库稳定性、安全性、保密性不足,管理也更为复杂。 图4:2023-2028年全球数据圈预测 表3:集中式数据库与分布式数据库对比 我国仍以集中式数据库为主,在IT架构转型需求以及海量数据处理需求加持下,未来分布式数据库占比有望提升。根据艾瑞咨询,国内集中式数据库的市场份额高居80%左右,特别是在金融等传统行业对集中式数据库依赖度高。而随着企业业务架构转型,用户系统数据量不断增多、业务布局愈加分散,用户更倾向于考虑高并发、易拓展、多地部署等技术要素,以及海量数据下数据库产品的成本控制,推动着分布式数据库市场快速成熟,具有加大的发展前景。墨天轮数据显示,国产分布式数据库自2019年以来保持高速增长,热度持续高涨,截至2022年11月,该数量达到122个,同比增长45%。从产品来看,随着数字化业务场景的深度,TiDB、OceanBase、GaussDB等国产数据库产品在全球和中国的热度都经年不少。 金融、电信等行业为应对业务系统的海量数据、高并发、实时处理等需求,积极推动分布式数据库建设。现代的分布式核心业务系统利用分布式数据库,以更低的成本,更多的硬件选择,实现更大规模的数据存储能力、更高的业务处理响应能力、更佳的横向扩展能力和更好的容灾能力,显著提升系统处理能力,保证业务连续性,提升客户满意度。根据沙利文,分布式数据库在金融、电信行业用成效明显,在各行业逐步开展应用,涵盖不同类型的业务系统,总体占比达到7%,其中银行业超过了17%,证券业和保险业相对较低。 图5:中国分布式和集中式数据库份额情况(2021年) 图6:国产分布式数据库规模及增速 图7:中国金融业分布式数据库占比情况 此外,云计算的发展也推动着云数据库的推广以及分布式数据库的应用。 2010年起,随着云计算技术的快速兴起,云数据库技术也顺势得到了迅猛发展。 基于云计算,包括数据库在内的IT基础技术发生从技术形态到线上线下融合的大幅变化,数据库技术呈现从传统集中式到云时代分布式迁移替换的趋势。随着数据类型、数据规模的高速增长,传统的终端计算场景已难以应对数据存储处理的工作量与复杂度。而云计算通过存算分离、资源弹性动态分配、边缘节点计算打破了传统计算场景瓶颈,实现了当前数据处理的需求,从而推动了分布式数据库的应用发展。 表4:云数据库的特点 2.2.GaussDB覆盖分布式数据库及工具,形成“五高两易”技术优势 全场景业务,全开放生态,华为云提供关系型数据库产品,非关系型数据库产品和数据库生态工具、中间件服务。关系型数据库如GaussDB,针对金融、电信等行业提供高性能和高可靠性,如RDS系列,助力企业核心数据安全上云。 非关系型数据库如GeminiDB,支持Redis、Mongo、Cassandra、Influx接口,适应互联网和工业互联网等多种场景。数据库生态工具和中间件如DRS、DAS和DDM等,简化了数据库的迁移和管理,助力企业稳定高效处理与分析。华为云GaussDB全栈产品以及解决方案,助力客户实现选型安心、迁移放心