开源数据库⽣态发展研究报告 —MySQL开源数据库 (2023年) GreatSQL开源社区北京万⾥开源软件有限公司 云计算开源产业联盟2023年9⽉ 版权声明 本报告版权属于GreatSQL开源社区、北京万⾥开源软件有限公司和云计算开源产业联盟,并受法律保护。转载、摘编或利⽤其它⽅式使⽤本⽩⽪书 ⽂字或者观点的,应注明“来源:GreatSQL开源社区、北京万⾥开源软件有限公司和云计算开源产业联盟”。违反上述声明者,编者将追究其相关法律责任。 前⾔ 近年来,随着数字化转型深⼊推进和数据量的爆炸式增⻓,⾏业应⽤对数据库的需求变化推动数据库技术加速创新,其中以MySQL数据库为代表的开源数据库发展迅速。全球开源数据库兴起于20世纪90年代,⾃此开源数据库不断推出,⽬前共268款,占全部数据库⽐例40.9%。MySQL数据库由于低成本、⾼可靠性等优势特性,成⻓为⽬前流⾏的开源数据库,我国紧跟MySQL数据库主流技术,基于MySQL技术路线的数据库持续发展与完善,应 ⽤场景不断丰富。 在此背景下,云计算开源产业联盟发布《开源数据库⽣态发展研究报告》。本报告从MySQL数据库发展现状、MySQL数据库技术创新、我国MySQL数据库产业应⽤三⽅⾯梳理了发展情况,并展望了发展趋势。发展现状⽅⾯,梳理了MySQL数据库发展的关键阶段、市场规模、MySQL数据库技术演进的主要⽅向以及开源安全合规等问题。技术创新⽅⾯,分析了MySQL数据库的核⼼优势。产业应⽤⽅⾯,以⾦融、能源、电信⾏业为代表,调研了当前我国重点⾏业MySQL数据库应⽤现状、应对MySQL数据库⽆法持续运 ⾏的解决⽅案以及下⼀步应⽤趋势。最后,本报告还针对我国基于MySQL技 术路线的开源数据库提出了产业发展建议。 ⽬录CONTENTS ⼀. 1. MySQL数据库发展现状1 2. 数据库产业⽀撑数字经济蓬勃发展,MySQL成为当前数据库技术主流2 3. 开源持续推动MySQL数据库技术快速迭代,我国紧跟主流路径实现⼆次突破4 4. MySQL数据库全⾯赋能产业优化升级,我国MySQL市场规模仍在快速扩张8 ⼆. 软件供应链趋于复杂化和多样化,MySQL数据库开源⻛险不断加剧11 1. MySQL数据库技术创新重点13 2. 组复制技术进⼀步增强数据⼀致性14 3. MySQL双活架构实现数据库⾼可⽤16 4. 数据库优化,突破MySQL性能瓶颈17 5. MySQL技术路线数据库⼚商筑牢数据安全防线18 三. 多种数据库迁移⽅案助⼒MySQL上云19 1. 我国MySQL数据库产业应⽤现状21 2. 30 开源数据库在各⾏业使⽤现状22 四. 3. 各⾏业针对MySQL5.7版本数据库⽆法持续运⾏事件迁移意愿国内开源数据库社区未来发展⽣态分析33 我国MySQL技术路线开源数据库产业发展建议36 图⽬录 图1数据库连接上下游资源3 图22023年6⽉DB-Engines数据库排⾏榜4 图3MySQL发展历程6 图42022年MySQL实例全球分布6 图5⾦融⾏业细分领域开源数据库使⽤占⽐23 图6⾦融⾏业业务系统开源数据库使⽤占⽐23 图7⾦融⾏业MySQL部署量占数据库总量占⽐24 图8⾦融⾏业MySQL开源数据库应⽤套数25 图9⾦融⾏业MySQL5.7版本部署占MySQL总部署⽐例25 图10⾦融⾏业熟悉MySQL运维技术⼈员数量在团队中占⽐26 图11⾦融⾏业使⽤MySQL技术服务来源26 图12⾦融⾏业认为MySQL开源数据库的主要优势27 图13⾦融⾏业认为MySQL开源数据库的主要问题28 图14⾦融⾏业是否知道MySQL5.7版本⽆法持续运⾏事件31 图15⾦融⾏业应对MySQL5.7版本⽆法持续运⾏⽅案31 图16⾦融⾏业选择替换MySQL5.7版本优先考虑的因素32 表⽬录 表1国内开源数据库社区⽣态数据34 1 ⼀. 第⼀章 MySQL数据库发展现状 ⼀.MySQL数据库发展现状 1.数据库产业⽀撑数字经济蓬勃发展,MySQL成为当前数据库技术主流 数据库作为数字经济基础底座,展现出巨⼤价值和潜能。在数字经济时代,数字产业发展有良好的机遇,同时也⾯临严峻的挑战。在数字产业化⽅ ⾯,数据库作为⼀种⾼效、可靠和安全的数据存储和管理⽅式,极⼤提⾼了数据的利⽤率、准确性和可靠性,被⼴泛应⽤于各个领域。在产业数字化⽅ ⾯,数据库作为数据获取、存储、管理、分析的关键要素,以价值释放为核 ⼼,以数据赋能为主线,对产业链上下游进⾏全要素数字化升级、转型和再造,在数字经济时代其战略性、基础性的地位愈发凸显。通过带动数字产业化与产业数字化发展,数据库已经成为数字经济坚实底座。 数据库作为连接上层应⽤和底层基础资源的纽带,具有重⼤的价值。⾸先,数据库为上层应⽤提供⾼效的数据管理和操作功能。数据库提供了易于使⽤的接⼝和查询语⾔,使得应⽤程序可以轻松地与数据库进⾏交互。通过数据库连接,上层应⽤可以实现数据的存储、查询、更新、检索和删除⼯作,满⾜应⽤程序对数据的需求。其次,数据库为底层基础资源提供统⼀的数据访问接⼝。通过连接底层基础资源,数据库能够直接与存储设备、⽹络通信和系统资源进⾏交互。这种连接能⼒使得数据库能够有效地管理数据的物理存储,实现数据的持久性和可靠性,同时也为应⽤程序提供了⾼度的可扩展性和可定制性。 图1数据库连接上下游资源 在全球主流数据库中,MySQL⼀直是流⾏的开源数据库,拥有⼴泛的受众。根据DB-Engines在2023年6⽉发布的流⾏度趋势排名,⽬前全球前四的数据库依次为Oracle、MySQL、MicrosoftSQLServer和PostgreSQL,均为关系型数据库。MySQL是⼀种开源关系型数据库管理系统(RDBMS),由瑞典MySQLAB开发,后分别被SunMicrosystems和OracleCorporation收购。MySQL以其 ⾼性能、可靠性和可扩展性⽽闻名,⼴泛应⽤于各种规模的应⽤程序和⽹站。它⽀持标准的SQL查询语⾔,并具有丰富的特性和功能,如事务⽀持、复制、集群和分区等。在DB-Engines流⾏度排名中,MySQL已连续数年位于流⾏度前两位。在关系型数据库中,MySQL也有着较⾼的市场份额。根据2022年Slintel ⽹站的统计数据,在全球关系型数据库市场中,MySQL市场份额最⾼,达到43.04%,排名第⼆的Oracle仅为16.76%。MySQL市场份额⼏乎占据关系型数据库市场半壁江⼭,已经成为事实上全球范围内影响⼴泛的开源数据库。 13009756503250 Oracle MySQL MicrosoftSQLServer PostgreSQL 图22023年6⽉DB-Engines数据库排⾏榜 2.开源持续推动MySQL数据库技术快速迭代,我国紧跟主流路径实现 ⼆次突破 开源推动MySQL数据库技术持续⾰新。MySQL的发展过程主要分为四个阶段,第⼀阶段是孵化期。MySQL的历史最早可以追溯到1979年,距今已有44年历史。1996年,MySQL1.0发布,在⼩范围内使⽤,同年10⽉,MySQL⾸个稳定版本3.11.1发布。1999年,MySQLAB公司成⽴,并开发出BerkeleyDB引擎,⾄此,MySQL开始能够⽀持事务处理。 第⼆阶段为起步期。2000年,MySQL公布了⾃⼰的源代码,并采⽤GPL (GNUGeneralPublicLicense)许可协议,正式进⼊开源世界。在MySQL开源后,平均2-3年便能够进⾏⼀次较⼤规模的版本更新,开发进度⼤⼤加快。2000年4⽉,MySQL对旧的存储引擎进⾏了整理,命名为MyISAM。2005年10⽉,MySQL发布了⾥程碑的⼀个版本MySQL5.0。MySQL5.0中加⼊了游标、存储过程、触发器、视图和事务⽀持。在5.0之后的发布版本,MySQL明确地表现出迈向⾼性能数据库的发展步伐。 第三阶段为成⻓期。2008年1⽉,MySQLAB公司被Sun公司以10亿美⾦收购,MySQL数据库进⼊Sun时代。同年11⽉,MySQL5.1发布,它提供了分区、事件管理,以及基于⾏的复制和基于磁盘的NDB集群系统,同时修复了⼤量的Bug。2009年4⽉,Oracle公司以74亿美元收购Sun公司,⾃此MySQL数据库进 ⼊Oracle时代。在Oracle的管理下,MySQL的发展⽅向发⽣了变化。Oracle不仅加强了MySQL的商业化开发,也积极推⼴MySQL的社区版。这使得MySQL的⽤ ⼾和开发者得到了更多的选择和⽀持,同时也加快了MySQL的开发和更新。2010年12⽉,MySQL5.5发布,其主要新特性包括半同步的复制及对SIGNAL/RESIGNAL的异常处理功能的⽀持,最重要的是InnoDB存储引擎终于变为当前MySQL的默认存储引擎。2011年4⽉,MySQL5.6发布,作为被Oracle收购后第 ⼀个正式发布并做了⼤量变更的版本,对复制模式、优化器等做了⼤量的变更,其中最重要的主从GTID复制模式⼤⼤降低了MySQL⾼可⽤操作的复杂性。 第四阶段为成熟期。2013年4⽉,5.6版本GA后,新特性的变更开始作为独 ⽴的5.7分⽀进⾏进⼀步开发,在并⾏控制、并⾏复制等⽅⾯进⾏了⼤量的优化调整,5.7版本正式GA于2015年10⽉份,这是MySQL到⽬前为⽌较为稳定的版本分⽀。2016年9⽉,Oracle决定跳过MySQL5.x命名系列,并抛弃之前的MYSQL6、7两个分⽀,直接进⼊MySQL8版本命名,也就是MySQL8.0版本的开发。2018年4⽉,MySQL8.0正式发⾏。 图3MySQL发展历程 我国紧跟MySQL主流技术,基于海量场景不断深化技术发展。根据ShadowserverFoundation在2022年发布的MySQL扫描报告,在全球⽬前共有360万个MySQL实例,其中我国MySQL实例数占⽐为15.8%,仅次于美国的 32.5%。根据2022年CSDN的中国开发者调查报告数据,我国有73%的开发者都在使⽤MySQL,稳居第⼀名,遥遥领先其他数据库。其中,涌现出了诸如GreatSQL、PolarDB-X、StoneDB、TenDBCluster-TenDB、AliSQL开源社区等 ⼀批优秀的基于MySQL技术路线的开源社区。 我国紧跟MySQL主流技术,基于海量场景不断深化技术发展。根据ShadowserverFoundation在2022年发布的MySQL扫描报告,在全球⽬前共有360万个MySQL实例,其中我国MySQL实例数占⽐为15.8%,仅次于美国的 32.5%。根据2022年CSDN的中国开发者调查报告数据,我国有73%的开发者都在使⽤MySQL,稳居第⼀名,遥遥领先其他数据库。其中,涌现出了诸如GreatSQL、PolarDB-X、StoneDB、TenDBCluster-TenDB、AliSQL开源社区等⼀批优秀的基于MySQL技术路线的开源社区。 GreatSQL社区成⽴于2021年,由万⾥数据库发起,致⼒于通过开放的社区合作,构建国内开源数据库技术及开源数据库社区,推动我国开源数据库及应 ⽤⽣态繁荣发展。社区于2021年8⽉发布⾸个版本8.0.25-15,并于2022年成为 ⾸个加⼊openEuler⽣态的MySQL技术系国产开源数据库。2022年4⽉,GreatSQL发布5.7系列⼤版本。⽬前社区结合当前国内开源数据库市场需求,保持每半年发布⼀个产品新版本的节奏。 PolarDB-X社区成⽴于2019年,由DRDS进⾏品牌升级⽽来。PolarDB-X1.0 ⽀持以PolarDBMySQL作为存储节点,⼤幅提⾼集群IO能⼒以及柔性分布式事务,且⾯向政企客⼾需求增强了安全特性,例如:⼀致性备份恢复、SQL闪回、SQL审计等。PolarDB-X2.0是阿⾥巴巴分布式数据库⼤幅度的版本更新。产品基于透明分布式理念提供了默认主键拆分策略、基于TSO和MVCC的⾼性能