您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[InfoQ研究中心]:中国开源生态图谱2022——数据库领域 - 发现报告
当前位置:首页/行业研究/报告详情/

中国开源生态图谱2022——数据库领域

中国开源生态图谱2022——数据库领域

目录⽣生态图谱解读01⽣生态图谱企业洞洞察02 ⽣生态图谱解读 开源数据库4图数据库时序数据库空间数据库&向量量数据库开源产业联盟代码托管平台开发者社区开源基⾦金金会键值数据库关系型数据库 关系型数据库5定义&分类:中国数据库在2000年年开始发展,虽然起步时间相较国外偏晚,但近⼏几年年增⻓长态势旺盛,同时开源⽐比例例逐年年上升。我国开源数据库产品主要集中在关系型阶段和后关系型阶段,并且以关系型数据库为主,占⽐比约60%左右。数据统计结果显示,2021上半年年中国关系型数据库软件市场规模为11.9亿美元,整体市场同⽐比增⻓长37.2%。发展特征:关系型开源数据库分为OLAP(分析型数据库)、OLTP(交易易型数据库)和HTAP(混合型关系数据库)三种。OLAP和OLTP数据库出现较早,HTAP数据库是混合OLTP和OLAP的应⽤用体系结构,具有强⼀一致性保证,并且融合了了分布式能⼒力力,具备⾼高扩展性。它在历史数据的集成和商业分析的实时性⽅方⾯面有很⼤大的优势。HTAP也被认为是⽬目前数据库发展的主流⽅方向。在关系型开源数据库中,实现HTAP的开源数据库数量量相对较少,⼤大约占⽐比20%。主要数据库产品包括PingCAP孵化的TiDB,百度孵化的BaikalDB、蚂蚁集团孵化的OceanBase、⽯石原⼦子孵化的StoneDB等。关系型数据库 关系型数据库6应⽤用场景:关系型开源数据库是占⽐比最多的,并且应⽤用场景⾮非常⼴广泛。价值追求:⾏行行业⻜飞速发展下,企业在开源数据库项⽬目上,主要看中⾼高扩展,⾼高可⽤用,强⼀一致,⾼高兼容,⾼高性价⽐比,容灾架构等技术特征。1电商新零售的HTAP解决⽅方案2⾦金金融⽀支付的索引⽅方案3游戏⾏行行业的在线⽀支持⽅方案4线上教育的扩容⽅方案5物联⽹网提升运营效率和服务⽔水平6软件服务的稳定性提升等领域关系型数据库 ⾮非关系型数据库7图数据库时序数据库空间数据库&向量量数据库键值数据库定义&分类:⾮非关系型开源数据库主要分为图数据库、时序数据库、空间数据库、向量量数据库、键值数据库。发展特征:•如图数据库可以存储数据间的关系,形成由点到线的数据类型变化;•空间数据库可以存储⽮矢量量数据,能够更更好的⽀支撑AI等研发场景的需求。01起步晚我国⾮非关系数据库发展的历程更更短但也更更新颖,发展的成熟度和应⽤用范围远低于关系型数据库。02上云率⾮非关系型数据库的上云率更更⾼高,甚⾄至很多数据库是云原⽣生数据库。03能⼒力力强更更⾼高的读写能⼒力力,更更多样的格式,同时也更更容易易拓拓展,也就更更适合处理理⼀一些⾮非结构化数据、数据预测度较低的场景。 ⾮非关系型数据库8应⽤用场景:•图数据库应⽤用领域集中在平台、机器器⼈人等智能问答,知识领域的检索升级等情景。•时序数据库经常应⽤用于DevOps(包括服务和服务器器)监控、物联⽹网设备的监控与实时分析等场景。•空间数据库为后起之秀,发展较晚应⽤用前景较⼴广,可以应⽤用于元宇宙、⾃自然资源、国⼟土空间信息、智慧城市、⽣生态⽓气象等场景。•键值数据库应⽤用于电商的数据读取、视频直播类业务和游戏⽀支持等数据量量⼤大、冷热分明的场景。⼚厂商分布:培育开源⾮非关系型数据库的企业主要分为两类:•⾃自身业务有⼤大规模⾮非关系型数据存储和处理理需求的头部互联⽹网企业,如阿⾥里里、京东、腾讯、饿了了么等。•创新型软件服务创业型企业,如PingCAP、涛思数据等数据库⼚厂商。图数据库时序数据库空间数据库&向量量数据库键值数据库 ⽣生态图谱企业洞洞察 Gitee平台托管的开源项⽬目10Gitee指数TOP 4Gitee指数68Gitee指数16Gitee指数9Gitee指数5·说明1:本数据来⾃自于Gitee官⽹网(2022年年10⽉月);其他项⽬目数据尚未更更新。 InfoQ开源项⽬目指数数据说明11一级指标二级指标权重代码健康(40%)代码复制(Fork)10%已修复代码不足(ClosedIssue)10%项目更新申请(PullRequest)5%已完成项目更新申请(ClosedPullRequest)15%社区活跃(60%)协作影响力10%项目荣誉星(Star)10%社区贡献量20%社区贡献者20%•对于开源项⽬目的评价,代码和社区是两项最直接评价指标。•代码的健康度体现为社区成员不不断地修复和更更新代码,形成研发价值的指数级增⻓长;代码健康指标中选取的数据维度来⾃自开源项⽬目在GitHub中的公开数据。•社区活跃是保证开源价值最⼤大化的根本,被开源世界公认的社区价值是评价开源项⽬目最主要的要素,本次研究将其权重赋值超过代码健康;InfoQ研究中⼼心认为,社区活跃价值整体评估⾼高于代码健康价值。•社区活跃中主要数据也来⾃自于GitHub的公开数据;其中协作影响⼒力力数据来⾃自于X-lab研发的openleaderboard中的协作影响⼒力力数据。•所有数据的采集时间均为2022年年10⽉月,在未来,随着时间的推移,数据也会呈现变化。“InfoQ开源项⽬目指数说明 GitHub平台托管的开源项⽬目InfoQ开源项⽬目指数TOP 10InfoQ指数51.50 InfoQ指数39.38InfoQ指数35.16InfoQ指数23.03 InfoQ指数21.96 InfoQ指数21.17 InfoQ指数21.00 InfoQ指数20.93 InfoQ指数20.86 InfoQ指数18.31 12· 数据来源:Github与openleaderboard各项⽬目10⽉月数据。 openGauss:成熟项⽬目治理理下,⽣生态驱动的开源数据库根社区社区治理理与⽣生态发展活跃社区2020.06代码正式开源1.0版本发布2020.07技术委员会成⽴立2020.121.1版本发布2021.032.0版本发布2021.09社区理理事会成⽴立2022.033.0版本发布2022.06品牌委员会成⽴立⽤用户委员会成⽴立2022.093.1版本发布成熟的项⽬目组织架构是⽣生态繁荣的保障理理事会秘书处品牌委员会技术委员会⽤用户委员会SIGSIGSIG由全产业链20家单位组成数据库⼚厂商、企业⽤用户、⾼高校、科研院所10+商业发⾏行行版200+企业加⼊入社区10+关键基础设施⾏行行业108万+社区版下载量量5.4万+社区⽤用户14个⽤用户组24个SIG组4200+社区贡献者2.8万套+累积商⽤用166所⾼高校第⼀一阵营国内数据库流⾏行行度openGauss开源社区⽴立⾜足伙伴、⾼高校、开发者⽣生态发展技术&商业峰会线下Meetup暑期202x开源实习⾼高校课程&活动伙伴⽣生态⾼高校⽣生态开发者⽣生态SIG⽤用户组ISV⽣生态商业发⾏行行版技术培训营销活动鲲鹏&欧拉⽣生态openGauss伙伴⽣生态聚集商业发⾏行行版⼚厂商、ISV,华为为伙伴⽣生态提供技术培训和各类营销活动,借助华为⾃自身⽣生态以及openGauss企业级数据库的创新能⼒力力完善⽣生态发展。openGauss借助伙伴、⾼高校以及开发者⽣生态,提升开源社区活跃度,提⾼高技术碰撞与创新⼒力力。智能基座育⼈人基地 openGauss:聚焦内核关键竞争⼒力力构筑和四⼤大架构创新,赋能⾏行行业核⼼心应⽤用⾼高智能•AI4DB:智能索引推荐、慢SQL诊断,效率提升10倍•DB4AI:20+原⽣生AI库内算⼦子,覆盖主流场景,会SQL就能⽤用AI⾼高安全•全密态机制| 数据防篡改•⾃自主访问控制| 强制访问控制•动态脱敏敏| 数据加密| 安全审计⾼高性能•双路路鲲鹏性能>150万tpmC•四路路鲲鹏性能>230万tpmC•开源分布式⽅方案16节点1000万tpmC⾼高可⽤用•RPO=0,RTO≤10s•Paxos⾃自治共识⾼高可⽤用架构•CM故障⾃自动切换,全域⾼高可⽤用内核关键竞争⼒力力构筑2020.06代码正式开源1.0版本发布2020.07技术委员会成⽴立2020.121.1版本发布2021.032.0版本发布2021.09社区理理事会成⽴立2022.033.0版本发布2022.06品牌委员会成⽴立⽤用户委员会成⽴立2022.093.1版本发布插件化架构uMySQL⽣生态兼容插件u全量量迁移实现单节点1h在线迁移1TB数据u增量量迁移实现每秒钟30000TPS的多线程⽇日志回放可观测内核架构u可观测u可跟踪:基于eBPF全流程跟踪u可诊断:基于AI算法的故障诊断资源池化架构u计算池化:OLTP组件和OLAP组件形成的HTAP架构u内存池化:多节点下的多版本⼀一致性读(MVCC)能⼒力力u存储池化:多节点共⽤用数据数据安全架构u基于同态加密的全密态数据库u基于Tee的密态计算u0切换内存交换协议数据实时交易易分析混合处理理可扩展性提升多模多态需求满⾜足四⼤大架构创新 TiDB:多样社区运营下的开源分布式数据库社区社区数据3.2万个+Star1900个+贡献者1.8万+主题9.6万+PR17.1万+讨论帖16万+地区⽤用户组内容运营活动运营⽤用户运营•DevCon年年度技术峰会•线上/线下InfraMeetup•能量量钛:⾏行行业话题闭源活动•TUG企业⾏行行•Hackathon⽐比赛与Hacking Camp•TiDB产品⽂文档:包括项⽬目概况、整体架构、发⾏行行说明、快速上⼿手等相关说明⽂文件,内容由⼯工程师和⽂文档团队、产品经理理共同完成•视频类内容:PingCAPUniversity,教育潜在⽤用户,同时推出认证活动•论坛AskTUG:问题解决&技术讨论平台培训体系社区治理理社区技术委员会(TOC)社区⽤用户委员会(TUG-MC)SIGTalentPlan地区⽤用户组MOAMVA贡献者Maintainer2015.9TiDB开源2016.12TiDB RC1发布2017.10TiDB 1.0 GA发布2018.4TiDB 2.0 GA发布2019.6TiDB 3.0 GA发布TiDB User Group 正式成⽴立2020.5TiDB 4.0 GA发布2021.4TiDB 5.0 GA发布2022.4TiDB6.0发布多元化的社区运营⽅方式 TiDB:⽴立⾜足⾦金金融级数据库特性,聚焦⾦金金融⾏行行业关键业务场景⽔水平弹性扩展得益于TiDB存储计算分离的架构的设计,可按需对计算、存储分别进⾏行行在线扩容或者缩容,扩容或者缩容过程中对应⽤用运维⼈人员透明,应对⾼高并发、海海量量数据场景。⾦金金融级⾼高可⽤用数据采⽤用多副本存储,数据副本通过Multi-Raft协议同步事务⽇日志,多数派写⼊入成功事务才能提交,确保数据强⼀一致性且少数副本发⽣生故障时不不影响数据可⽤用性。可按需配置副本地理理位置、副本数量量等策略略满⾜足不不同容灾级别要求。实时HTAP提供⾏行行存储引擎TiKV、列列存储引擎TiFlash两款存储引擎,TiFlash通过Multi-RaftLearner协议实时从TiKV复制数据,确保TiKV和TiFlash之间的数据强⼀一致。两类引擎可按需部署在不不同的机器器,解决HTAP资源隔离的问题。云原⽣生的分布式数据库TiDB是为云⽽而设计的数据库,同K8s深度耦合,⽀支持公有云、私有云和混合云,使部署、配置和维护变得⼗十分简单。⾼高度兼容MySQL兼容MySQL5.7协议、MySQL常⽤用的功能、MySQL⽣生态,应⽤用⽆无需或者修改少量量代码即可从MySQL迁移到TiDB。丰富⼯工具链⽣生态具有丰富的⼯工具链⽣生态,覆盖数据迁移、同步、备份等多种场景应⽤用⾏行行业应⽤用场景银⾏行行保险证券第三⽅方⽀支付⾦金金融科技...银⾏行行核⼼心系统⽀支付实时⻛风控在线理理财灾备......2015.9TiDB开源2016.12TiDB RC1发布2017.10TiDB 1.0 GA发布2018.4TiDB 2.0 GA发布2019.6TiDB 3.0 GA发布TiDB User Group 正式成⽴立2020.5TiDB 4.0 GA发布2021.4TiDB 5.0 GA发布2022.4TiDB6.0发布 TDeng

你可能感兴趣

hot

中国开源生态图谱2022——操作系统领域

信息技术
InfoQ研究中心2022-12-16
hot

中国开源生态系列图谱——前端领域

信息技术
InfoQ研究中心2023-08-15
hot

中国开源生态图谱2023——云原生领域

信息技术
InfoQ研究中心2023-03-29