大数据 大数据技术标准推进委员会 大数据技术标准推进委员会 移动云海山数据库技术内幕 大数据技术标准推进委员会 移动云海山数据库:算力网络时代的云原生数据库 大数据技术标准推进委员会 大数据技术标准推进委员会 于巍|移动云 据技术标准推进委员会 大数据技术标准推进委员会 自主·创新·引领 大数据 据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 目录Contents 大数据技术标准推进委员会 01移动云数据库概述 大数据技术标准推进委员会 02海山数据库架构演进 大数据技术标准推进委员会 大数据技术标准推进委员会 03典型案例 大数据技术标准推进委员会 大数据 据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 Chapter01 大数据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 第一部分移动云数据库概述 大数据技术标准推进委员会 大数据技术标准推进委员会 移动云立足云服务商第一阵营,入选国资委首批“创建世界一流专业领军示范企业”名单,开启“成为一流云服务商”新征程 移动云数据库团队十年前正式诞生,以实现数据库核心技术自主可控为目标,目前已构建完整产品和市场体系,并实现大规模商用。 大数据技术标准推进委员会 云能力中心2024 苏州研发中心2020 (2023H2) 中国公有云I+P 服务市场份额第五位 2014 大数据技术标准推进委员会 •基于开源启动商业版产品打造 No.2 •集团内部推广和应用 •启动云改,转型云计算服务商 •海山数据库1.0发布 •云原生进阶,发布海山数据库2.0 •启动算力网络数据库探索和研究 研发团队 规模200+人 资源规模 15+31全国资源覆盖 市场推广 10+中移专业公司 苏州/北京/上海/南京 30万核 9大重点行业突破 No.1 No.2 大数据技术标准推进委员会 大数据 据技术标准推进委员会 大数据技术标准推进委员会 多领域市场份额领先 边缘云 政务云 专属云 大数据技术标准推进委员会 在国家自主可控、中国移动战略转型、云厂商引领数据库发展的多重因素驱动下,移动云将持续坚持自研数据库之路。 党的二十大以实现“高水平科技自立自强”作为目标,“原创性、引领性科技攻关”等,是实现科技自立自强的重要途径。 国资委〔2022〕79号文件要求所有央企、国企、地方国企圈定重要软件和设施等的替代策略。 2023年12月工信部发布《数据库政府采购需求标准》正式版 中国移动一二二五战略,即一个新定位、两 个转变、两个新型、五个红利。 一个新定位 创世界一流信息服务科技创新公司 两个转变 数量规模 当期业绩 质量效益效率 长期价值 两个新型 新型信息基础设施 5G+算力网络+能力中台 新型信息服务体系 连接+算力+能力 数据库是基础软件皇冠的明珠,也是中国移动 战略转型必不可少的一部分 大数据技术标准推进委员会 大数据技术标准推进委员会 国家自主可控 中国移动转型 云厂商引领 1、亚马逊云 2、微软 3、Oracle 4、谷歌云 5、IBM 6、SAP 7、阿里巴巴 8、华为 9、Snowflake 据IDC统计,中国关系型数据库云化部署规 模已超传统部署方式,且增速领先 Gartner2022年DBMS市场厂商排名: 云厂商领衔全球数据库市场 大数据技术标准推进委员会 大数据 据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 大数据 大数据技术标准推进委员会 大数据技术标准推进委员会 内核云原生化 大数据技术标准推进委员会 大数据技术标准推进委员会 深入解耦和重构 大数据技术标准推进委员会 平台云原生化 据技术标准推进委员会 大数据技术标准推进委员会 共性能力统一建设 大数据技术标准推进委员会 移动云一站式云原生数据库服务 数据库传输 事务型 数据库生态工具 数据库管理 数据库自治 分析与检索 NoSQL 海山数据库MySQL版* 海山数据库 L3 海山数据库数仓版 L2 搜索数据库 缓存数据库L1 L2 PostgreSQL版 海山数据库分布式版* L2 L1 L1 L1 向量数据库 文档数据库 L1 算力网络数据库* L4 L1 RDS数据库 (MySQL、PostgreSQL、达梦、TiDB、SQLServer) 多模数据库* (图、时序等) 大数据技术标准推进委员会 移动云基于K8s构建云原生数据库底座,全线产品达云原生L1级 大数据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 自研海山数据库系列,采用存算分离架构,并全面向Serverless演进 大数据 大数据技术标准推进委员会 数据库统一云原生平台底座 *海山数据库MySQL版和分布式版公测中,即将上线 据技术标准推进委员会 *多模数据库正处于研发阶段 *算力网络数据库正处于前期调研阶段 在中国移动算力网络战略下,大力探索算力网络数据库,积极推进相关技术以及行业标准制定 大数据 据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 Chapter02 大数据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 第二部分海山数据库架构演进 大数据技术标准推进委员会 大数据技术标准推进委员会 大数据 大数据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 海山云原生关系型数据库PG/MySQL版 高度兼容:100%兼容PostgreSQL 据技术标准推进委员会 高性能:存算分离架构,冷热数据分离,为用户高性能和低成本 快速弹性:可横向扩展至16个节点,支持最大容量100TB 海山分布式数据库 大数据技术标准推进委员会 金融级要求:分布式事务强一致性,满足会计记账准则要求 备份恢复:全局一致备份恢复,满足数据备份监管要求 数据同步:高并发、高网络时延情况下保证同步性能,零丢失(RPO=0) 海山实时数仓 简洁易用:大规模并行处理提供物化视图全场景统一分析能力 低成本:弹性伸缩,兼容MySQL协议,为用户提供极具性价比的服务 大数据 大数据技术标准推进委员会 He3DB云原生版本采用存算分离数据共享架构。包含PostgreSQL、MySQL两个版本,100%兼容PostgreSQL、MySQL协议,支持1主15备读写分离底层共用一份数据,最大支持100TB数据量存储,RTO故障恢复时延可控制在30S以内,支持联邦内存池缓存命中率相对传统主备模式提升2倍以上,支持秒级在线新增实例,适合大数据量实时在线交易性业务 大数据技术标准推进委员会 He3DB 大数据技术标准推进委员会 计算引擎:提供SQL解析,计算能力。所有写请求转化为日志写,读请求从Page服务获取数据 大数据技术标准推进委员会 He3Store 大数据技术标准推进委员会 存储引擎:异步回放日志成Page数据,最终使用S3作为数据持久层,分为日志服务与Page服务 He3Proxy 大数据技术标准推进委员会 智能中间件:能够感知业务负载,多维度负载均衡选择路由,提供读写一致性能力 据技术标准推进委员会 生态工具 实现业务零感知的秒级备份/恢复能力,提供监控工具,迁移工具,Cluster管理工具 远端存储管理 中间件层 中间件(He3Proxy) 分层实分现层实现高性能 高性能 负载均衡 分区管理 读写分离 大数据技术标准推进委员会 大数据技术标准推进委员会 读写 主节点 本地高速存储层 虚拟共享缓存层 BufferPool本地存储管理远端存储管理日志发送进程 读 本地存储管理 BufferPool 备节点 读备节点 实现联邦内存池,每个节点databuffer负责缓存不同表数据,通过智能中间件路由用户请求,保证大数据量场景下的内存命中率 远端存储管理 本地存储管理 BufferPool 大数据技术标准推进委员会 使用本地盘作为Page高速缓存,保证热数据在本地存储的高命中率 大数据技术标准推进委员会 日志及页面服务层 远端存储管理 大数据技术标准推进委员会 读写日志日志服务 读Page读Page读Page 页面服务 页面归档 回放进程 元数据库 日志Compact KV集群(Raft) 读Log 实现logisdatabase,所有的写转化为日志写,通过对接分布式KV存储,提高写性能 主备节点均无状态,可任意切换。 大数据 大数据技术标准推进委员会 写日志写页面 分布式存储He3FS S3Slice S3Slice S3Slice 据技术标准推进委员会 分布式存储层 大数据 据技术标准推进委员会 问题:常规云原生数据库架构中,每个存储节点随机缓存数据页,消耗资源大且缓存利用率低; 大数据技术标准推进委员会 思路:采用联邦缓存技术,将计算节点内存池化,设置数据分区策略,每个计算节点缓存部分数据,提高缓存利用率。 B7B8 ... 智能路由 分区1 分区2 计算(主) 数据页 分区3 计算(备) 联邦 计算(备) 数据页 联邦 B4B5B6 缓存分区,每个节点根据策略缓存指定块数据,缓存命中率高 分区1分区2分区3 B4B5B6 B1B2B3 数据页 B7B8 B1B2B3 B7B8 ... 友商常规缓存架构 计算(主) 数据页 B7B4 计算(备) 计算(备) 数据页 B5B3B6 每个节点随机缓存数据,缓存命中率低 B4B5B6 B1B2B3 B7 数据页 B1B8 B1 大数据技术标准推进委员会 大数据技术标准推进委员会 架构优化 大数据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 成效:通过联邦缓存池,提高了缓存命中率,将磁盘读取次数减少一倍以上,整体使TPS、QPS等核心性能提升44%以上。 测试方式 测试环境 主 备 QPS 缓存命中数 磁盘读取 缓存命中数 磁盘读取 常规缓存 •架构:一主一备•规格:2C4G; •数据量:800W行,2GB 2,943,697 387,639 2,187,982 352,757 9870.53 联邦缓存 4,502,375 163,333 3,455,374 115,108 14224.84 提升幅度 提高52.9% 减少57.9% 提高57.9% 减少67.4% 提高44.1% 大数据技术标准推进委员会 大数据 大数据技术标准推进委员会 托管数据库 存算一体 主机 备机 全量数据 全量数据 架构在线升级 计算(主) 计算(从) 云原生数据库 计算(从) 部分缓存数据 部分缓存数据 部分缓存数据 •计算无需重启 •存储形态自动切换 •支持双向转换 共享数据访问 全量共享数据 存算分离 计算 计算 数据存储服务2 数据存储服务1 计算 计算 计算 绿色新增 蓝色不变 红色不变 大数据技术标准推进委员会 大数据技术标准推进委员会 大数据技术标准推进委员会 成效:一套代码同时支持中小微客户需求,无需中断服务,实现数据共享与非共享访问模式的无感切换(专利3项) 友商:2次迁移自研:1次迁移+1次无感切换 迁移 ① 迁移 ② 本地RDS云原生数据库 迁移 本地 云原生数据库 据技术标准推进委员会 大数据技术标准推进委员会 数据库迁移场景应用示例 大数据 大数据技术标准推进委员会 解决大数据量场景下(10T),数据库性能波动问题,通过数据切片实现存储节点(DS)横向线性扩展,设置日志回放专用内存缓存提升本地缓存命中,增加对高性能云盘的支持。 大数据技术标准推进委员会 存储节点线性扩展 通过range,table、hash分区策略,增加路由表管理数据切片,实现存储层缓存容量的线性扩展 大数据技术标准推进委员会 日志分片回放 大数据技术标准推进委员会 通过数据分片减少WAL回放数据,无需进行全量回放,实现日志回放速度线性提升 大