您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[TDBC]:双背景下数据库运维管理的新质生产力 - 发现报告
当前位置:首页/行业研究/报告详情/

双背景下数据库运维管理的新质生产力

信息技术2024-09-22-TDBCZ***
AI智能总结
查看更多
双背景下数据库运维管理的新质生产力

双背景下数据库运维管理的新质生产力 路新英|上海爱可生信息技术股份有限公司 自主·创新·引领 目录Contents 01双背景下数据库运维管理面临的挑战 02新质生产力-多元异构数据库运维管理平台 03爱可生公司介绍 Chapter01 双背景下数据库运维管理面临的挑战 当前数据库运维管理面临的挑战 如何做好多技术栈复杂环境的数据库管理 数据库运行环境复杂:自建IDC、公有云、私有云、Docker 数据库种类、架构、版本复杂:数据库多样性,一种数据库无法满足所有场景需求,结构化与非结构化并存,交易与分析并存数据库架构、版本管理复杂 如何做好多技术栈的SQL治理与优化 数据库迁移替换后,业务上线数据库问题频发,DBA疲于救火 Chapter02 新质生产力——多元异构数据库运维管理平台 数据库运维人员 业务人员/运营人员 自服务RDS 云树DMP(私有云平台管理后台) 数据库服务 安装部署 监控告警 自动巡检报告 性能诊断 备份恢复管理 高可用容灾 数据安全 SQL 审核 数据库自服务 租户管理 运营管理 数据库资源池 MySQL Redis MongoDB TiDB Oceanbase OracleOpenGaussPostgreSQLClickHouse 达梦 计算资源池 裸金属 虚拟化 容器 公有云主机 云树DMP让多种数据库在同一技术栈上标准化交付,统一运维、融合发展,降低多元数据库使用场景带来的 运维难度和成本提升问题,提高企业运维效率 联机交易业务 键值缓存业务文档存储业务HTAP业务联机分析业务 云树DMP 多种数据库常见高可靠及灾备架构 Redis集群架构 MongoDB集群架构 MySQL+CK OceanBaseTiDB ClickHouseOceanBaseTiDB 多业务场景、多品类数据库全生命周期管理 •操作系统参数 •版本管理 •架构选型 •数据库参数 •目录规范 •磁盘分区 •安装方式 •账户安全 •变更规范 告警推送 可视化展示 API调用 监控管理Umon_mgr 监控数据采集 数据库探活、可用性,性能数据 表空间大小、事务数、锁、负载分析 资源使用情况 自动发现监控对象,无需额外配置操作 服务发现 网关收集 直接收集 监控集群 Umon Umon Umon 可扩展 采用云原生监控架构,支持监控数据sharding,可监控上万个监控指标; 采用错峰采集机制,减小被监控对象的负载压力 及时告警 监控目标 网络 数据库 主机 存储 其他服务 告警自定义,阈值告警、多种告警渠道实时通知 升级变更期间可设置告警静默,避免无效告警 健康诊断报告(自动化定时+手工实时)故障诊断 错误日志&DDL进度分析 图形化锁分析 慢日志分析 连接分析 分析当前连接执行的SQL情况,找出运行时间较长的连接,kill高负载的连接 磁盘空间分析 一键清理日志,腾出可用空间,避免DB无法写入 图形化锁分析 快速定位事务的阻塞关系,kill阻塞事务. 慢日志分析 慢日志集中采集,筛选,快速分析需要优化的慢SQL,高频的、延时高的 故障诊断 CPU、内存、磁盘使用分析诊断、会话分析、SQL分析诊断 健康报告 多维度掌握数据库的健康情况,检查出不合理的库表设计,无主键表影响同步性能;冗余索引影响插入性能;主键uuid影响插入性能 多库场景下SQL质量治理更为重要,强依赖数据库专业经验 相同SQL在MySQL与Oracle上性能差异明显 相同SQL在集中式和分布式架构上性能差异明显 相似SQL在同一数据库上性能差异明显 生产 需求创建代码开发持续集成创建镜像 测试环境z UAT环境 部署上线业务运行 问题处理 开发 代码开发 代码测试 部署与发布生产运维 SQL 整改效率 几小时,不影响生产 几天,不影响生产 几天或几周,影响项目周期 几周或几个月,影响生产 SQL治理越早解决成本越低! 提早发现问题SQL •开发阶段及早发现问题SQL,及时整改,避免问题SQL流向生产 CI/CD持续集成系统能力增强 •jenkins集成无缝对接现有流程,增强持续集成系统能力,不改变使用习惯,减低推广难度 全量、增量审核,提升审核效率 •支持扫描配置路径下的全量SQL与变化SQL审核 生产库SQL获取与审核 审核结果 (质量报告) 预警 (发给相关人员) 问题SQL优化 业务应用 运行SQL采集获取 分优先级反馈 SQL审核 优化建议反馈开发协同优化 SQLE 数据库管理员 TOPSQL采集审核 1.根据采集周期SQLE定期获取数据库TOPSQL语句 2.使用语法解析器解析SQL语句,获取SQL执行计划 3.基于规则和执行计划判断SQL是否存在风险。 慢日志采集审核 1.SQLE通过其客户端程序实时获取数据库慢日志SQL语句 2.定期审核:使用语法解析器解析SQL语句,获取SQL执行计划3.基于规则和执行计划判断SQL是否存在风险。 审计日志采集审核 1.SQLE通过客户端程序实时获取数据库慢日志SQL语句2.定期审核:使用语法解析器解析SQL语句,获取SQL执行计划 3.基于规则和执行计划判断SQL是否存在风险。 库表元数据审核 1.根据采集周期SQLE定期获取数据库库表元数据信息 2.使用语法解析器解析SQL语句,获取SQL执行计划3.基于规则和执行计划判断SQL是否存在风险。 云数据库审核 1.SQLE调用RDS的慢日志、审计日志等API获取运行SQL信息 2.SQLE使用语法解析器解析SQL语句,获取SQL执行计划3.基于规则和执行计划判断 SQL是否存在风险。 SQL 预审 是否是 通过 SQL 上线工单 上线审核流程 是否通过 否变更取消 变更SQL否 审核结果、审批执行 回滚语句通过回滚 开发人员 运维人员 SQL 上线 SQL执行 手动/自动执行 执行失败 发布效率提升,发布留痕 •变更SQL一键执行上线,提升发布效率 •手动上线/定时上线 •发布留痕,可追溯 建立标准化发布流程 •所有发布必须通过平台执行,线下人情上线减少100%,问题SQL引起的性能问题减少60% 问题SQL跟踪治理 •问题SQL统计 •问题SQL处理与跟踪 •SQL治理效果汇报 •SQL指纹去重 15 •SQL规则建议 SQL标准规范 1000+ SQLE 规则库 用户经验 专家经验 信通院 《SQL质量管理平台能力分级要求》 专家经验沉淀规范标准 数百家客户经验沉淀爱可生专家经验沉淀 参与信通院SQL质量管理标准编制,汇聚权威经验 规则库覆盖广 DDL规范、DML规范使用建议、全局配置命名规范、索引设计 规则灵活调整 规则参数灵活调整,满足个性业务需求规则数量可按需定制增加,满足个性化需求 •DMP平台汲取100+资深数据库工程师多年运维经验和300+大型项目需求,运维经验沉淀为标准化产品,满足高性能、高可用和数据安全的需求 •DMP平台将运维规范体系融入平台,提供数据库全生命周期管理服务,降低运维复杂性、提升资源利用率、避免重复建设、提高数据库运行效率 •数据库在线迁移 •数据库规格变更 •数据库版本升级 •数据库扩容 •参数变更 •高可用切换策略 •业务发版变更 •数据库归档 •数据库销毁 •定时下线回收 资源回收 资源变更 •选型调研 •开发规范 •运维规范 •不断改进 规范 基线 •架构基线(可靠性、稳定性) •性能基线(高性能、高并发) •部署基线(基础运行环境) •监控告警 •数据库开发及测试 •备份恢复 •性能优化(锁、TOPSQL、慢SQL) •故障分析 •SQL审核与治理 数据库全生命周期管理 资源资源 使用创建 •已有资源纳管 •多种架构(灾备、高可用、分布式、读写分离) •模板管理 •SLA确认(RPO\RTO) 资源 交付 •分钟级别交付 •数据库拓扑信息 •与CMDB对接 资源•资源清单确认 审批 •权限划分 •与OA/ITIL等流程对接 一套平台完成多种数据库统一管理,满足不同应用的使用需求,避免重复建设,降低运维复杂度 项目背景 随着近几年数字化转型进程不断推进,信托业务快速发展,公司积极推进IT架构转型,引入并推广开源数据库。随着开源数据库种类和数量的增加给数据库运维带来不少挑战:开源数据库推广使用需要更多DBA人员投入,数据库运维成本直线上升;开源数据库多种架构的混合管理增大运维难度;数据库的高可用能力建设如何满足不同业务场景的个性化要求;容灾架构如何搭建以满足不同业务灾备体系建设要求;IT资源如何通过资源隔离和容量管理进行资源高效利用;应对数量较多的数据库如何做到精细化监控,及时发现数据库问题 解决方案 爱可生云树DMP数据库统一管理平台,数据库高可用及容灾方案 项目成果 •针对MySQL、Redis、MongoDB数据库进行统一的运维管理。提供智能化、标准化数据库运维能力,数据库从被动式运维走向主动式运营。建立的数据库管理平台,为新数据库选型、扩展奠定基础。 •数据库运维降本增效,提高运维效率,实现了多元数据库统一管理,减少运维成本。 •DMP已支撑中小企业业务系统、消费金融业务系统、证券投资业务系统、家族信托业务系统、财富管理业务系统、运管管理系统等20多个业务系统的稳定运行。 解决方案 全流程SQL采集和审核治理 •从开发设计到生产上线的一体化管理,并将整个SQL审核过程集成到DevOps流水线。 项目管理 •按项目进行资源管理和权限配置,规范化数据管理流程。角色权限控制 •支持开发、项目经理、DBA等多种角色,满足各角色参与数据全流程质量管理的要求。 •细粒度权限管控,支持实例、数据库、表、字段、数据行级不同粒度授权。 助力该客户数字化转型,促进开发测试阶段到生产运维阶段SQL规范设计,提高生产系统、数据库运行稳定性。 业务挑战 •开发人员对SQL开发能力层次不齐,没有太多SQL优化经验;研发到测试过程由研发人员进行自检,无法及时获取SQL优化建议,过程没有SQL质量卡点;在实际运行情况中出现慢SQL,系统卡顿等问题。 •人工审核,SQL数量大,DBA团队压力大,行内使用的数据库种类较多,人工运维效率低下,技术栈复杂,缺乏专家经验进行优化。 •SQL质量管理效率低,SQL治理需要人工拉平信息,缺少统一平台自动化交互,信息不透明,数据的运维变更缺乏标准流程。 业务收益 •IDEA审核,为开发人员提供便捷的“自检”手段,提高开发侧SQL编写和SQL优化质量,提升开发效率。 • • • 对接DevOps和项目管理系统,完成SQL质量的管理和跟踪,实现SQL自动化审核和上线。 补充完善行内运维变更标准流程,形成了SQL全流程质量管理工具。 接入一年SQL审核次数已累计达到了78579次,有效地发现并解决了大量潜在的数据库SQL风险,平均降低了66.84%的生产风险SQL同时形成行内SQL优化知识库。 项目经理 运维人员 开发人员 接入层 全流程管理平台 系统对接 ··· 需求管理对接 项目管理系统对接 DevOps对接 核心服务 项目管理 权限控制 流程管理 质量报表 SQL审核 数据库层 Chapter03 爱可生简介 爱可生深耕数据库行业20年,专注做好数据库智能化运维 公司情况 成立于2003年,20年数据库技术服务经验,国内领先的数据库产品及技术服务提供商, 国家级专精特新、科技小巨人企业 服务辐射全国 总部和研发中心位于上海,下设北京、深圳、武汉分公司,成都、南京、广州办事处 •银行 •政企 •保险 •电信 •零售 •能源 •制造 行业客户 行业贡献 •工信部-信息技术应用创新数据库工作组成员 •人行金融科技产业发展联盟-分布式数据库专委会成员 •参与编写多项数据库行标、团标 解决方案生态建设