多云融合下的IT资源管理体系建设实践 国投证券江正煜 江正煜 国投证券运维开发专家 在国投证券运维开发专家,具备8年运维工具建设与运营经验。当前专注于国投证券智能运维一体化平台建设,主导CMDB、ITIL及自动化等关键运维能力的建设与运营。深耕金融行业CMDB领域,曾深度参与多家金融机构的CMDB平台规划与建设。 contents 目01IT资源管理体系建设思路 录02IT资源管理建设最佳实践 03降本增效:运维管理能力提升 PART01 IT资源管理体系建设思路 IT资源管理体系的几个建设阶段及建设目标 IT资源管理体系建设历程 领导定义 数据问题→资源管理问题 0203 01 平台建设 建设统一的配置管理平台,实现公司内部的配置统一管理和术语统一.结合公司现状,梳理资源模型,制定相应管理规范。围绕核心模型,进行数据丰富,包括操作系统安装代理、各类基础资源平台集成、流程完善等。 数据治理 明确CMDB作为核心数据源的定位,自上而下的推动下,建立技术+管理相结合的数据质量管控体系,持续提升数据质量。通过定期对账、自动化合规检查、一致性校验、消费场景建设等手段,深究数据问题根源,持续提升数据质量。 场景建设运营 基于IT资源的全生命周期管理流程,进行配置数据治理、运营和完善,以及各类消费场景的建设。加速平台从配置管理进阶到IT资源管理,识别管理问题并推动优化,建设IT资源的全生命周期流程,实现闭环管理。 配置管理→IT资源管理 数据反哺←运维场景完善 消费闭环 IT资源管理平台定位 IT运维门户研发管理及运营自动化运维巡检报表及大屏监控应急管理其它场景... 研发及架构管理 需求、项目 架构可视化 DevOps PaaS平台 运营管理 数据资产管理平台 安全运营管理平台 ITIL流程 IT服务 运维管理工具 云管平台 北斗监控 表单低代码 布谷鸟通知 DBaaS 故障演练 统一自动化 日志大数据 IT资源管理平台(CMDB配置数据,支撑全局数据共享) 基础资源采集 云管平台 云新平台 网管系统 DBaaS 容器云 信创私有云 业务及标签信息 北斗监控 统一自动化 安全运营 ITSM 项目及组织架构信息 IAM OA 项目管理 PART02 IT资源管理最佳实践 如何成功建设IT资源管理体系 IT资源图谱定义-模型定义和数据采集 分类与统一:数据融合机制 多云体系下,服务器资源种类繁多,分布散乱,基于来源进行分类,再抽象为操作系统进行汇总,实现管理的统一,并满足分类统计需求。 资源图谱的组成与功能 基于CMDB平台的统一资源管理,生成相应的资源图谱,覆盖多云资源环境 设备下架流程 资源回收流程 设备搬迁流程 轻量级IT资源生命周期管理流程 设备需求 采购入库 设备调配 资产管理系统 设备上架/资源申请 设备上架流程带外监控系统资源平台采集 研发测试 PaaS平台自动化测试 测试部署 统一监控 业务感知 运维日志分析 需自动化 运营监控 统一监控 系统上线 生产部署 APM监控 运维大数据平台 基础资源监控 ITIL平台 统一自动化 设备搬迁 系统下线 结束 ITIL平台 设备下架/资源回收 CMDB IT资源生命周期管理过程与CMDB紧密结合,尽可能的降低用户表单填写工作,既保障数据的鲜活力和准确性,也能降低表单填写成本和误差,实现MRI(MinimumRequiredInformation)轻量级的ITSM。 消费场景与数据治理的相辅相成 问题: 1.监控覆盖度无法准确评估,监控纳管率不高; 2.监控告警查询负责人或归属业务信息准确率不足90%; 收益: 支撑IT资源监控体系建设的同时,也CMDB自身的资源完善度及准确度带来提升。 过程 识别问题设定目标根因分析制定对策实施对策评价结果及 持续跟进 每日、每周跟进 匹配率达到95% 已达到95%以上 解决方案 CMDB标记应纳管监控平台实际纳管 分析原因: 按类解决问题 解决TOP问题 找到根本问题 IT资源图谱多维可视化 资源可视化举例: 系统资源增长趋势图 操作系统虚拟化率 机房资源3D视图 系统架构图 系统服务器资源增长趋势图 机房机柜3D视图 各团队服务器虚拟化率 系统架构图 PART03 降本增效:运维管理能力提升 IT资源精细化管理,保障系统运维既要省、又要稳 IT资源成本分摊模型底座 基于IT资源统一管理,输出基础资源配置及关联拓扑支撑IT成本分摊的数据模型构建,输出多维度成本数据,推动降本增效。 IT成本分摊数据模型图: 系统资源优化及容量规划支持 CMDB的IT资源图谱与监控性能数据结合,输出容量视图及低利用率主机报表,推动资源合理化使用深度分析及优化。 混沌工程:基于系统的IT资源图谱进行故障演练 根据应用资源自动生成系统架构图谱 识别关键节点针对性场景设计 主机节点关联告警分析 混沌工程实践支撑 故障演练平台:CMDB平台支撑工具加速建设 新增资源可自动同步IT资源图谱 对于单一演练场景可基于系统清单批量创建 资源权限控制基于CMDB中的系统及关联的组织架构信息 场景化运维管理能力 运维精细化:ITSIA-IT服务连续性管理 智能运维:算法结合资源拓扑提高运维效率 Thanks GOPS全球运维大会2024·深圳站 高效运维社区DevOps时代 荣誉出品 感谢大家观看