企业应用运维管理指标体系 白皮书 ©2022.5iResearchInc. 目录 第一章数字化时代企业IT运维的战略转型3 一、企业IT运维概述3 二、IT运维背景:企业的数字化基础设施和应用现状3 1、国家政策引导数字化支撑企业经营发展3 2、云计算的普及形成了多样化的IT基础设施布局4 3、云原生带来了运维技术和理念的深刻变化5 4、数字经济环境下IT运维的价值创造属性更加显著6 三、数字化时代企业IT运维的战略部署7 1、企业IT运维的全面战略价值7 2、企业的IT运维组织架构革新8 3、企业IT运维的成本效益考量9 四、企业IT运维的需求和难点11 1、数字化时代,企业更需要体系化的运维指导11 2、IT人才成本高企,企业运维需要系统性的知识沉淀12 3、运维部门的战略转型需要疏通与其他部门的协作渠道13 第二章企业应用运维管理指标体系15 一、业务监测16 1、业务数据价值16 2、业务数据分析的作用16 3、运营指标分类17 4、业务分析常见指标说明17 二、用户端体验监测19 1、用户端体验监测价值19 2、用户端数据分析作用19 3、用户端监测实现形式19 4、用户端监测常见指标说明20 三、应用端监测21 1、应用端监测意义21 2、应用监测价值22 3、应用监测常见功能23 4、应用监测常见指标说明23 四、网络监测23 1、网络监测价值23 2、网络监测常用实现方式24 3、网络监测常见指标说明24 五、资源层监测25 1、资源层监测价值25 2、资源层监测包含内容25 3、资源层监测常用指标26 六、中间件监测26 1、中间件价值26 2、消息中间件常见指标27 3、交易中间件常见指标27 七、数据库监测28 1、数据库价值28 2、数据库分类28 3、数据库监测常用指标说明29 第三章企业应用运维管理指标体系建设实践30 一、企业应用运维管理指标体系建设指导思想30 1、指导思想30 2、业务全面梳理30 3、确定应用关键动作31 4、预定义各关键指标31 5、企业应用运维管理平台32 二、企业应用运维管理指标体系建设步骤33 步骤一:调研33 步骤二:验证36 步骤三:阈值37 步骤四:评价体系39 步骤五:闭环39 三、指标体系常用场景40 特别鸣谢41 附:本报告专业名词释义42 公司介绍/法律声明43 版权声明43 免责条款43 联系我们43 微信公号43 第一章数字化时代企业IT运维的战略转型一、企业IT运维概述 IT运维是企业对其所拥有和管理的IT软硬件资源设施进行监测、维护、优化的过程。 企业的IT运维工作根据运维视角和对象的不同可以分为企业侧的基础设施运维、应用系统运维、网络通信运维以及用户侧的用户体验管理等。 IT基础设施运维面向CPU、存储器等基础硬件操作系统,中间件、数据库等基础软件,确保企业IT系统的可用性、安全性和连续性,提高企业IT系统的运行效率和服务质量,是企业信息化依赖的基础和根本。在IT基础架构云化的背景下,面向基础云服务的运维管理也被纳入IT基础设施运维的范畴中。应用系统运维主要面向企业的各项内外部数字服务,对其应用性能和表现进行监控和实时优化,从而确保各项功能正常运作,提升使用者的交互体验。网络通信运维面向企业的网络架构,关注网络通信的速度、稳定性和延迟等方面的表现,确保企业的网络处于高质量运行水平,提供良好的信息传输体验。 随着互联网服务深入千行百业,数字化应用成为企业和机构为用户提供服务的重要形式,直接对用户体验环节进行监测和优化成为IT运维的新思路和途径,相较于传统的面向企业IT资源的运维,面向用户体验的IT运维方式更加聚焦于前端业务侧,能以更显而易见的方式提升各项服务的表现。随着互联网经济的发展,这一运维思路已在企业中得到了充分实践。 二、IT运维背景:企业的数字化基础设施和应用现状 1、国家政策引导数字化支撑企业经营发展 以数字化工具为代表的前沿科技已经成为企业经营发展的重要推动力以及社会重要生产力,一直以来国家政策对数字化建设保持着积极乐观的支持态度,近两个“五年规划”均提及了支持企业通过数字化转型升级提升经营能力和水平。在此环境下,各部委和地方政府也在不断出台鼓励政策,支持数字经济发展,推动数字能力向传统企业渗透,赋能传统提升经营效率。 从细分领域上看,近年来云计算仍然是国家和行业科技政策的重要方向,由云计算带来的企业IT基础设施多样化的问题将对IT运维持续产生需求。此外,近年来政策不断强调企业应当在数字化建设的过程中更明确地确立数据的资产地位,更有效地发掘数据的商业价值,以数据应用赋能企业的数字化建设乃至主营业务的发展,对于金融等数字化深度融合的行业尤其如此,各行业主管部门也在加强对数据和智能应用的推进。 表1:近年来与企业IT数字化建设相关政策梳理 2、云计算的普及形成了多样化的IT基础设施布局 近十年来基础云服务在国内企业间深度渗透,各行各业和不同规模的企业以不同的方式部署了基础云计算产品。其中,中小企业通常无力也无必要部署私有的服务器,更倾向于使用公有云服务获取低成本的IT资源;而大型集团企业或者具备系统性重要性的行业企业出于合规和数据安全考虑,更倾向于同时使用公有云和私有云,将不同类型的数字功能部署在不同位置,由此,混合云成为了金融、交通、政务等关键行业企业的普遍选择。 图1:2021年全球企业的用云方式 图2:2021年全球企业的混合云用云方式 多云和混合云使得企业的基础IT资源架构复杂化,提升了企业运维的洞察力要求。此外,基础云服务本身作为一种计算资源的获取方式,实际上是企业利用网络通信资源来代替本地化部署的计算资源。因此,企业为了保障基于云服务的数字应用质量,需要同时对网络通信的质量进行监控,构建全方位的IT资源监测和优化体系。 3、云原生带来了运维技术和理念的深刻变化 云原生已经迈过了概念期,在各行业得到了充分应用,未来还将进一步推广。云原生体现了云计算发展的下一阶段的模式:以容器技术以及微服务架构为基础,云原生模式下企业调用云资源的颗粒度和弹性都能够得到显著提升。同时,经微服务改造、运行在容器环境下的应用程序架构和管理也更加复杂,需要更具深度和洞察能力的运维工具对其进行透视,帮助企业监测云原生应用的运营状况。 图3:2019&2020年中国企业容器使用方式 除了给企业的IT基础架构以及运维手段带来改变,云原生也对企业运维部门的工作方式方法造成了深刻影响,典型代表是DevOps(开发运维一体化)理念和实践的推行。 在DevOps推广之前,企业IT部门下属的软件开发和运维部门是两个比较独立和割裂的体系,由不同的员工负责。在这种传统模式下,两部门各有不同的利益关切,在技术协调和工作协同方面的沟通受阻,导致整体的工作效率不高。DevOps的首要作用在于通过云原生架构为开发和运维部门提供一致性的工作环境,使得开发人员能够便捷地参与运维工作,从而将原本割裂的两个部门体系打通,提升软件工程的整体效率。DevOps的推广与云原生架构的普及密切相关,因此,也可以认为云原生技术给企业运维部门的工作方式和流程带来了改变。 4、数字经济环境下IT运维的价值创造属性更加显著 除了IT基础设施形式及技术更迭之外,企业应用层的变化也在影响着运维部门的任务与长期价值。产业数字化和数字产业化在三次产业中的渗透率正在不断提升,其中尤其以第三产业最为突出。数字经济的深化发展使得企业经营活动的形态发生了显著的变化,以数字形态和互联网渠道发生的经营合管理活动越来越多,形式创新也在不断更迭。 图4:2016-2020年中国三次产业的数字经济渗透率 图5:2013-2020年中国有电子商务交易活动的企业数比重 企业经营活动的转型使得运维工作的密集度、重要性和战略价值都出现了提升,此前企业的IT系统主要面向内部使用,现在新增了大量面向客户提供服务的模块,从而使得企业的运维质量直接关系到客户的使用体验以及对企业的整体评价,进一步影响企业的市场形象和品牌价值。对于互联网娱乐、互联网金融等体验属性较强的业务而言,上述影响更加显著,这也使得这些企业对数字化环境中的IT运维建设格外看重。 运维工作在直接影响数字服务质量的同时,也会影响企业内部系统的性能和稳定性,尤其对于开发侧而言,能否获得高效稳定的开发环境在一定程度上决定了企业的数字应用迭代效率,对于数字服务企业而言,这是构成其市场竞争力的重要方面。结合了大数据和人工智能算法之后,企业能够借助运维工具进一步提升运维工作的效率和准确率,并为业务侧带来更富洞见的分析指标。 三、数字化时代企业IT运维的战略部署 1、企业IT运维的全面战略价值 整体来看,IT运维工作能够为企业带来三方面的价值:通过更加精确的资源需求统计,帮助企业降低冗余的IT投入,从而带来直接的会计价值;企业在数字化环境下,运维部门通过业务大数据分析能够指导业务部门的产品改良或创新,由此有望为企业带来业务创收,这部分价值也应当纳入管理层对运维部门成本效益的考量;此外,由运维创新带来的企业服务质量的提升能够帮助企业提升市场形象,由此带来的品牌价值尽管无法估算,但对于企业的经营和发展仍然有着重要意义。 图6:IT运维创新给企业带来的多重价值 为了充分发挥上述价值,尤其是对业务部门和公司品牌的价值,运维部门需要在运维工作的开展方式上进行优化。传统视角下,运维部门着眼于归属企业的IT资产端,以保证在内部视角下IT系统稳定运行,但在数字化时代,运维工作更需要从用户视角出发,也就是从应用端着手,将提升应用端的高质量体验置于优先地位,“自上而下”地进行从应用端到资源端的穿透,从而为企业整体带来提升用户粘性和品牌声望的提升。 2、企业的IT运维组织架构革新 IT运维部门在企业中的组织架构关系也体现着运维的具体工作内容以及对企业的意义。运维部门通常隶属于CTO,与开发、集成等其他信息技术部门并列。在传统的企业架构中,IT运维属于不直接创造价值、仅仅为支撑前端业务运营而存在的“后台”部门,其支出也被理解为纯粹的费用,比较难以获得企业的主动投入和规模建设。随着企业数字化转型的开展,运维部门除了发挥固有的IT支撑作用之外,还开始通过业务系统数据洞察来帮助和指导企业的数字化业务创新,从而具备了一定的“中台”作用。 图7:企业IT运维部门的组织架构关系 运维部门要充分发挥对业务侧以及企业整体的赋能价值,在配备具备大数据、智能分析等运维产品之外,也需要在组织架构方面进行改良。企业需要创设业务侧与运维部门的沟通渠道,并将之形成固有的制度体系,使得运维部门的建议能够传达到业务侧并有效落实——由于涉及到企业的组织架构调整,这可能是一个相对缓慢的过程,但对于企业IT能力的充分发挥至关重要。 3、企业IT运维的成本效益考量 在IT运维充当“后勤”的时代,企业对于运维部门的成本效益考量相对简单,主要参考的是运维产生的各项投入以及最终的IT系统表现:基于传统的IT基础设施,企业通常采用横向扩容的方式提升灾备和可用性,新一代运维服务能够以更低的成本解决这些问题,从而节省企业购置服务器、网络带宽等基础设施的费用,形成前述的直接可见的部门内会计价值。 从运维部门的成本投入上看,以运维服务器(如监测服务器、备份服务器等)为代表的运维硬件的购置成本和设备运行过程中产生的电力及损耗占据60-70%的比例,其他成本主要包括运维软件及IT人力投入。通过智能化、体系化的运维创新,企业能够减少占较大比重的运维硬件固定投入,并降低重复性的人力投入,将优秀的IT设备和人才资源投入到更具创造性的开发工作中去。 图8:企业运维部门成本结构估算 在新兴的智能运维领域,在提升可用性、稳定性之外,智能运维的重要价值就在于减少重复的人工投入,提升自动化水平,因此企业在评估智能运维成效的时候,也需要综合考虑智能运维的这一属性为企业带来的成本优化。对于运维数据体系建设较完善的企业,还应当将运维给业务部门带来的价值增量纳入考察范围,由于基线难以确认,又涉及企业组