您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[Transposit]:2022年DevOps自动化状况报告 - 发现报告
当前位置:首页/其他报告/报告详情/

2022年DevOps自动化状况报告

2022-09-05-Transposit陈***
2022年DevOps自动化状况报告

DevOps自动化状态 2022 换位 DevOps自动化状态12022 目录 管理人员钥匙数字影响 EvolvingTechStack上 概括发现 的转型和混合工作事件响应 服务事件正在发生 更加复杂和具有挑战性 解决 自动化与SRE实践减轻服务事件的复杂性 1516 结论 调查受访者人口统计 转运/transposit.com DevOps自动化现状|2022 执行摘要 数字化转型继续加速并成为整个企业的关键业务战略,因此需要更快地交付创新。同时,混合工作将企业推入了超数字化时代,并放大了ITOps的复杂程度 球队面临。这种转变凸显了公司的低效率,包括手动和复杂的流程,因为他们遇到资源紧张和停机时间增加。 第二次年度行业调查,共有1,046名IT运营、DevOps和站点可靠性工程(SRE)专业人士担任美国副总裁、总监、经理和个人贡献者 员工超过30人的组织被带到: 更好地了解ITOps、DevOps和SRE团队如何应对 随着不断发展的现代堆栈、事件和问题解决方案的需求增加确定团队在解决事件和自动化障碍时面临的挑战 评估组织实施自动化和SRE实践的机会 实现高效运营 调查结果强调了随着组织继续采用混合工作环境并执行数字化转型,对自动化和SRE实践的需求日益增加倡议。由于流程效率低下、修复时间较长和缺乏自动化,团队不得不扩展他们的技术堆栈。该研究还发现,更好的协作方法和工具以及利用人类判断是成功增强 服务可靠性,更快地解决事件并扩展自动化。 转运/transposit.com DevOps自动化现状|2022 关键发现 62.9%的受访者表示,在过去一年(3月2日至21日至今)影响客户的服务事件频率有所增加。 2 服务事件增加的主要原因是数字化转型 (6o.7%)、推出新产品或产品更新(55.1%)以及协作方法和工具未能充分支持他们的团队远程工作 (49.3%)。 3.52.3%的受访者表示去年解决事件所需的时间有所增加,48.6%的受访者表示需要15-30分钟才能将合适的团队成员聚集在一起解决事件。 4 45.7%的组织在过去12个月内经历了6到19次重大事件。 5.39.7%的受访者表示,他们组织的停机时间成本在去年(2021年3月至今)有所增加。 5.为了在未来12个月内改进事件管理流程,组织计划 实施新的自动化工具或应用程序(48.2%),实施新的通信) 协作工具或应用程序(41.5%)并实施新的集成工具或应用程序(4o.6%) 75.6%的受访者表示,在过去的12个月中,他们的组织越来越关注站点可靠性工程实践。 8.83.2%的受访者表示,高达50%的工程运营流程是自动化的。 9.8o.4%的受访者表示,自动化应该让人类在关键决策点使用他们的判断更加可靠和有效。 10.9o%的受访者表示,他们的组织会跟踪人类在解决事件期间采取的行动,但56.5%的SRE表示他们将这些数据手动输入到ITsM系统或其他系统或记录中。 转座|转座.com DevOps自动化现状|2022 数字化转型的影响和 HybridWorkontheEvolvingTechStackfor 事件响应 数字化转型仍然是企业的头等大事,90.2%的组织 报告在去年增加了对数字化转型的关注——仅下降3% 来自2O21研究。这种对数字化转型计划的持续重视,加上采用混合工作模式的组织的增加,从2021年的 50.4%跃升至73.5%,推动了73.4%的公司扩展其技术堆栈。 贵组织采取了哪些措施来应对大流行带来的与劳动力相关的变化? 73.4%已扩大他们的技术堆 栈与新工具/平台 55%雇佣了更多人15.8%减少 团队成员人数 在使用新工具和平台扩展技术堆栈的人中,98.4%的人表示他们将在可预见的未来继续使用它们。 尽管添加了新工具,但组织仍然缺乏平台的完全集成和 事件响应期间使用的服务,使解决事件变得更具挑战性。 事实上,只有24.7%的受访者表示他们的所有工具都通过一个工具或平台集成, 这比2021年的研究下降了19.1%。 转座|转座.com DevOps自动化现状|2022 我们所有的工具都通过一个工具或平台集成24.7% 我们的一些工具通过一个工具或平台集成49.2%24.7% 11.9% 我们将所有工具与聊天平台集成11.2% 我们将我们的一些工具与聊天平台集成7.3% 我们的工具未集成6.9% 如果75.3%的组织没有完全集成用于事件响应的工具,团队将面临延迟补救过程和增加停机时间的风险,这可能导致服务质量可靠性下降,并最终影响运营。 有58.2%的受访者表示 停机时间(即应用程序中断、服务降级)使他们的组织成本高达 平均每小时499,999美元,公司不能浪费时间在各种 不同的工具和手动采取行动 转座|转座.com DevOps自动化现状|2022 服务事件正在变得更加复杂和挑战解决 调查结果表明,加速的数字化转型计划、混合工作和不断扩大的技术堆栈增加了技术运营、DevOps、 SRE和 IT团队受到越来越频繁的服务事件的困扰,这些事件影响了客户,并且在尝试解决事件时遇到了挑战 。 62.9%的受访者表示频率增加影响客户的服务事件,以及69.5%的受访者表示,负责可靠性工程的个人正面临挑战 试图解决正在发生的事件 而观察到服务频率增加的总百分比 事故比去年的研究减少了27.5%意味着一些组织已经调整 大流行带来的大规模数字化转型-大多数人仍然报告事件增加。这表明团队在减少事件和解决它们发生的问题方面仍然需要更多支持。 在过去一年(2021年3月至今)的整个过程中,您是否观察到任何变化 影响您的客户的服务事件的频率? 1-25%增加26.9% 1.5%0.2% 26-50%增加25.0% 超过50%增加11.0% 26.9% I没有变化28.6% 11.0% 1-25%下降6.8% 26-50%减少1.5% 超过50%下降0.2% 转运/transposit.com DevOps自动化现状|2022 在报告服务事件增加的受访者中,受访者认为最重要的因素是数字化转型(6o.7%)、推出新产品或新产品 更新(55.1%),协作方法和工具不能充分支持他们的团队远程工作(49.3%)。 组织变革的数字化转型(例如, 基础设施(例如,云 团队成员流失,涌入60.7% 迁移)60.7%新团队成员,并购 活动)45.4%55.1% 推出新的招聘挑战,例如 产品或产品缺乏合格的候选人或 49.3% 更新55.1%无法将招聘规模扩大为fsst 作为企业30.1% 45.4% 方法和工具 30.1% 合作没有实施帮助 非常支持他们的团队预防事故或加速 21.9% 远程工作49.3%事故缓解21.9% 由于团队不得不使用新工具远程解决事件并推动数字化转型计划的复杂性,52.3%的团队表示在过去一年中解决事件所需的时间有所增加。 1-25%增加23.9% 1.5%0.2% 26-50%增加20.0% 11.3% 超过50%增长8.4% 23.9% 无变化34.7% 1-25%下降11.3% 34.7% 20.0% 26-50%减少1.5% 超过50%减少0.2% 转座|转座.com DevOps自动化状态12022 团队在采取行动解决事件时面临的三大挑战是: 设计的脚本 以专业的方式接触合适的人 知识是困难的 手动流程过多(缺乏 自动化)(49.3%) 自动化普通 响应操作(例如扩展基础设施) (52.9%)太脆弱而无法改变 在工具APls(46.7%) 在那些报告解决事件所需时间增加的人中,受访者报告以下原因是三大促成因素: 缺乏统一 与流程发生了变化 队友(人或者更难遵循 正在合作使用在远程工作时 不同的工具)(41.5%) (45.2%) 缺乏可见性 依赖和什么团队或人是负责编码器 基础设施(38.8%) 转运/transposit.com DevOps自动化现状|2022 由于解决问题的时间已经滞后,组织经历过更多的停机时间,有39.7%的人报告停机时间成本增加 在去年。 将合适的人员聚集在一起解决事件所需的时间导致停机成本不断增加。 0-14分钟:16.1%15-30分钟:48.6%31-1小时:25.9%一小时以上:9.4% 48.6%的受访者表示需要15-30分钟才能将合适的团队成员聚集在一起解决事件。对于担任副总裁/总监/经理SRE角色的受访者,这个数字几乎翻了一番,3o%的受访者表示需要31分钟到一个小时才能将合适的团队成员聚集在一起解决事件。 与2021年的研究类似,组织正在寻求实施工具来改善他们的事件 管理流程和减少MTTR,优先考虑新的自动化工具(48.2%)、通信/协作工具(41.5%)和集成工具(40.6%)。 实施新伊莫门新关注更多 通讯/事件操作手册通过我们的改进 协作工具 或化学家32.5% 验尸和审查—— 41.9% 或应用程序41.5%事件34.6% 40.6% 实施新的 32.5% 补充新的改变沟通 监控或离子过程38.8% 申请48.2%可观察性工具13.4% 38.8% 21.5% 13.4% 实施新的增加号码不喜欢 10.2% on-call工程师的集成工具配合任何更改 或应用40.6%21.5%10.2% 转座|转座.com10 DevOps自动化现状|2022 自动化和SRE实践减轻服务事件的复杂性 超过四分之三(75.6%)的受访者表示有 越来越关注现场可靠性工程 过去12个月在他们的组织中进行的实践。 那些受访者35.1%植物扩大SRE努力2022.此外,65.1%的组织计划租用可靠性工程师在接下来的12个月内。 有趣的是,增加对SRE实践的关注的组织经历的更少 比那些依赖运维团队来确保站点可靠性的重大事件。45.7%的受访者表示,他们的团队在过去12个月内遇到了 6到19起重大事件 在过去12个月的过程中,您的团队遇到了多少重大事件? 42.4% 小于542.4% 6-1026.7% 11-1919.0%19.0% ■20-508.4%8.4% 26.7% 超过503.5% 3.5% 进一步细分,增加了对站点可靠性的关注的组织 工程实践和计划在2022年扩大SRE工作,39.8%的人表示他们的团队在过去一年中遇到的重大事件少于5 次。相比之下,近三分之一的受访者 (29.4%)在依赖运营的组织中负责现场可靠性责任的团队 在过去12个月内经历了20起或更多重大事件。 转运/transposit.com11 DevOps自动化现状|2022 该研究表明,组织继续看到实施SRE实践的价值。尽管需求不断增长,但sRE仍在执行手动、耗时的任务。 过半的SRE(56.5%)表示他们手动将数据输入到ITSM系统或其他记录系统中,以跟踪人类在 事件的解决 为了避免受到低效和复杂流程的阻碍,团队正在转向自动化。自动化可以通过简化修复过程的某些部分并减少服务事件的发生来帮助使手动任务更容易和更快。 事实上,1OO%的副总裁/主管/经理SRE表示服务事件减少或没有变化因为他们的组织实施了自动化帮助减少服务事故数量的技术 83.2%的受访者表示,他们高达50%的工程运营流程是自动化的。 您的工程操作流程中有多少是自动化的? 1-10%12.75% 15.0% 12.75% 11-25%32.7% ■26%-50%37.8% 51%以上15.0% 32.7% 37.87 无1.9% 转运/transposit.com12 DevOps自动化现状|2022 但是,组织在构建内部平台或自动化工具时会遇到资源紧张。当被问及需要多少工作来维护定制的内部工具或 用于自动化DevOps工作流程的机器人,38.6%的组织表示他们需要一名或多名全职工程师。 一年1-3个月的时间12.1% 一名工程师4-6个月的时间24.1%8.7%12.1% 7.3% 一名工程师7个月至1年的时间16.6% 一名全职工程师12.6%