登录
注册
回到首页
AI搜索
发现报告
发现数据
专题报告
研选报告
定制报告
VIP权益
发现大使
发现一下
热门搜索:
新能源车
AIGC
Chatgpt
大模型
新质生产力
低空经济
当前位置:首页
/
行业研究
/
报告详情
/
4-4 SRE 的核心理念与可观测性 - 刘峰
信息技术
2022-09-15
DataFunSummit2022:数据治理在线峰会
R***
AI智能总结
查看更多
SRE核心概念与可观测性
Google SRE
起源
:
Apollo 7 飞船研发事故启发了SRE的理念,强调对细节的关注、灾难预案和准备工作。
第一个SRE是参与阿波罗登月计划的MIT教授Margaret Hamilton。
定义
:
SRE是使用计算机和软件工程手段设计和研发大型、分布式计算机软件系统的一种学科。
关注点在于系统的可靠性,包括架构设计和运维流程优化。
主要工作是运维分布式集群系统上的具体业务服务。
原则
:
确保长期关注研发工作。
在保障服务级别目标(SLO)的前提下最大化迭代速度。
监控系统。
应急事件处理。
变更管理。
需求预测和容量规划。
资源部署。
提高效率与性能。
观测性
定义
:
观测性是系统的属性,是从了解系统外部输出中推断出系统内部状态的能力。
如果IT系统无法充分将其状态外部化,即使最好的监控也无济于事。
重要性
:
服务快速增长。
动态体系结构。
容器化工作负载。
服务之间的依赖关系。
更加重视客户体验。
监控与观测性
:
分布式、复杂的服务在不可预测的用户和可变吞吐量下运行,导致错误的可能性成倍增加。
观测性是必需的,因为它允许我们将服务的所有输出外部化,从而推断服务的内部状态。
实例
:
服务级别的目标(SLO)和系统级别的指标(SLI)。
例如,90%的用户应在一分钟内完成完整的付款交易。
38秒是用户完成付款的“正常”时间,此时所有监控都处于健康状态。
SRE与可观测性
奇点
:
引入和推动“奇点”,连接开发和运维。
解决应用与系统环境之间的鸿沟。
实现软件工程与系统工程的融合,最终为客户提供业务价值和满意度。
欢迎联系。
你可能感兴趣
可观测性安全云原生时代数据驱动安全的进化 - 刘志诚
信息技术
EISS
2022-11-11
刘晓辉-运维平台可观测与数字孪生的落地实践_加水印
信息技术
2024 第23届 GOPS 全球运维大会暨 XOps 技术创新峰会 · 北京站
2024-07-17
刘征-用可观测性之眼洞悉复杂生产系统
电子设备
2023年中国DevOps社区广州峰会
2023-12-12
TiDB_可观测性的设计与实现_陈霜
信息技术
ArchSummit深圳2022|全球架构师峰会
2022-07-19
云原生可观测性技术研究与应用
云安全联盟
2023-12-15