-
背景与团队:顺丰同城科技的架构师卢旭分享了公司在物流场景下的架构稳定性实践。团队背景包括百度外卖基础架构组和顺丰同城基础架构组的经验。
-
系统稳定性理论:构建了一套基于微服务架构的稳定性体系,涵盖开发规范、测试手段、压测保障、监控告警、分布式追踪等。
-
业务场景:物流行业的复杂性和高并发特性,如万+QPS和过亿数据量,要求系统具备高度的稳定性和可扩展性。
-
稳定性目标:确保系统的高可用性,达到99.97%的SLA,并将平均故障恢复时间(MTTR)控制在25分钟以内。
-
机房部署架构:采用同城、异地、多活等高可用架构,通过流量调度、数据库读写分离等方式保证服务的高可用性。
-
链路监控:利用Jaeger等工具进行链路追踪,实现从用户端到服务端的全面监控,提高问题的发现和解决效率。
-
全链路压测:通过自动化测试和预案演练平台,提前发现系统瓶颈并进行优化。
-
监控体系:从基础资源监控到业务日志监控,再到异常检测,构建了多层次的监控体系,提高问题的识别和处理能力。
-
双十一与618实战经验:通过大规模流量的考验,积累了丰富的实战经验,实现了0线上故障的目标。