Amazon Aurora 高可用性与容灾白皮书总结
摘要与简介
- Amazon Aurora 是一种全托管关系型数据库,提供高可用性、全球规模的可用性,并兼容 MySQL 和 PostgreSQL。
高可用性和容灾功能
- 单区域实现:通过部署多可用区数据库集群,提供99.99%的正常运行时间SLA,自动故障转移以确保高可用性。
- 跨区域扩展:利用Amazon Aurora Global Database,实现跨多个区域的容灾和高可用性,支持低延迟本地读取和快速故障转移至备区域。
监控与事件
- 监控工具:使用Amazon CloudWatch监控Amazon Aurora的运行状况,追踪关键性能指标和异常。
- 事件监控:关注特定事件,如故障转移、备份状态变化,确保及时响应和问题解决。
最佳实践
- 指定RTO和RPO:根据业务需求设定恢复时间目标(RTO)和恢复点目标(RPO)。
- 编写和测试流程文档:创建详尽的高可用性和容灾流程文档,并定期进行测试和审查,确保流程的有效性。
- 在变更期间保持可用性:采用零停机打补丁(ZDP)功能,减少小版本升级期间的应用停机时间。
常见使用场景
- 打补丁、升级和重大Schema变更:利用托管式蓝/绿部署和零停机打补丁功能,确保在维护和升级过程中应用程序的连续性。
结论
Amazon Aurora 提供全面的高可用性和容灾解决方案,通过单区域和跨区域部署策略,确保数据库服务的高可用性和业务连续性。通过实施最佳实践和监控措施,企业可以有效应对各种故障场景,保障关键业务的稳定运行。