中国电信云上运维挑战与解决方案
上云后的运维挑战
- 目标更高:快速、高效,不仅安全、稳定,还需快速、高效。
- 管理内容更细:从基础设施到操作系统配置,涵盖业务生命周期和IT服务过程。
- 管理要求更严:从“各扫门前雪”向矩阵式联合体运维转变,强调智能化运维。
- 技术架构切换:监控对象几何级数增长,人力维护无法胜任。
IT运维转型需求
- 基础架构云化:实现微服务化。
- 监控工作量急剧上升:系统节点、微服务数量大幅增加。
- 依赖专家技能和经验:跨团队协作难度大,排障时效要求高。
集团系统和平台数据
- 规范统一:实现省分系统和平台数据的规范统一。
- 监控体系:涵盖IaaS、PaaS、SaaS三层监控,支持业务系统一体化监控。
- 自动化运维:实现自动化巡检、隐患发现,提高运维效率。
AIOps应用
- 成熟度不断提升:从单点应用逐步发展到能力完备。
- 智能决策:实现故障根因分析、故障自愈等功能。
- 可视化监控:通过图数据技术快速定位故障。
可观测性
- 关键环节:构建全面的可观测性体系。
- Gartner十大技术趋势:数字免疫系统、应用可观测性等。
总结
中国电信通过云化和智能化手段,有效应对了上云后的运维挑战,构建了高效、智能的运维体系,实现了业务系统的稳定运行和性能优化。