麦当劳DevOps平台工程实践 程清 麦当劳中国DevOps研发负责人 www.top100summit.com 讲师简介 程清 麦当劳中国ITFoundationDevOps研发负责人 拥有多年软件架构研发及管理经验,熟悉大型项目的研发流程和工程管理方法;目前在麦当劳担任DevOps研发负责人,负责麦当劳IT的DevOps平台工程从0到1建设及实践。 www.top100summit.com 目录 01DevOps平台工程引入 02平台目标及能力 03DevOps平台工程实践 04平台探索及文化 DevOps平台工程引入 麦当劳数字化建中设的痛点及存在的问题 •早期IT团队任务重心以项目管理为主 •技术栈和架构设计缺乏统一的标准 •微服务缺乏管理 •跨团队和部门的上线节奏难以把控 •交付过程缺乏相应的审核流程及质量管控 •工具种类繁多,缺乏管控 规范流程 痛点 •IT资源有限 www.top100summit.com 4 •工具的使用没有形成自动化,工具资源 沟通成本极高 •专家经验没有沉淀 DevOps平台工程引入 麦当劳DevOps平台工程建设思路 顶层设计 •统一认知 •对齐框架 实践阶段 •从无到有 •串联统一 打磨阶段 •从有到好 •精益求精 赋能阶段 •智能化 •产品化 www.top100summit.com 5 www.top100summit.com 平台目标及能力 idea Requirements Coding Testing Build Deploy Operate&Monitor DevOps平台流程规范体系建设 目标是建设一个基于云原生并集合项目管理、应用管理、质量管理、应用交付、系统监控、安全检查、运维管理、效能管理、API和流量治理等多个维度为一体的一站式端到端的 DevOps平台化工程。 Ninja平台深度集成了众多开源生态工具,通过规划、开 发、测试、交付和运营来管理应用程序的全生命周期,同时组织各角色之间的统一协作,提高IT组织的效能。 DevOps平台工具链体系建设Ninja平台 www.top100summit.com 平台目标及能力 标准的流程规范+工具链整合 项目管理 应用中心 交付中心 质量中心 监控中心 API治理 运维管理 效能管理 工具&组件 Infra www.top100summit.com DevOps平台工程实践 DevOps平台工程建设的核心理念 质 核心理念 效 稳 DevOps平台工程实践 实践一:以应用服务为核心的设计体系 •需求管理 •迭代计划 •发布管理、计划 •变更管理、控制 •发布策略、回滚 •中间件 •域名 •流量切换 •诊断工具 •敏捷指标、评估 01 03 05 07 项目 交付 运维 效能 元数据管理 质量 监控 02 04 06 •应用管理 •代码仓库、骨架、镜像 •集群资源的分配 •流水线、部署定义 •用例管理 •静态检查 •UT、自动化及性能测试 •拨测、混沌 •日志、Trace •指标、事件、预警 •SLO www.top100summit.com 9 www.top100summit.com DevOps平台工程实践 应用元数据 CI元数据 CD元数据 www.top100summit.com DevOps平台工程实践 实践二:精益流水线建立高效交付流程 www.top100summit.com DevOps平台工程实践 简单 自动化 可扩展 可度量 www.top100summit.com 构建 发布单 DevOps平台工程实践 发布 www.top100summit.com DevOps平台工程实践 实践三:贯穿软件全生命周期的质量保障 测试规范 测试 方案 设计 用例 用例 评审 单元 测试 代码 评审 代码 扫描 测试 准入 功能 测试 UI 测试 API 测试 性能 测试 安全 测试 发布 卡扣 应用 拨测 混沌 测试 平台能力 测试管理 代码扫描 自动化测试平台 造数平台 Mock平台 压测平台 安全平台 拨测平台 混沌平台 www.top100summit.com DevOps平台工程实践 测试管理 单测 拨测 www.top100summit.com DevOps平台工程实践 实践四:建设稳定和实时的业务监控大盘 www.top100summit.com DevOps平台工程实践 实践四:建设稳定和实时的业务监控大盘 SLI/SLO 稳定性评估 Service Module POD API MOP WAF IDC Cluster 聚合维度 CPUUsage MemoryUsage RequestCounts AvgLatency ExceptionCounts Bandwidth ContainerRunning HealthCheck MoreMetrics PV/UV SQL JVM 核心指标 www.top100summit.com DevOps平台工程实践 实践四:建设稳定和实时的业务监控大盘 统一 实时 分离 完整 www.top100summit.com DevOps平台工程实践 不同维度监控指标 调用拓扑 www.top100summit.com DevOps平台工程实践 实践五:API全生命周期治理 设计 开发 管理&协作 对接&测试 发布 监控 开放 设计时治理 运行时治理 •设计规范 •接入规范 •文档管理 •版本管理 •变更通知 •订阅管理 •差异比对 •创建更新 •检索分类 • • • • API协作API授权API开放 API管理 •API测试 •APIMock •治理 •限流 •熔断&降级 •流量监控 •异常监控 •调用依赖 •监控告警 •API鉴权 •调用管理 •黑白名单 •租户管理 •调用统计 •开放门户 www.top100summit.com DevOps平台工程实践 www.top100summit.com 2 2 DevOps平台工程实践 DevOps平台工程建设的成果 97% ·应用管理比例 10Min ·应用创建时间 ·一次交付时间 2Day ·缩短交付周期 www.top100summit.com 平台探索 智能运 维 可观 测性 人工智能 www.top100summit.com 文化 平台 平台文化 微信官方公众号:壹佰案例关注查看更多年度实践案例 www.top100summit.com