AI智能总结
大规模平台工程实践血泪史 曾海剑 广东移动云原生总架构师 曾海剑 广东移动云原生总架构师 l负责广东移动公司各个部门的DevOps平台以及云原生基础设施的架构设计、平台建设、部署实施以及运营支撑l多年大规模云原生转型实践经验,参与过多家大型金融、通信和科技企业的DevOps与云原生转型评估与指导工作l开源项目开发者,热衷已码会友 01云 原 生 转 型 必 要 性 02平 台 工 程 实 践 血 泪 史 03大 规 模 平 台 工 程 极 简 实 践 04极 简–规 模 化 的 关 键 要 素 云原生转型必要性 转型驱动力 云原生最佳拍档 复杂性 第三方开发模式特点 PART 02 平台工程实践血泪史 阶段1:开源+放养 l一套云原生环境: K8S+CephFS l全套DevOps工具: 代码仓库:Gitlab流水线:Jenkins镜像仓库:Harbor制品仓库:Nexus代码扫描:Sonarqube…… 阶段1:开源+放养(复盘) 阶段2:开源+保姆 l三套云原生环境: 测试环境(SIT)预发环境(UAT)生产环境(PROD)x2 l三条流水线: develop:发布到SIT环境master:发布到UAT环境release:发布到PROD环境 阶段2:开源+保姆(复盘) 阶段2.5:商用+自助 愿景 l商用的云原生技术底座 l商用的全套DevOps工具 阶段2.5:商用+自助(复盘) 问题分析:团队角度(要求) 技能要求 问题分析:团队角度(现状) 技能现状 常态 外援 源头 •开发人员是价值创造的源头•开发人员最了解自己开发的应用应该如何编译、打包和部署•DevOps平台首先应该为开发人员服务 •团队没有DevOps和云原生技能•开发/运维人员本来的工作量就很大•理解好需求,编写好程序才是开发人员的本职工作•6-7k薪酬的现实,做不出20-30k薪酬的效果 •团队不会只能靠专家把团队教会•团队不想只能靠专家下手干•但不是每个企业都有能力承担引入或者培养专家的成本 问题分析:技术角度 现有开源方案 •灵活:很多功能都可以通过编程实现 •灵活:很多功能都需要通过编程实现 面向专家 问题分析:技术角度 现有商用方案 优势 劣势 •配置:用界面配置代替编程•封装:对开源工具做了整合与封装•支持:有供应商提供的专家团队支持 •配置工作量大•培训成本高•支持和定制严重依赖供应商 面向专家 问题分析:总结 DevOps的未来–平台工程 lDevOps已死?•不应该以增加认知/工作负担为代价l平台工程——DevOps的一种工程实践 PART 03 大规模平台工程极简实践 平台工程核心价值 阶段3:自研+自助 演示–极速上手 降低云原生应用部署难度 面临云原生资源隔离难题 解决云原生资源隔离难题 解决流水线构建隔离难题 Serverless2.0 (源代码+流水线+Kubernetes)x(简单+安全隔离)= 2.0 开箱即用,携码入驻 PART 04 极简–规模化的关键要素 平台工程大规模应用成果 跨BMOS部门6合作开发商22开发人员1200+业务系统100+代码仓库130+微服务种类500+环境种类包括:开发调试/预发/生产/异地容灾接管k8s集群16节点数600+CPU架构跨X86/ARM64k8s产品跨开源/国产k8s版本跨v1.18.x-v1.28.x接管GPU算力节点14部署Pod3000+平台维护团队(自有人员)3平台教练团队(外包人员)6 大规模普及关键要素——快速复制 云计算普及的未来–简单 价值=产出–投入 Simplicityis the futureofDevOpsCloudNativePlatform Engineeringetc… 科技普及的未来–平民化 欢迎交流 高效运维社区DevOps时代 荣誉出品 感谢大家观看