您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[XOps 风向标!GOPS 全球运维大会暨研运数智化技术峰会 2024 · 上海站]:平台工程的“破局之道” - 管俊 - 发现报告
当前位置:首页/行业研究/报告详情/

平台工程的“破局之道” - 管俊

平台工程的“破局之道”  - 管俊

平台工程的“破局之道” 管俊资深DevOps架构师 GOPS全球运维大会暨研运数智化技术峰会2024·上海站 个人简介 管俊 DevOps架构师 自2013年开始接触并实践DevOps。 主导了若干OpenStack、Kubernetes产品、项目的设计、实施与落地运行,以及运维、DevOps团队的建设和管理。 目前在传统IT企业从事DevOps架构师的工作。译有《DevOps实践指南(第二版)》一书。 平台工程的挑战 新的实践思路 目录工程文化建设的实践与思考 总结 01 平台工程的挑战 来自组织内部不断的挑战,与行业内外持续的变化 2022 研发效能指标系统 2024 基础设施演进GenAI引入 2020 平台启动 2023 多产品线、多数据中心 产品研发团队 平台工程团队 平台 支持/赋能/协作 工具链复杂度 DevOps与交付活动复杂度 工具链 工程管理规范 上游/上级DevOps组织 02单击人此员处工编作辑习标惯题 04单击此遗处留编系辑统标题 03单击工此具处链编演辑变标题 01 研发战略 05单击此协处作编边辑界标题 DevOps“已死” 开发者体验至关重要 AI对IT行业的冲击 一站式,自助型,富前端可能存在哪些问题? 02 新的实践思路 从开发者流量入口切入 从第一天开始建立有效反馈持续做减法 GitHubCopilot •人性化的聊天机器人 •紧贴代码的使用方式 体验增强Augmentation VSCode •通过插件集成DevOps工具链:SonarLint,GitLens,等等 GOPS全球运维大会暨研运数智化技术峰会2024·上海站 开发环境浏览器 建立工具链关联减少上下文切换提供知识辅助 左移,还是左移 GOPS全球运维大会暨研运数智化技术峰会2024·上海站 计算资源平面 平台图形界面 集成平面 DevOps工具链 扩展 可观测性平面 安全平面 自动拉取规范化CI配置IDE中开启流水线模板Scheme 分析流水线失败日志审核代码安全漏洞 辅助书写规范的用户故事 JIRA标准化规则 JIRATicket PostgreSQL Grafana 态参度与端度正不能高够认真完成本岗本职各项工作虚心学习 与事实不符 问题不“犀利” 调研指标 数据不实时覆盖不全面 “虚荣” 自自研研CChheecckkeerr 自研Checker PostgreSQL PullRequest 上上游游组组组织织级级级 C上he游cckke织rr CChheeckeer CCI系I系统统生生成成的的 CCIh系e统ck生eer成的 CChheecckkerr PostgreSQL Grafana Grafana Grafana PrometheusServer Grafana 自自研研CChheecckkeerr 自研Checker PrometheusServer •统一数据结构 PostgreSQL 额外数据处理器 PullRequest 上上游游组组织织级级 C上he游c组kke织r级 CChheecckeerr •PR强制合并指标 CCI系I系统统生生成成的的 CCIh系e统ck生eer成的 CChheecckkerr PostgreSQL Grafana 额外数据处理器 •执行情况 •执行时长 •执行结果 •是否有系统错误 感受如何 使用了什么功能谁在使用 自研DevOps服务商业DevOps工具链 系统视角平台用户视角 Grafana PrometheusServer DevOpsPlatformServices 自研系统商业DevOps工具链 DevOps工具链 追踪系统 浏览器扩展 PostgreSQL 事件流 JIRA标准化规则 JIRATicket PostgreSQL Grafana 移除Remove 转移Offload 转交Handoff 从反馈数据中识别无人使用的功能 跟随上游DevOps能力演进 评估服务的自助、运维成熟度 基于组织策略评估业务边界 GOPS全球运维大会暨研运数智化技术峰会2024·上海站 待交接服务 待停用服务 活动服务 遗留服务 新服务 自运维DevOpsToolchain 公共DevOpsToolchain 活动服务 外观层(Façade) 开发者体验界面 60%时间救火 不受控的基础设施 基础设施即代码 不可变运行环境GitOps 被污染的运行环境 节省80%计算资源 0.5个资源提供支持 没有版本控制的测试脚本 快速创建新流水线 不超过10%支持时间 接手阶段 优化阶段 转交阶段 图形化自助界面GitOps 服务名称业务目标建议后续计划服务依赖评估产品线A 服务1自动化流水线生成转交不可或缺 重要 加分项 低/无影响 服务2版本数据库维护不可或缺 重要 加分项 低/无影响 服务3效能指标持续开发不可或缺 重要 加分项 低/无影响 服务4PR自动cherrypick移除不可或缺 重要 加分项 低/无影响 服务依赖评估产品线B 不可或缺 重要 加分项 低/无影响 不可或缺 重要 加分项 低/无影响 不可或缺 重要 加分项 低/无影响 不可或缺 重要 加分项 低/无影响 服务依赖评估产品线C 不可或缺 重要 加分项 低/无影响 不可或缺 重要 加分项 低/无影响 不可或缺 重要 加分项 低/无影响 不可或缺 重要 加分项 低/无影响 •全部产品线评估结果为加分项或低/无影响–移除 •一条产品线评估为重要或不可或缺 –转交 •多条产品线评估为重要或不可或缺 –保持当前所有权,保持大于等于维护的状态 03 工程文化建设 工程文化对平台工程的重要性工程文化建设 工程实践能力 治理 “好用” 平台复杂度 工程实践能力 组织规模 内部兴趣小组 •按兴趣进行组织 •以开发者的实际诉求为导 向 内部Meetup •线下Only:增强互动 •不求人多,但求参与 •话题多样化:趣味分享+ 通用技术+工程实践 •形式多样化:分享+讨论 +食物+小礼物 线上内部技术分享会 •聚焦产品业务领域 •缺乏对通用技术关注 •虚假繁荣:在线人不在 •缺乏真实互动 GOPS全球运维大会暨研运数智化技术峰会2024·上海站 04 总结 2022 2024 X3 建立真实、有效、实时的反馈数据 团队人员规研模发效能指标系统团队业务规模 X15 100% 有的放矢地做减法 跨数据中心云原生基础设施演进 GenAI引入 2020 平台启动 2023 多产品线、多数据中心 20%活跃用户 10+用户新需求 借助AI能力,“掌控”流量入口 3个活跃内源项目回馈到平台工程 关注并投身文化建设 Thanks 高效运维社区DevOps时代 荣誉出品