22天完成核心系统云原生转型和国产化TD 01形势倒逼IT变革 目02变革之挑战 contents 录03破局之道 04实践成效 PART01 形势倒逼IT变革 GOPS全球运维大会2024·深圳站 三座大山 分散->集约化 云计算深入普及 …… C省数据中心 B省数据中心 A省数据中心 IT云 服务 服务 烟囱式 服务 服务 烟囱式->微服务化 互联网化发展 非ZZKK->国产化 外部环境剧烈变化 中间件 中间件 DB DB OS OS CPU CPU 第一座大山:IT云迁移 第二座大山:云原生转型 第三座大山:国产化TD PART02 变革之挑战 面临的挑战 IT云迁移 云原生转型 国产化TD 系统间交互多,形成了复杂的网状网结构 现网业务系统间关联度高,网络结构复杂。 系统迁移时间窗口少而短,不能影响正常业务生产。 一直以来的单项目制建设和过渡外包导致 传统技术VS新技术 ——技术债较重。 传统研发模式VS新研发模式 ——文化债较重。 生态不够完善,谁都不愿做第一只小白鼠,但你必须做 产品种类多,实践案例少,选型周期长。 应用适配工作量大,时间紧、风险高。 GOPS全球运维大会2024·深圳站 每项都需要额外的费用支持 PART03 破局之道 信创平面 三者关系 IT云迁移就像一座桥梁,为系统从单体架构->云原生架构、从非ZZKK->国产化TD。提供了硬件资源和有利时机。 云原生转型和国产化TD,不是你干你的,我干我的,而是你中有我,我中有你。 云原生转型 国产化 TD 各自重点要解决的问题 IT云迁 移 云原生转型 国产 化TD 成本降到最低? 做好技术选型? 偿还技术文化债? 提升转型效率? 双平面协同? 简化网络关系? 中台能力总线自动化编译、打包和部署 基础设施、中 间件即开即通 研发管控库 傻瓜式流水线 +保姆式服务 严格POC 技术选型库 尽可能同时融合解决迁移、转型和TD一举多得。 举措1:制度倒逼 举措2:工具到位 举措3:服务到家 制度倒逼 制度倒逼 工具到位 推行一流程两库三问的研发管控规范 •一流程:研发管控流程 •两库:技术选型库和研发管控库 •三问:中台三问 构建双场景下的新型研发治理工具 服务到家覆盖接入前、中、后的保姆式服务 一流程——嵌入制度流程,迫使行为统一 建立了完善的技术选型库和研发管控库,形成1流程2库3问的整体框架,集成了云原生和国产化的技术选型要求,实现了从以项目进度为重心的传统研发模式向以技术治理为重心的新型研发模式的转变。 技术选型库 研发项目管理过程 • • • 基础硬件选型基础软件选型应用架构选型 研发管控库 •软件工程规范 •自主管控要求 可研阶段 1 2 3 … 4 5 6 提出需求 业务评审 技术方案评审 立项采购流程 开发过程管理 需求验收 后评估 执行中台三问评审 选型标准化、研发规范化、交付透明化 清单式工作方法 分级评估工具 清单发布 乙方自评 立项评审 请款考核 1流程2库3问 L1:受限级 L2:准入级L2-E:演进级 立项评审环节:原则上所有项目都应该符合两库清单,如不符合需承诺整改完成时间,并提交部门领导特批。 请款考核环节:与厂商签订的合同中考核条款加入技术管控要求。如在承诺时间内未完成整改的,每超过1个月扣8分,上限40分,扣完为止。 两库——制定两库清单,统一技术标准 技术选型库 研发管控库 按照先进性、自主性、成熟度三个维度对关键技术产品实施分级评定 L1受限级属于负面清单,需要特批才能准入。 L2准入级又根据成熟度细分出演进级L2-E。 覆盖计算、网络、存储、虚拟化软件、容器云、OS、DB、中间件等的分级评定 研发管控按先进性实施分级评定,L1受限级属于负面清单, 需要特批才能准入 L2属于准入级,其中L2细分为L2-E先进级属于较为前沿、 先进的管控方法。 L1受限级 L2准入级 L2-E先进级 L1:受限级 研发管控 未使用DevOps厂家侧CI,与甲 流水线方CD对接 甲方端到端CI/CD 软件工程规范 需求管控 无管控 列车模式 单件流模式 代码纳管 无纳管 离线纳管 甲方流水线纳管 L2:准入级 可维护性 五日志/无一键启动 有日志/一件启停 集成AIOps 数据模型 无管控 乙方管控 甲方管控 自主管控要求 接口协议 无管控 乙方管控 甲方管控 L2-E:先进级 关键业务流程无管控乙方管控甲方管控 三问——落实中台三问,推动能力复用 项目和中台是什么关系? 拟复用哪些中台能力? 拟沉淀哪些中台能力? GOPS全球运维大会2024·深圳站 工具到位 制度倒逼 推行一流程两库三问的研发管控 构建跨架构全兼容的研发治理工具 云原生国产化 两池三具 Devops工具 解决 促进 统一加速 镜像兼容国产CPU 容器云池 国产OS同步TD 中间件池 中间件国产标准 DB工具 DB国产TD 中台能力总线工具-做好双平面迁移协同 工具到位 服务到家 覆盖接入前、中、后的保姆式辅导 核心目标——带动转型提效,最大化降低转型成本 以IT云迁移为契机,以云原生转型和中台化改造为抓手,分层解耦,分段服务,构建跨架构全兼容的新型研发治理 工具。运用“两池三具”,降低IT系统适配难度,减少适配工作量,实现“多快好省”的平滑迁移。 数据库服务器 应用服务器 两池三具 研发应用 前台 工具 数据库适配网关 4数据库迁移(工具) 提升异构数据库大规模数据迁移效率和准确性 2 云原生、国产化双场景 4 5中台能力服务总线(工具) 网状网结构革新为星型结构,支撑应用跨平面的平滑迁移 中台 345 3中间件池 实现中间件集中建设和集中信创替代 应用中间件 数据库实例 容器/虚机1 数据库管理节点 操作系统 2容器资源池 屏蔽运行环境差异,节约应用对国产操作系统的适配工作量 操作系统 1跨架构云原生DevOps流水线(工具) 构建跨ARM和X86架构的CI/CD流水线,一份代码、双栈交付 CPU芯片 CPU芯片 双栈架构技术方案 双架构灰度发布 开发人员 公网 DevOps X86 ARM 灰度比例 灰度1:0%灰度2:20%灰度3:40%灰度4:70%灰度5:100% 完全部署到ARM X86 SDP 零信任网关 Devops工具——实现应用敏捷开发和国产CPU兼容双目标 通过构建跨架构研发流水线,我们得以在国产芯片研发与云原生敏捷研发之间取得平衡,同时确保代码与软件研发过 ARM模拟器 X86服务器 Docker QEMU 一份应用代码 DevOps 编译服务器(X86) ARM服务器 运行服务器 跨架构的DevOps流水线 测试 ARM应用编译 X86应用编译 开发 程的完全自主可控,为技术创新与自主可控双翼齐飞奠定基础。 容器云池——快速实现应用容器化部署和OS同步替换 基于国产OS构建容器资源平面,推动应用系统从虚机迁往容器,使用容器技术屏蔽环境差异,节省应用对国产操作系统的适配工作量。 应用分别适配信创/非信创技术栈 应用应用A 应用B GuestOSvOS1 HostOSOS1 OS2 OS3 OS4 CPUX86 非信创 ARM 信创 X86 非信创 ARM 信创 vOS4 vOS3 vOS2 应用通过容器屏蔽运行环境差异 应用应用A 应用B 容器K8s OSOS1OS2 OS3OS4 CPUX86ARM 非信创信创 X86ARM 非信创信创 虚机架构容器架构 应用平均需要10天对国产操作系统适配应用平均只需要5天实现容器化改造&OS替代 中间件池——实现组件治理和中间件国产标准一举两得 通过对中间件的开展“盘点梳理->选型收敛->镜像制作->服务申请->即开即通->统一维护”,构建信创中间件池,打破系统烟囱,实现中间件集中部署、集中维护和即开即通,节约各应用厂家各自建设部署、安全整改、迁移适配的工作量。 盘点梳理 36种中间件Redis5个版本Tomcat14个版本Nginx8个版本 选型收敛 通过POC制定两库清单,选定基线版本 镜像制作 基于国产OS底包制作中间件镜像 服务申请 应用厂商在线申请,中间件团队快速部署 即开即通 反馈中间件的IP和端口,快速提供服务 统一维护 中间件指标统一纳入监控告警 36种75个版本收敛为45个版本的中间件:如Tomcat由14个版本收敛为1个版本。 各应用厂家分散部署到集中开通,应用的中间件部署效率由平均2个月缩短为2天。 数据库工具——快速完成大规模数据迁移,加速DB国产TD 数据迁移工具 自动检测不兼容点 捕捉系统运行的SQL语句,给出与国产数据库的兼容性验证报告。 大规模数据快速迁移 后台多任务模式运行,全量迁移性能最高达100MB/s, 增量同步性能最高达8万RPS 行级记录校验 先采用MD5算法快速校验记录;再进一步做每一行每一列的数据校验。 源端 …… 目标 用户控制台OpenAPI数据 调度服务迁移 预检查 数据上云评估 日志 结构迁移 全量迁移 日志解析 ETL DStore Writer 数据校验 数据 同步…… 数据订阅SDK 能力总线工具——实现能力复用和迁移双平面协同 能力服务总线使用后 采用松耦合总线型方式集成,接口数量级别为O(n),经过少量开发和简 单配置即可快速实现集成需求,通用性强,可重用性高。 业务系统A业务系统B业务系统C 能力服务总线 接口1 接口1 … 接口1 业务系统D业务系统E业务系统F业务系统G 接口1 接口1 接口1 系统间网状网结构变为星型连接总线,应用迁往信创平面过程中,由总线提供流量调度和割接能力,实现跨平面的应用协同和业务容灾,减小了系统变更、割接对其他关联系统造成的影响,保证了业务连续性。实现了应用跨平面的平滑迁移。 能力服务总线使用前 系统间存在大量硬编码、紧耦合的“点对点”接口,接口数量级别为 O(n²),灵活性差,开发和维护成本高。 业务系统A业务系统B业务系统C 接口1,2,3,4 接口1,2,3,4 接口1,2,3 接口1,2,3 … 接口1,2,3 业务系统D业务系统E业务系统F业务系统G 接口1,2,3,4 服务到家 制度倒逼 推行一流程两库三问的研发管控 工具到位 构建双场景下的新型研发治理工具 服务到家覆盖接入前、中、后的保姆式辅导 迁移前迁移中迁移后 亲和度评估 支持远程开发 代转维服务 提供上云指引 上门赋能 持续度量提升 在线辅导 迁移前——云原生亲和度评估服务 亲和度评估模型是通过6个维度衡量应用系统是否 40 30 20 10 0 科室1 科室2 科室3 L0 科室4 L1 科室5 科室6科室7 L2 L2(适合云原生) 2-3分 L0(不适合云原生) 0-1分 L1(可以云原生)1-2分 适用开展云原生转型的一套方法。 对**多个应用系统开展亲和度评估,大多数系统 还是适合云原生转型。 06 成本支撑亲和度 01 业务亲和度 02 开发亲和 度 亲和度模型 评估工具 05 技术能力亲和度 04 组织管理 亲和度 03 工具亲和度 4.省内测试环境部署 应用改造上传代码 编译打包 应用部署 5.应用正式部署、割接上线 数据迁移代码编译打包 镜像扫描同步 应用部署发布 割接上线扫描报告存档 Web应用漏扫 业务功能测试 迁移前——制定标准化上云流程&操作指南 制定5阶25步云原生转型标准化流程。优化后多类项目、多类账号可一次性开通、资源和网络可并行申请开通。在迁 中间件服务申请和开通 NFS共享存储申请和开通 3.资源网络申请和开通 一级云网络申请和开通 省内网络申请和开通 前期准备 移前就给各应用厂家提供了可视化的流程和操作实施指南。 研发工具开通 1.项目开通 流水线项目开通 容器云项目