云原生和国产化双场景下的IT转型变革与破局之道 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 01 形势倒逼IT变革 目录 02 变革之挑战 03破局之道 04实践成效 01形势倒逼IT变革 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 第一座大山:IT云迁移 第二座大山:云原生转型 第三座大山:国产化TD 三座大山 分散->集约化 云计算深入普及 …… C省数据中心 B省数据中心 A省数据中心 IT云 服务 服务 烟囱式 服务 服务 烟囱式->微服务化 互联网化发展 非ZZKK->国产化 外部环境剧烈变化 中间件 中间件 DB DB OS OS CPU CPU 02变革之挑战 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 面临的挑战 IT云迁移 云原生转型 国产化TD 系统间交互多,形成了复杂的网 状网结构 一直以来的单项目制建设和过渡 外包导致 生态不够完善,谁都不愿做第一 只小白鼠,但你必须做 l现网业务系统间关联度高,网 络结构复杂。 l系统迁移时间窗口少而短,不能影响正常业务生产。 l传统技术VS新技术 ——技术债较重。 l传统研发模式VS新研发模式 ——文化债较重。 l产品种类多,实践案例少,选 型周期长。 l应用适配工作量大,时间紧、风险高。 每项都需要额外的费用支持 03破局之道 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 三者关系 ➢IT云迁移就像一座桥梁,为IT转型从单体架构->云原生架构、从非ZZKK->国产化TD,提供了硬件资源和有利时机。 ➢云原生转型和国产化TD,不是你干你的,我干我的,而是你中有我,我中有你。 云原生 转型 IT云迁移 信创平面 国产化 TD 各自重点要解决的问题 IT云迁移 云原生转型 国产化TD 成本降到最低? 做好技术选型? 偿还技术文化债? 双平面协同? 简化网络关系? 提升转型效率? l中台能力总线l自动化编译、打包和部署 l基础设施、中间件即开即通 l研发管控库 l傻瓜式流水线 +保姆式服务 l严格POC l技术选型库 l尽可能同时融合解决迁移、转型和TD一举多得。 举措1:制度倒逼 举措2:工具到位 举措3:服务到家 制度倒逼 制度倒逼 工具到位 推行一流程两库三问的研发管控规范 •一流程:研发管控流程 •两库:技术选型库和研发管控库 •三问:中台三问 构建双场景下的新型研发治理工具 服务到家覆盖接入前、中、后的保姆式服务 一流程——嵌入制度流程,迫使行为统一 ➢建立了完善的技术选型库和研发管控库,形成1流程2库3问的整体框架,集成了云原生和国产化的技术选型要求,实现了从以项目进度为重心的传统研发模式向以技术治理为重心的新型研发模式的转变。 研发项目管理过程 技术选型库 •基础硬件选型 •基础软件选型 •应用架构选型 研发管控库 •软件工程规范 •自主管控要求 可研阶段 123…456 提出需求 业务评审 执行中台三问评审 技术方案评审 立项采购流程 开发过程管理 需求验收 后评估 选型标准化、研发规范化、交付透明化 L1:受限级 1流程2库3问 清单式工作方法 清单发布乙方自评立项评审请款考核 立项评审环节:原则上所有项目都应该符合两库清单,如不符合需承诺整改完成时间,并提交部门领导特批。 分级评估工具 L2:准入级L2-E:演进级 请款考核环节:与厂商签订的合同中考核条款加入技术管控要求。如在承诺时间内未完成整改的,每超过1个月扣8分,上限40分,扣完为止。 两库——制定两库清单,统一技术标准 技术选型库 研发管控库 l按照先进性、自主性、成熟度三个维度对关键技术产品实施分级评定 lL1受限级属于负面清单,需要特批才能准入。 lL2准入级又根据成熟度细分出演进级L2-E。 覆盖计算、网络、存储、虚拟化软件、容器云、OS、DB、中间件等的分级评定 l研发管控按先进性实施分级评定,L1受限级属于负面清单,需要特批才能准入 lL2属于准入级,其中L2细分为L2-E先进级属于较为前沿、 先进的管控方法。 L1受限级 L2准入级 L2-E先进级 L1:受限级 研发管控 未使用DevOps厂家侧CI,与甲 流水线方CD对接 甲方端到端CI/CD 软件工程规范 需求管控 无管控 列车模式 单件流模式 代码纳管 无纳管 离线纳管 甲方流水线纳管 L2:准入级 可维护性 五日志/无一键启动 有日志/一件启停 集成AIOps 数据模型 无管控 乙方管控 甲方管控 自主管控要求 接口协议 无管控 乙方管控 甲方管控 L2-E:先进级 关键业务流程无管控乙方管控甲方管控 三问——落实中台三问,推动能力复用 项目和中台是什么关系? 拟复用哪些中台能力? 拟沉淀哪些中台能力? 工具到位 制度倒逼 推行一流程两库三问的研发管控 构建跨架构全兼容的研发治理工具 云原生国产化 两池三具 Devops工具 解决 促进 统一加速 镜像兼容国产CPU 容器云池 国产OS同步TD 中间件池 中间件国产标准 DB工具 DB国产TD 中台能力总线工具-做好双平面迁移协同 工具到位 服务到家 覆盖接入前、中、后的保姆式辅导 核心目标——带动转型提效,最大化降低转型成本 ➢以IT云迁移为契机,以云原生转型和中台化改造为抓手,分层解耦,分段服务,构建跨架构全兼容的新型研发治理工具。 ➢运用“两池三具”,降低IT系统适配难度,减少适配工作量,实现“多快好省”的平滑迁移。 研发工具 应用 4 关 数据库适配网 2前台 云原生、国产化双场景 中台 345 数据库实例 数据库管理节点 应用中间件 操作系统 容器/虚机1 操作系统 1跨架构云原生DevOps流水线(工具) 构建跨ARM和X86架构的CI/CD流水线,一份代码、双栈交付 CPU芯片 5中台能力服务总线(工具) 网状网结构革新为星型结构,支撑应用跨平面的平滑迁移 4数据库迁移(工具) 提升异构数据库大规模数据迁移效率和准确性 3中间件池 实现中间件集中建设和集中信创替代 2容器资源池 屏蔽运行环境差异,节约应用对国产操作系统的适配工作量 CPU芯片 Devops工具——实现应用敏捷开发和国产CPU兼容双目标 ➢通过构建跨架构研发流水线,我们得以在国产芯片研发与云原生敏捷研发之间取得平衡,同时确保代码与软件研发过程的完全自主可控,为技术创新与自主可控双翼齐飞奠定基础。 ARM模拟器 X86服务器 Docker QEMU 一份应用代码 DevOps 编译服务器(X86) ARM服务器 运行服务器 测试 开发 ARM应用编译 X86应用编译 跨架构的DevOps流水线 双栈架构技术方案 双架构灰度发布 开发人员 公网 DevOps X86 ARM 灰度比例 灰度1:0%灰度2:20%灰度3:40%灰度4:70%灰度5:100% 完全部署到ARM X86 SDP 零信任网关 容器云池——快速实现应用容器化部署和OS同步替换 ➢基于国产OS构建容器资源平面,推动应用系统从虚机迁往容器,使用容器技术屏蔽环境差异,节省应用对国产操作系统的适配工作量。 应用分别适配信创/非信创技术栈 应用应用A 应用B GuestOSvOS1 vOS2 vOS3 vOS4 HostOSOS1 OS2 OS3 OS4 应用通过容器屏蔽运行环境差异 应用应用A 应用B 容器K8s OSOS1OS2 OS3OS4 虚机架构容器架构 CPU X86 ARM X86 ARM CPU X86 ARM X86 ARM 非信创 信创 非信创 信创 非信创 信创 非信创 信创 应用平均需要10天对国产操作系统适配应用平均只需要5天实现容器化改造&OS替代 中间件池——实现组件治理和中间件国产标准一举两得 ➢通过对中间件的开展“盘点梳理->选型收敛->镜像制作->服务申请->即开即通->统一维护”,构建信创中间件池,打破系统烟囱,实现中间件集中部署、集中维护和即开即通,节约各应用厂家各自建设部署、安全整改、迁移适配的工作量。 01 02 03 04 05 06 盘点梳理 36种中间件Redis5个版本Tomcat14个版本Nginx8个版本 选型收敛 通过POC制定两库清单,选定基线版本 镜像制作 基于国产OS底包制作中间件镜像 服务申请 应用厂商在线申请,中间件团队快速部署 即开即通 反馈中间件的IP和端口,快速提供服务 统一维护 中间件指标统一纳入监控告警 非信创中间件统一替代为信创产品,如:***替换为*** 36种75个版本收敛为45个版本的中间件:如Tomcat由14个版本收敛为1个版本。各应用厂家分散部署到集中开通,应用的中间件部署效率由平均2个月缩短为2天。 数据库工具——快速完成大规模数据迁移,加速DB国产TD 数据迁移工具 自动检测不兼容点 捕捉系统运行的SQL语句,给出与国产数据库的兼容性验证报告。 大规模数据快速迁移 后台多任务模式运行,全量迁移性能最高达100MB/s, 增量同步性能最高达8万RPS 行级记录校验 先采用MD5算法快速校验记录;再进一步做每一行每一列的数据校验。 源端目标 用户控制台OpenAPI数据 调度服务迁移 预检查 数据上云评估 日志 结构迁移 全量迁移 ……日志解析 ETL DStore Writer 数据校验 数据 同步…… 数据订阅SDK 能力总线工具——实现能力复用和迁移双平面协同 采用松耦合总线型方式集成,接口数量级别为O(n),经过少量开发和简 单配置即可快速实现集成需求,通用性强,可重用性高。 能力服务总线 接口1 业务系统C 接口1 业务系统B 接口1 业务系统A 能力服务总线使用后 系统间存在大量硬编码、紧耦合的“点对点”接口,接口数量级别为 O(n²),灵活性差,开发和维护成本高。 业务系统B 业务系统C 接口1,2,3,4 接口1,2,3,4 接口1,2,3,4 业务系统A 能力服务总线使用前 ➢系统间网状网结构变为星型连接总线,应用迁往信创平面过程中,由总线提供流量调度和割接能力,实现跨平面的应用协同和业务容灾,减小了系统变更、割接对其他关联系统造成的影响,保证了业务连续性。实现了应用跨平面的平滑迁移。 接口1,2,3 接口1,2,3 … 接口1,2,3 接口1 接口1 … 接口1 业务系统D 业务系统E 业务系统F 业务系统G 业务系统D 业务系统E 业务系统F 业务系统G 服务到家 制度倒逼 推行一流程两库三问的研发管控 工具到位 构建双场景下的新型研发治理工具 服务到家覆盖接入前、中、后的保姆式辅导 迁移前迁移中迁移后 亲和度评估 支持远程开发 代转维服务 提供上云指引 上门赋能 持续度量提升 在线辅导 迁移前——云原生亲和度评估服务 06 成本支撑亲和度 01 业务亲和度 02 开发亲和度 亲和度模型评估工具 05 技术能力亲和度 04 组织管理亲和度 03 工具亲和度 亲和度评估模型是通过6个维度衡量应用系统是否适用开展云原生转型的一套方法。 40 35 30 25 20 15 10 5 0 科室1科室2 科室3 L0 科室4 L1 科室5 科室6科室7 L2 L2(适合云原生) L1(可以云原生) L0(不适合云原生) 2-3分 1-2分 0-1分 对***多个应用系统开展亲和度评估,大多数系统还是适合云原生转型。 4.网络放通 迁移前——制定标准化上云流程&操作指南 前期准备 个人账号申请 前置资源账号申请 4A账号申请 SDP账号申请 2.账号申请 容器云项目开通 流水线项目开通 研发工具开通 1.项目开通 省内网络申请和开通 一级云网络申请和开通 NFS共享存储申请和开通 中间件服务申请和开通 3.资源网络申请和开通 制定5阶25