多云融合架构 中小银行的建云、上云和用云指南 您的姓名 公司职位 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 刘志 长沙银行数据中心生产运营中心经理 负责长沙银行整体运维体系建设规划,推动长沙银行运维数字转型的进程,参与长沙银行云原生规划与设计,是长沙银行从传统运维到数字化运维的见证者与参与者 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 为何要走“融合” 目录 怎么去融合多云 如何“融会贯通” 几点思考 01为何要走“融合” GOPS全球运维大会暨XOps技术创新峰会2024·北京站 选择驱动 面对自主可控信息技术产业建设及应用国产化创新改造的新浪潮,“云”被视为金融数字化转型的新基建、新 连接,是金融科技输出的关键窗口。在高新技术自主可控、自立自强的大背景下,基于国产基础软硬件的云平台建设成为金融领域云计算建设发展的重中之重。在国产创新的浪潮和行业内部数字转型需求下,摆在多数金融同业面前的,不外乎如下几种场景: A、已有云,但非国产创新架构B、已有云,目前只兼容C86 在国产创新要求前,已经建设有较为完整云计算平台,但是不兼容国产创新架构,需引入国产XC架构或投入资源改造。 C86走到头亦或投入资源引入ARM,作相应的兼容适配。 ----“单押or双押”? C、没有云,还在虚拟化 还在X86虚拟化阶段,在国产创新发展浪潮下,需要建设相应的全栈国产云平台,并进行业务系统的云化迁移。 历史因素 + 现实因素 D、已有云,异构兼容 c86+ARM兼容并续,双栈并举,提前开启下一阶段的热点技术方向的研究,国产GPU、如AI+等。 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 choice 不同的“故事”背景,相同的两条路线 A/B场景》重新引入 重新引入后,形成新旧两套可能不同技术架构、不同厂商的云底座 一“芯”一栈,单栈建设 抛弃原有技术路线或者技术底座,集中力量建设单云单栈。绑定单一技术厂商,单一芯片架构。 C场景---》引入全栈,上云迁移 从无到有,建设基于国产创新的云平台,并开始进行业务的云化迁移。 AB双栈路线 这里的AB双栈可以有两种形态: 1、双云底座同时建设,A云/B云同时兼容两种芯片架构,并同时建设有相应的资源群集;两朵云有各自的管理和业务上的属性划分。 2、同一云底座下,双架构兼容。 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 面临的痛点 资源规划 A云/B云资源池每年如何规划,如何盘活存量资产 应用上云 应用上云面临多种选择,且选择不同的云底座,所使用的云服务特性和容灾架构设计又有所不同,怎么减少应用上云的复杂度。 运营管理 两朵云怎么高效的运营管理,上云应用如何形成统一的运维规范,怎么同已有的观测体系、应急切换体系融合。 技术路线 单一技术路线和厂商产品捆绑问题,避免“黑盒交付”和商业绑定,怎么提升云平台自主可控能力。 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 面临的痛点 多云该怎么用? 问题思考: 如何建云? •云底座及其承载应用技术架构演进方向如何统一 •云运营工具如何统一 •多云技术底座如何提高运维效率 •硬件资源投入上如何均衡 如何上云? •应用该上哪朵云 如何用云? •在国产创新条件下如何盘活“旧云”? •如何提升云平台自主可控能力,规避单一平台/技术风险? •如何让应用无感知底层差异,轻松用云? 破局点 云网融合 算力统筹 双栈贯通 统一运营 02怎么去融合“多云” GOPS全球运维大会暨XOps技术创新峰会2024·北京站 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 监控告警 运维可视化 (报表,大屏) 运维自动化 拓扑管理 应用分析 资源分析 消息通知服务 容量管理 云硬盘(EVS)对象存储服务3.0 (OBS3.0) 弹性文件服务 (SFS) A云架构 多云&混合云 两级云 云联邦混合云 混合云市场 云管理 云运营 云运维 计量计费 审批流程管理 多级VDC 订单管理 资源管理 服务管理 应用管理 用户管理 租户管理 运营指挥中心 OCC 一云多池 A云提供计算/块存储/对象存储/负载均衡等IaaS能力,未使用全栈提供的数据中台、PaaS级服务。 双中心网络架构为大三层,底座产品相对较轻,应用同底层IaaS服务建基本解耦。 数据库服务 存储服务 云数据库 GaussDB(foropenGauss) 云数据库 RDS(forMySQL) 文档数据库 DDS 数据复制服务 DRS 灾备服务 方舟灾备管理平台 (ARK) 网络服务 云连接 (CC) 云专线 (DirectConnect) 云解析 (DNS) 弹性负载均衡 (ELB) NAT网关 (NATGateway) 虚拟专用网络 (VPN) VPC终端节点 (VPCEndPoint) 安全组 (SG) 二层桥接 (L2BR) 弹性IP (EIP) 网络ACL (ACL) 虚拟私有云 (VPC) 其承载应用多部署在全行级的PaaS平台上(非华为cce),全国产创新底座,算力池多元。 IOT服务 路网数字化服务 (DRIS) 设备接入服务 (IoTDa) 计算服务 云主机服务 VRM 弹性伸缩服务 (AS) 裸金属服务器 (BMS) 镜像服务 (IMS) 弹性云服务器 (ECS) 云服务器备份服务 (CSBS) 云硬盘备份服务 (VBS) 云服务器容灾服务 (CSDR) 云服务器高可用服务 (CSHA) 云硬盘高可用服务 (VHA) 服务构建器 自定义线下服务 基础设施 计算 Intel 鲲鹏 海光 飞腾 Atlas 存储 OceanSTORPacific OceanSTOR 混合闪存 OceanSTOR 全闪存 网络 CloudEngine 芯片鲲鹏X86AsendGPU B云架构 B云提供计算/块存储/对象存储/负载均衡等IaaS能力以及移动金融/数据库等PaaS级产品服务和流计算/实时分析等DaaS产品服务。网络架构为大二层设计,底座产品重,与业务耦合度高。 其承载的应用包括手机银行、风控平台、移动中台、数据中台等,多数为x86架构,少量ARM架构;算力池结构目前较为单一。 业务手机银行 风控平台 大数据平台 业务系统 子公司 应用 PaaS 移动网关 MGS 实时发布 MDS 消息推送 MPS 移动同步 MSS 日志分析 MAS 蚂蚁监控 移动中台 数据库 RDS 数据库 RDS-Redis 计算 接入网关 uctbridge 风控引擎 uctcloud 开放平台OP 管理中台 uctmng 配置管理 (DRM) ANTMONITOR 金融数据库 OceanBase 数据传输 DTS 数据库管理 DMS 数据库存储 数据资产平台 DataQ 机器学习 PAI 流计算 Blink 数据中台 实时分析 Hologres 大数据处理分析 MaxCompute 分布式数据库 (PolarX) 分析型数据库 ADB 网络 58核心业务 票据平台 资金交易头寸 商户巡检 智能营销 实时决策 标签平台 蚁盾前置 申请反欺诈 信贷准入 交易反欺诈 企业e钱庄 个人e钱庄 安全 数据开发平台 DataWorks 主机安全 (安骑士) 态势感知漏洞扫描 统一日志审计 数据脱敏数据加密 IaaS ECSESSROS 容器服 务 弹性高 性计算 对象存储 OSS 块存储 EBS 表格存储 OTS 高速通 道 NAT 网关 专有网 络VPC VPN网 关 混合云 DNS 负载 均衡 ApsaraUni-manager运维控制台ASO 基础管控 灾备管理中心 ApsaraUni-manager运营控制台ASCM 同城容灾 ASR 异地备份 ASR-BR&HBR 异地容灾 ASR-DR GOPS全球运维大会暨XOps技术创新峰会2024·北京站 IaaS层建设思路 分层解耦:底层基础设施资源按业务场景需求向上提供API接口级能力,整体与PaaS乃至SaaS层松耦合,应用层架构不强依赖于底层基础设施。 注重云服务资源能力建设:建设云平台的各项基础服务能力,例如数据库容灾、大数据平台、机器学习/训练资源等通用接口能力 基础资源层面:提升基础资源纳管能力;资源池分级分类,面向业务应用从多维度规划设计多元计算资源架构 PaaS层 业务应用 通用业务系统 互联网应用系统 数据分析应用 AI应用 机器学习/训练 租赁 业务需求场景 通用性能需求场景 高性能计算需求场景 大数据需求场景 机器学习/训练场景 通用资源池 国产化资源池 云服务能力 大数据资源池 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 高性能资源池 计算场景 全栈国产化场景 高性能计算场景 GPU加速场景 通用计算型 通用计算型 本地存储 高性能存储 内存增强型 内存增强型 超高I/O型 图形加速型 面向应用层,利用云原生,推动双栈在应用领域“贯通” 融合要点 屏蔽网络架构差异 跨云部署 应用在架构设计、容灾切换设计上无 敏 稳 安需考虑两朵云层级结构带来的差异 稳长屏蔽云底座差异和芯片差异 顾 兼满 优应用部署时,底层硬件架构对其透明。应用可以基于环境进行部署。 应用可以根据需要无缝进行跨云部署,同一制品在不同云底座上部署,甚至双架构兼容 持续部署能力一致 不会因为多云融合,而使原有的CD体系能力减弱 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 融合方式 云网融合 下放云内网络管理边界,融合云网和DC网络架构、贯通“多云”算力边界。解决不同芯片、不同底座、云与非云的网络区划壁垒问题。 统一算力 两朵云统一以ARM为主,C86为辅;GPU建立专有的算力池,通用AI算力由K8s+slurm进行管理。 双云融合 01 02 03 04 利用PaaS横跨“多云”,整合“多云”资源,深度贯彻IaC(InfrastructureasCode)理念,将应用与底层基础设施彻底解耦。 CD增强 在原有基于制品+配置文件的基础上,运用GitOps,实现基于环境蓝图的编排及投产,进一步提升CD能力。 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 03如何“融会贯通” GOPS全球运维大会暨XOps技术创新峰会2024·北京站 GOPS全球运维大会暨XOps技术创新峰会2024·北京站 云网融合 两个融合 云网一体融合:将VPC边界下放,与传统网络边界拉平,将云网东西流量和南北流量解耦拆分,全面提升了云网的可扩展性、观测性、稳定性;避免云内网络的“黑盒”,统一网络建设标准。 PaaS网络同IaaS底座网络融合:通过不同CSI插件实现对底层不同IaaS网络架构的适配,组网形式按集群划分,兼顾底层特点;k8sservice和ELBorSLB形成联动,对应用层无感衔接。 网络安全 代理服务器 负载均衡 数据库 块存储 文件存储 对象存储 微服务 镜像仓库 容器编排 容器 物理机 裸金属 虚拟机 计算存储安全 融合网络 支撑 抽象融合 传统网络 PaaS云网络 阿里云网络 华为云网络 融合 云网络传统网络 算力统筹 池化建设,计算资源扩容以以ARM为主,C86为辅 通过引入国产GPU及适度扩容存量小模型需要的英伟达GPU,构建专用完善的智能算力池。以国产适配路线为主,在云上探索AI、大模型等业务场景落地 计算资源池 X86 ARM C86 资源池层 GPU资源池 英伟达 国产GPU 存储资源池 共享存储 对象存储 块存储 本地磁盘 KVM 裸金属 标准化资源供给、提高自动化能力,提升供给效率 分级分