云原生架构 云原生应用平台 容器&微服务优秀案例集 加入交流群 云原生官方公众号 获取电子书 2023 前 INTRODUCTION 言 云原生架构,特别是容器与微服务技术领域已经成为下一代技术演进的必经之 路,同时也是各行各业快捷上云、高效用云的最合适的架构选择。虽然容器与 微服务技术在开源领域已经有了长足的发展,但是如何把这些技术应用到生产体系,做好系统的安全性、稳定性以及支撑大规模并发业务,并不是开源能直接具备的。 阿里云提供了开源兼容,具备SLA保障,生产可用,经过大规模验证的容器产品(ACK、ACR、ASM)、可观测产品(ARMS、SLS)以及微服务产品 (MSE)等帮助客户在云上构建可应用于大规模生产的云原生架构方案。 本案例集是相关客户通过阿里云的云原生产品构建生产业务体系的经验分享以及最佳实践总结,为您构建合适的生产可用的云原生架构提供相应的成功案例参考,也希望帮助您更轻松实现云原生架构转型,助力业务腾飞! 云原生可观测套件 云原生FinOps方案 ACKAI加速提效方案 应用多活及容灾方案 业务中台技术方案 云原生上云方案 解决方案 PTS Grafana Prometheus Serverless容器服务ASK 弹性容器实例ECI 消息队列RabbitMQ 微消息队列MQTT 云服务总线CSB 微服务引擎MSE AHAS 链路追踪 ARMS Serverless应用引擎SAE 函数计算FC 消息队列Kafka 消息队列RocketMQ 服务网格ASM 企业级分布式应用服务EDAS 高可用 云原生可观测 Serverless产品家族 消息和事件驱动 微服务架构 业务连续性 Serverless 互联网中间件 ACK发行版 边缘容器服务ACK@Edge 分布式云容器平台ACKOne 容器服务ACK 容器服务 中心云 本地云 云原生应用平台产品家族 公共云 边缘云 专有云 助力企业数字化创新 ASSISTENTERPRISESINDIGITALINNOVATION (排列不分先后) CATALOGUE目录 01 互联网 INTERNET 19 21 极氪汽车APP全面升级云原生技术架构,高效提升用户出行体验 元戎启行基于ACK@Edge加速云端协同管理 43 45 三只松鼠云原生架构升级,完美应对双十一 斯凯奇通过MSE提升业务迭代效率,轻松应对线上大促 05FINANCE 01 03 05 07 09 11 vivoAI计算平台的ACKOne混合云实践合阔智云通过ASM轻松实现微服务治理禾连健康低容错业务的增效之路 站酷基于ASM解决多语言技术栈下服务管理难题,实现运维提效 唱鸭轻松玩转DevSecOps,用ACREE构建安全高效交付流程 任意门基于云原生AI套件打造人工智能的社交 23 25 27 29 31 33 云快充云原生稳定性建设之路 致景科技基于MSE一站式实现服务治理 来电科技基于MSE无侵入式实现微服务治理商米科技借力ASM实现业务迭代大幅提效TCL拥抱云原生,实现IT成本治理优化 硅基仿生业务全面Serverless容器化的增效降本之旅 47 49 51 53 识货基于阿里云容器服务实现云原生提效降本波司登云原生架构升级,实现数字化业务创新震坤行基于云原生高效提升应急供应链管理能力 厨芯科技加速业务容器化进程,成功实现增效降本 65费芮互动通过MSE完成移动支付应用稳定性和安全性双提升 06国际项目 INTERNATIONALPROJECTS Salesforce容器化改造,成功落地安全可信软件供应链 69汇量科技通过容器技术加快全球业务拓展 07LandingZone/咨询 LANDINGZONE/CONSULTING SERVICES 71商龙科技容器化上云,保障业务稳定运行 73万兴科技应用容器化改造,实现云原生转型升级 67 交通/物流 63 众安保险云原生架构升级,贯通行业数字化转型“快车道” 35 网络平台 13 核桃编程基于ARMS构建可观测体系,全方位提升用户体验 苏打智能借力阿里云AHPA轻松应对突发流量 04TRANSPORTATION/LOGISTICS 02 汽车/制造 AUTOMOBILE/MANUFACTURING 37 零售/电商 03 RETAIL/E-COMMERCE 传音基于ARMS构建全球一体化可观测平台,高效支撑业务创新 55 57 59 申通基于ACK@Edge构建边缘PaaS实现业务 全面提效 龙湖千丁基于ACK@Edge高效落地云边端一体化智慧停车业务 货拉拉使用ACK轻松应对容器管理难题,实现 金融 15 17 小鹏汽车基于云原生实现研发提效,加速探索未来出行 东风日产借力ASM实现流量精细化管控 39 41 完美日记容器化改造实现增效降本 餐道基于ACK构建创新底座,加速SaaS规模化演进 61 精细化成本治理 丽迅物流通过ACREE管理大规模容器镜像,快速响应业务需求 INTERNET 互联网 01vivo/互联网 vivoAI计算平台的ACKOne混合云实践 客户简介 02 实施简单,成本低:客户原有集群无需改动,功能兼容,无需额外开发。 提供一致性的体验:将云主机加入集群的流程和物理机基本一致。先通过公司云平台申请云主机,然后通过自动化平台将云主机初始化并加到集群中。 工作平面 api 物理机 agentapi 物理机 ACK node 云主机 node 云主机 Calico Terway 专线 ACK 控制台 ACK 控制平面 api 阿里云 IDC机房 Vcontainer-混合云集群 提供更好的混合云网络:Kubernetes的容器网络要求pod和pod、pod和宿主机之间通讯正常。该平台采用了Calico+Terway的网络方案,主要表现为在客户机房内的工作节点采用CalicoBGP,阿里云上的工作节点采用Terway共享网卡模式,以获取更好的性能。 vivo是一家以设计驱动创造产品,以智能终端和智慧服务为核心的科技公司。 客户痛点 资源交付周期长:此前使用自建机房,新增资源的采购流程复杂,周期长,无法及时响应业务临时的大量算力需求,例如大规模参数模型的训练和在线服务的节假日活动扩容。同时由于服务器供应链形势严峻,网卡、硬盘、GPU卡等硬件设备都缺货,采购交付存在较大风险。 需要更高性能的基础设施:AI计算平台对网络、存储有更高的性能要求,在私有IDC里落地需要很高的时间和金钱成本。 1 2 方案亮点 建设成果 通过ACKOne混合云的能力,该平台可将阿里云上的GPU主机加入到客户自有集群,提供给用户在深度学习训练平台上使用,及时满足业务的算力需求。用户的使用习惯和之前保持一致。公共云资源根据不同业务的情况,使用周期在一个月到数个月。使用费用大大低于自行采购物理机的费用,有效降低成本。 相关产品 采用ACKOne方案,将云主机当做裸金属/物理机,加入到客户自有容器集群,集群使用人员体验感无差异,无需额外开发。云主机通过客户云平台申请,不改变当前资源申请流程。 分布式云容器平台ACKOne 容器服务ACK 03 合阔智云/互联网 合阔智云通过ASM轻松实现微服务治理 04 配置推送优化资源利用率:通过ASM的配置推送优化,可以通过分析数据平面Sidecar产生的访问日志,获取数据平面服务之间的调用依赖关系,为每个工作负载自动推荐Sidecar资源,减少配置推送负担,提升资源利用率。 Web用户界面/被集成能力:OpenAPI/Terraform声明式API,兼容社区Istio,支持控制面与数据面KubernetesAPI访问 客户简介 合阔智云成立于2011年,核心是云原生和移动化设计的新一代全渠道“云端一体”履约中台和去中心化模式智能门店供应链业务中台。 客户痛点 托管ASM控制面核心组件,标准/企业版架构统一,柔性架构、多版本支持、定制能力增强 异构服务注册集成 EnvoyFilter 扩展中心 网络诊断智能分析 软硬一体优化 自适应xDS优化 零信任安全 可观测性&弹性伸缩 流量管理&协议增强 托管核心组件 ASMInfra 开源项目易用性差:客户采用Linkerd社区版搭建ServiceMesh基础设施,无法与阿里云提供的云上基础设施进行很好的融合。例如,Sidecar使用默认配置,控制能力相对较少,在应对一些复杂的场景时无法灵活配置。Linkerd的应用可观测性较简单,无法观测到偶发的链路熔断和某个端口无法访问的场景。 链路调用复杂治理难:随着应用数量的增加,应用链路调用变得更加复杂。客户采用gRPC协议,但应用端没有做特别处理,导致基于HTTP2的长连接协议无法实现负载均衡,尤其是在单个客户端调用变大的情况下,服务端无法有效负载。应用本身比较薄,导致应用调用链路无法透明化,每次新的发布部署容易出问题。 数据平面集群的资源消耗大:客户的数据平面Kubernetes集群中的工作负载数量比较多。默认情况下,Sidecar会增加对数据平面集群的资源消耗,同时控制平面会面临较大的配置推送负担,降低控制平面的效率和可用性。 ASM数据面 阿里云VPC 其他公有云或IDC 入口 出口 数据面的扩展及运维 多集群支持 eBPF数据 面性能加速 Proxyless支持及与Proxy的互通 混合部署 ACKKubernetesServerless 集群&ECI虚拟节点Kubernetes集群 ECS 虚拟机 边缘集群 多云混合云 外部注册 集群 Service 外部集群 ProxyWA Service ENSPod ProxyWA Service ECSVM ProxyWA Service ECIPod ProxyWA Service Pod ProxyWA Pod ASM网关WA Envoy扩展证书管理协议增强 为运行在异构计算基础设施上的服务提供统一的网格化治理能力 网格CNI插件兼容优化 建设成果 方案亮点 商业版架构和社区版一致,云上易用性强:服务网格ASM的架构与Istio社区版和业界趋势保持一致,并在托管的控制面侧提供了用于支撑精细化流量管理和安全管理的组件能力。控制面的托管解除了与所管理的Kubernetes集群生命周期的绑定,使得架构更加灵活,提升了系统的可伸缩性。自带的可观测面板清晰展现各种问题,例如不合理的应用补偿策略、不合理的应用部署、不合理的应用报错。问题一清二楚,进而非常方便地推动应用架构的改造。 将Linkerd社区版本迁移到服务网格ASM(阿里云提供的Istio云上商业版),高效解决了多语言技术栈情况下应用链路调用复杂的运维难题,并解决了与云上其他产品搭配使用时的易用性问题,从而使运维效率提升了40%。同时,借助ASM提供的丰富的企业级能力和完备的可观测能力,构建服务网格的实施周期缩短了50%。 1 2 3 4 相关产品 企业级治理能力丰富,提升可用性:相比Istio社区版,ASM提供了更加丰富的企业级治理能力,如流量标签、灰度发布、熔断、限流等能力。 服务网格ASM 容器服务ACK Serverless容器服务 弹性容器实例ECI 05 禾连健康/互联网 禾连健康低容错业务的增效之路 06 动态配置,无需重启:微服务引擎MSE的特性开关支持动态配置,无需重启应用,用户无感知,很好地解决了客户的痛点,提升了业务的稳定性,同时集成KMS解决敏感配置存储问题。 Kubernetes+镜像发布/回滚 持续集成 微服务治理 服务实例隔离 HTTP协议转换网关 DubboServiceA,v2 C端 云效CI DubboServiceA,v1 运营端 ACK 基于Dubbo版本 DevOps MSE+KMS 特性开关加密配置 POST/GET->鉴权->Dubbo调用 阿里云ARMS 基于ApacheShenYu改造 服