简单易用的智能云网络,让客户专注业务创新 可观测、自服务和全球化的确定性云网络服务 祝顺民 阿里云智能集团副总裁,阿里云智能云网络产品线负责人 2024/09/19 围绕企业上云,云网络不断发展演进 坚定企业安全上云的信心 自定义 安全 1.0:多租户隔离的云网络 支撑企业业务快速全球化部署 全球一张网 多地域 2.0:全球化的云网络 3.0:万物互联的智能云网络 BacktoBasic 万物上云 智能化 确定性 自动化 可观测 全球化 支撑企业应对万物互联新趋势 化繁入简,简单易用 安全隔离的云上网络 VPC SLB VPN网关 ExpressConnect ElasticIP NAT网关 共享带宽 GA降低跨地域访问时延 CEN SAG IPv6 企业云上全球一张网 ALB/NLB 连接新类型应用 GWLB 连接NVA� IPAM PrivateLink TransitRouter CDT/LCU 简化商品模型 NetworkIntelligenceService 云化企业级核心路由器 深度可观测 阿里云网络,支撑云原生应用全生命周期部署 应用交付网络 云上托管弹性应用 高弹性,高可靠的NFV架构 EIP (弹性公网IP) GA SLB (全球加速) (负载均衡) NIS (网络智能服务) 云基 数据中心网络 构建云上专有网络 大规模,高性能的SDN技术 全球化网络 构建全球化网络和上云连接 广覆盖,低抖动的广域网技术 VPC CNregion PrivateLink (私网连接) VPC (虚拟专有网络) TR (转发路由器) NAT (NAT网关) Oversearegion CEN (云企业网) 网高于 AIOPS 络 智 和 的 效管理 管 能使智 云 分 用能 运 理网析 络技 维术 总部IDC EC (高速通道) SDWAN-三方 (集成智能接入网关) 门店 VPN (VPN网关) 分支 云网络基础商品 CDT(云数据传输),CU(云数据处理) 阿里云网络持续创新之路——让客户专注业务创新 确定性 “随着为我们网的络业可务靠不,断扩性大能,和经弹营性时间增持加续确增定长性,就需要更高的业务连续性要求,增强确定性是我们保障业务长期深发展度的可精观益测工,程。持因续为优,化每客一个户被网忽络视架的构确定性 因素都可能以某种方式向我们宣示其重要性,并付出更大的代提价…升”全球网络服务,助力企业敏捷全球化 ——某互联网公司网络架构师 高效自动化,让客户专注业务创新 应用交付网络 持续提升稳定性、安全、性能和弹性 稳定,安全,性能和弹性是对云网络的最基本要求 云上托管弹性应用 弹性NFV架构 GAGA支持弹性按量付费 SLB 支持关闭跨AZ转发 数据中心网络 构建云上专有网络 大规模SDN技术 全球化网络 构建全球化网络和上云连接 广域网容灾调度 Privatelink ECECR发布就近转发模式 私网连接支持20+云服务 TR500GTR转发性能 基 网 云于 络 高大 效数 智 管据 和 理AI 管 智 能使的 云 用能 运 理网分 技 络析 维术 云网络基础商品 CDT(云数据传输),CU(云数据处理) 确定性的可靠:强化容灾演练,让故障应急变成确定性动作 支持客户自助进行容灾演练,有效评估故障影响面,做好容灾预案,强化容灾架构 架构&资源 容灾校验 符合容灾要求的资源, 进入容灾模拟计划 容灾演练 启动容灾切换计划 校验统计 分析 •ALB/NLB:模拟关闭AZ •EC:模拟down一条线路 •… Journey分析 状态、风险… 容灾恢复 启动容灾回切 容灾历程状态可视可溯源 日志可分析 手动触发或定时超期自动 触发恢复 应用(SLB)故障演练 ALBNLB 专线(EC)故障演练 物理端口 VBR BGPpeer 确定性的性能:从跨域网络到数据中心,逐步提供确定性时延 支持AI应用场景,防抖动技术覆盖到数据中心网络,让网络抖动少一些 ZooRoute:主动式重路由技术 云网络转发流量负载均衡 3 2 1 链路1出现故障 3 23 123 123 12 1 (影响业务) 把异常链路流量调度到正常路径上 (恢复业务) 云网络结点 3 2 1 3 2 1 云网络结点 区域1 区域2 ECS ZooRoute 主动式重路由技术 ECS ECS 互联网 IDC 99.995%<1s 跨域带宽SLA端到端切换 阿里云网络支持某大型全球化赛事云转播 转播期间50多次跨国链路抖动,客户业务无感知 跨地域网络支持ZooRoute(2023) 阿里云网络对数据中心访问专线和互联网的链路中逐步进行网络架构升级,支持ZooRoute技术 未来覆盖到数据中心网络内部,云服务链路,以逐步构建确定性时延的整体云网络产品 互联网 IDC ECS ECS ECS 来自阿里云网络运维平台数据 解决业务弹性负载规划的“最后一公里”问题 确定性弹性三要素 初始 能力 可衡量 弹性能力 资源 预留 确定性的弹性:重新定义弹性,用确定性能力简化负载规划 超大规模大 负载 大规模高波 负载 常规周期负载 业务流量 NLB支持在30分钟内弹至亿级并发连接和100Gbps 产品能力 资源预留 100 促 可衡量弹性 10 初始能力 动 ALB的单VIP支持在30分钟内弹至50WQPSGA支持在20分钟内弹至50Gbps 通过资源预留,支撑新游上线、企业大促、新闻宣发等井喷流量场景 阿里云网络持续创新之路——让客户专注业务创新 深度可观测 “我们为运维网人络力可有靠限,,但性业能务和对弹网性络稳增定加性确和定网性络质量要求很高,让我们团队一直承担很大的压力。网络观测是我们每天深工度作可的观基础测,,不持但续要优能化及时客监户控网和络定架位当构下的网络问题,还要不断主动优化架构,消除未来隐患,为业务提供可信提SLA升,全为球最网终用络户服提务供,更助好的力服企务业…敏”捷全球化 ——某交通物流服务商网络运维总监 高效自动化,让客户专注业务创新 通过流量日志对云网络流量进行深度观测 更多产品,更强功能,更丰富场景 VPC流日志支持场景化采集 VPC流日志支持IPv4网关,NAT网关,专线VBR等场景化采集功能,用户可根据场景采集相关日志,低成本即可获取强大的VPC流日志功能 NAT网关支持会话日志 会话日志记录了SNAT会话的五元组和流量细节等便于用户安全团队进行快速溯源和监控网络流量结合云防火墙能够迅速识别并遏制潜在的安全风险 TR流日志支持更多接口 TR流日志新增支持VPC/VPN/ECRAttachment 实现云上、混合云、跨地域全量流量路径五元组日志采集 采用合理的云网络架构,才能发挥云网络的最大价值 深度用云,网络先行 我们每天都在处理线上服务单,大部分客户自身架构问题导致的故障和风险事件,事先都有征兆,如果能够提前识别风险并消除,约60%的故障不会发生 ——阿里云网络服务团队 阿里云网络所有的故障应急都会由我们团队处理,在被故障影响的客户里面,我们看到了因为架构的不合理,导致影响很大,如果能够提前识别风险并消除,约70%的故障影响会降低甚至消失 ——阿里云网络稳定性运维团队 我们经常帮助客户做架构改造和架构迁移,我们发现,这些存量的非合理架构都需要花费大量的投入来完成改造,这些非最优架构,越早发现,对未来的影响越小 ——阿里云网络解决方案团队 通过NIS网络巡检对云网络架构进行深度观测 提前发现风险并改进,避规未来改造代价,降低故障影响 NIS–网络巡检 来源于线上客户的实际案例 根据历史实际经验,客户实际业务模型来训练,并融合多个行业最优网络架构,提供准确的巡检项,提前发现风险,具备实战意义 精细分析并提供改进优化建议 提供风险等级和改进优化建议,帮助客户快速决策和快速治理;同时提供趋势分析,治理效果一目了然; NIS:NetworkIntelligentService 阿里云网络持续创新之路——让客户专注业务创新 敏捷全球化 “跨大为洲的网网络络可链靠路,、跨性云能的和专弹线性连接增..加.复确杂定的性网络如果我们自己来做,至少需要半年的建设周期和数月的运维稳定成熟周期。深同时度,可网观络测的,质量持也续直优接化影客响玩户家网尤络其架是构海外玩家的游 戏体验…而在云上能够“弹指间”搭建弹性、稳定的全球 网络,提并升利用全全球球网的络高服质务量公,网助来力保企证业海敏外游捷戏全体球验化,让我们可以快速抓住新的业务发展机遇…” 高效自动化,让客户专注—业—务某知创名游新戏公司IT架构师 不断提升产品的全球竞争力 网络能力覆盖更广泛,提供全地域一致网络服务体验,降低客户上云门槛 IPv6推进按量付费 VPC公共云全地域支持IPv6 转发路由器/网络ACL/流日志/前缀列表支持IPv6私网连接支持IPv6(即将发布) 全球加速GA支持按量付费传统型负载均衡支持按量付费 VPN网关支持按量付费(即将发布) 持续提升互联网接入质量,满足全球化应用 弹性公网IP和全球加速产品升级,帮助应用快速覆盖全球客户 全球加速GA 大区间时延优化 通过协议演进(支持HTTP/3接入和HTTP/2回源)和优化DNS调度及长传路径,进一步提升客户业务跨大区的覆盖效果 日本 中国香港 泰国 新加坡 弹性公网IPEIP 覆盖大区质量优化 通过出入方向就近转发,以及ISP线路优化等,提供优质的大区覆盖客户在重点区域部署业务,会得到更稳定的网络质量保障和更快速的业务响应,助力业务出海更加敏捷高效 审图号:GS(2016)1611 阿里云网络持续创新之路——让客户专注业务创新 高效自动化 “我们为的目网标络是可通靠过,技术性让能语和言弹学性习变增得加简确单定有性趣,同样,我们的云上基础设施运维也体现了这一理念。少量的人力投入,通深过I度aC可驱观动测的自,动持化续流优程化,客就户能网完成络所架有构运维工 作,可以最大限度地利用时间和资源,降低错误率,确保平台的高提可用升性全和球稳网定络性…服”务,助力企业敏捷全球化 ——国际知名在线教育企业IT总监 高效自动化,让客户专注业务创新 自动化代表了更优的用云姿势 先进企业,都用API构建自动化 40% 小型企业 70%API调用 大中型企业 vs 企业管理云网络首选方式 (云网络APIVS云网络控制台) Terraform云厂商Module下载数量 (国外企业调用vs国内企业调用) 来自阿里云数据来自Terraform数据 发布:NIS商业化OpenAPI 基于商业化OpenAPI,构建自动化的网络运营能力,实现客户业务流程自动化 DevOps code test deploy … 监控 ITOps 排班 处理 复盘 … 告警 FinOps 预算 分账 优化 … 业务用量 网络性能观测 网络拓扑 网络巡检 路径分析 流量分析NPM 网络诊断 Terraform/Grafana/云监控/SLS 务 业助力客户业务流程自动化 流 程基于网络监控,支撑研发自动化测试和部署 基于网络告警,支撑运维自动化分析和处理基于网络用量,支撑财务自动化分账和预算 OPENAPI 开放网络运营能力 400+类基础数据,6类OpenAPI 日志 Logs 探测Traces 配置Config 指标Metrics 基支持通过TF等来编排OpenAPI 础数据 发布:NetworkIaCModule 深度用云,网络先行:网络架构最佳实践标准化能力化,推动国内企业客户用云姿势变革 阿里云网络卓越架构IaCModule:专线构建混合云网络("hybrid-cloud-network") VPC-北京 VPC-上海 用户编辑 Module配置文件 TR-北京 TR-上海 跨地域带宽 *.tf TR-新加坡 VBR VBR 高速通道 物理专线 物理专线 On-Premise IDC 防火墙 服务器服务器服务器 效率提升 部署效率:8h->0.5h