Net5.5G时代 IP自动驾驶网络白皮书 开启ANL4新征程 Contents 01行业数字化与智能化转型趋势/01 02 IP自动驾驶网络挑战与关键技术/04 2.1IP网络自动化挑战04 2.2新技术重塑网络运维06 03IP自动驾驶网络目标定义/09 3.1IP自动驾驶网络愿景09 3.2IP自动驾驶网络分级11 3.3IP自动驾驶网络关键能力特征12 04IP自动驾驶网络架构/15 4.1目标架构15 4.2智能网元16 4.3高清网络数字地图18 4.4网络智能体24 IP自动驾驶网络白皮书 05IP自动驾驶网络应用场景/26 5.1网络建设26 5.2网络维护30 5.2.1网络变更场景与解决方案30 5.2.2网络故障场景与解决方案34 5.3网络优化39 06IP自动驾驶网络成功实践/42 6.1广东移动NetMasterFMECopilot应用实践42 6.2广东电信网络数字地图配置仿真验证实践44 6.3联通研究院云网自智分级体验实践46 07IP自动驾驶网络产业行动建议 08总结/50 /48 09术语表 /51 1行业数字化与智能化转型趋势 当今世界充满着变化和不确定性,以数字化应对不确定性是趋势,数字化发展已成全球共识。目前,全球已经有超过170个国家发布了国家数字战略。据麦肯锡统计,全球的数字化进程整体提前了7年,亚太地区更是提前了10年,运营商及企业业务数字化的速度比原先预想的快20~25倍。居家+公司的混合办公、线上+线下的远程教育、虚拟+现实的社交娱乐,这些新型模式正逐步成为新常态。 作为数字化基础设施的底座,网络联接在推动行业数字化转型中发挥着越来越重要的作用。预计到2030年, 全球总联接数或将达到2000亿,实现从连接百亿人到连接千亿物的跨越。下一代人机交互(AR、VR、XR)、住行合一、工业互联、卫星宽带互联、AI大模型分布式训练等新业务也对网络联接提出了新需求。一个原生智能、全息可视、确定性体验、安全高可靠以及具备融合感知自动化能力的网络是未来发展的方向。 在数字化转型的背景下,运营商在5GtoB、云网融合、AI算力建设与AI大模型商业化应用场景下迎来市场机遇,这些变化都对运营商的网络和运维能力提出了全新要求,进一步促进了运营商网络自动化的建设。 5GtoB场景对网络确定性体验能力提出了更高诉求 KeystoneStrategy报告显示,2025年运营商可参与的全球5GtoB市场将达到6020亿美元。但同时,5GtoB业务也对网络的带宽、连接密度、速率、时延、可靠性、移动性、定位精度等多项网络性能有着更高的要求。例如,沉浸式体验视频将持续推高带宽需求,未来其所需带宽将是当前带宽的10倍;建设智慧城市需要每立方公里10-100万设备的 5G连接密度;无人机需要500-1000km/h的移动性;自动驾驶需要亚米级的定位精度和不超过5ms的端到到时延;工业互联网则需要99.999%的可靠性。此外,5GtoB业务还对网络能力提出3大诉求:一张网满足千行百业百万级应用场景的高度差异化连接需求;在线一站式的按需、实时、灵活订购、开通及变更;端到端确定性SLA可承诺、可保障。 云智时代,云网融合新业务提出海量数据差异化上云诉求 云网融合成为企业上云的重要选择,垂直行业对云网能力的要求有三点:利用全球化的专网或公网实现企业上云和海量数据极速上云,并需确保数据安全;任何地方、任何业务均 云可实现一点入云、一点入多云,云网业务满足一体化提供、一体化运营和一体化服务的要求;能够实时感知和预测全局云网算力分布和改变,通过智能调度满足XR上云、云存储 视频压缩、金融上云等不同行业和企业在敏捷、质量、可靠性、效率等方面的差异化需求。 全球算力基础设施建设提速,要求算网协同保障应用差异化体验 过去20年间,智能算力需求增长了百亿倍。计算力指数平均每提高1个百分点,国家的数字经济和GDP将分别增长3.5‰和1.8‰,算力正成为影响国家综合实力的关键要素,算力基础设施建设成为国家数字经济高质量发展的战略举措。IDC数据显示,全球企业在AI基础设施及服务的投资,有望到2025年突破2000亿,增幅远超企业数字化转型和国 算力内生产总值(GrossDomesticProduct,GDP)。在迎接2030年智能世界的挑战中, 从个人生活到社会生产,云智新业务对带宽、时延、质量保障和管理服务等方面提出了新的要求,为此,端到端的网络必须加速实现全面数字化和智能化升级,以支持未来的发展需求。 Net5.5G Net5.5G网络架构的关键创新,夯实了IP网络智能体框架底座 在2020至2025年间,云计算、3GPP无线5G数据、行业数字化时代的浪潮席卷而来。高速、低时延和确定性网络成为了核心竞争力的关键要素。云计算和企业数字化在这个时代诞生,开始了通用云计算和云应用的快速发展。而在2025至2030年,元宇宙、工业4.0、成熟的AI和3GPP5GAdvanced将主导未来的网络发展,网络发展的历史使命将从物理世界互联互通转向AI赋能的垂直行业的数字化与智能化。在这个时代,智能、可靠且高效的网络成为了核心竞争力,Net5.5G时代应运而生。Net5.5G定义了在泛在计算、5.5G移动网络和全行业数字化时代下的网络基础设施发展方向。Net5.5G以端到端IPv6+技术为基础进行创新,通过端到端SRv6等新技术在数据面的端到端演进,确保了组网的灵活性和确定性。IPv6+网络可高效应对元宇宙时代的大流量负载,提供灵活弹性的超宽能力,提升用户体验和网络利用效率,实现智能按需访问。IPv6和网络切片 的组合有助于构建毛细血管型网络,确保工业互联网时代的效率和敏捷性。随着 Net5.5G网络的演进,面向2030年的联接物理和数字空间的智能网络基础设施逐步完善,为IP自智网络奠定了坚实的基础。 AI发展跨越拐点,全球自动化与智能化应用前所未有的迫切,自智网络进入实质性部署阶段 随着AI技术的进步,全球对自动化和智能化应用的需求达到前所未有的高度。人类社会正从感知AI技术的应用阶段进入认知AI技术的应用阶段。AIGC(ArtificialIntelligenceGeneratedContent,AI生成内容)大模型正重塑产业格局,在2年内已在50%以上的行业核心场景得到应用,迎来应用奇点。OpenAI指出,未来将有50%的人类工作任务场景受到ChatGPT(ChatGenerativePreTrainedTransformer,聊天生成预训练转换器)的影响。例如,运营商的信息交互助力类工作和依赖专家经验类的集中运维工作,都将在一定程度上被替代。为了应对这一趋势,各电信厂家纷纷基于大模型推出各种创新 应用方案。第三方报告显示,91%的运营商已启动自动化数字化战略,通过布局算网基础 AI设施和深度融合行业数据和应用,实现网络自动化与智能化,从而赋能员工,降低成本、提高效率,并提升业务体验。例如,使用虚拟数字人客服来使能客户服务体系;使用智慧教育、智能会议、智慧问诊等技术使能2B业务体系;通过对网络变更主动监控、质差预知等技术提前预防业务受损;通过网络排障自决策,网络优化自闭环等技术使能网络智慧运维。从当前研究和实践效果来看,相对于传统AI模型,大模型在意图理解、判断决策等方面表现优势明显,特别是基于海量数量构建的大模型具备出色的泛化能力,能够屏蔽局点差异实现AI的快速部署和应用;同时大模型在意图理解方面的优点,使得具备海量电信知识的大模型能够通过北向接口控制、使用、配置和管理网络设备,加速网络走向自智。 2IP自动驾驶网络挑战与关键技术 2.1IP网络自动化挑战 新业务创新慢,TTM周期长 运营商在传统的2C、2H领域的收入增长正在随人口红利的消失而遇到瓶颈,因此2B业务成为业务增长的关键市场。企业数字化转型带来的云化服务对运营商传统的2B业务提出了新的要求,需要从连接型服务转为数字化平台服务,以便与OTT(OverTheTop,通过互联网向用户提供各种应用服务)厂商形成差异化竞争。然而,传统的网络及IT系统难以支撑该战略的快速执行:1.缺乏网络服务化能力:传统的网络管理系统通常按照业务模型CLI (CommandLineInterface,命令行视图)方式部署,需要人工规划分配资源,难以满足类OTT电商化的订购体验。 2.新业务TTM(TimeToMarket,上市时间)长:传统BOSS(Business&OperationSupportSystem,电信业务运营支撑系统)业务上线时,需先在O域业务部署过程中,将VPN、隧道、Qos、路由策略、IP地址等拆分成原子粒度,通常涉及数百个接口及参数,OSS(OperationSupportSystem,运营支持系统)集成周期往往超过6个月,同OTT周级的产品迭代时间有较大差距。 多厂商组网,网络可视难 超过80%的IP网络采用多厂商设备,即使同一厂商的设备,也存在设备型号和版本差异。同时,网络设备上多种协议混合并存,IP网络软件和硬件的复杂性带来网络可视化业界难题,主要存在三大难题: 难题一,可视完整性。当前无法实现从物理层、到协议层、切片层再到业务层的多层可视,每个层次也无法实现全面的可视化。例如,无法实现设备带宽的可视化,导致无法完成整网的网络容量优化。 难题二,可视实时性。目前的可视化水平仅限于分钟级别,无法满足快速感知网络故障并进行快速闭环处理的需求。当网络故障导致业务质量下降甚至中断时,往往需要几分钟才能发现和处理,这导致用户体验下降和离网率增加。 难题三,可视易用性。运营商需要部署多个系统,每个系统又有多个界面,碎片化和离散化的可视化方式大大降低了用户体验,影响了运维效率。例如,某运营商同时部署了OMC系统、综合网管系统、SDN控制器、流量流向系统等多个离散系统,导致运维效率极低。 配置变更风险高,安全事故频发 IP网承载业务众多,例如,某IP骨干网络有2000多个网元,承载了上亿用户的业务。网络中一个细小的路由配置错误可能会产生广泛的影响,对运营商造成巨大经济损失,中断的时间越长,运营商额外承担的成本就越高,严重时甚至可能影响社会正常运转,因此,运营商普遍存在配置焦虑。例如,在某国发生的某次网络中断事故,全网业务中断了37个小时,影响了3000多万客户,直接经 济损失超过1.9亿美元,事故的原因是一条错误的路由策略导致骨干网设备的路由激增和内存耗尽。 尽力而为转发,业务体验难保障 IP网络的一个核心特征就是统计复用和尽力而为转发。路由协议基于可达性进行计算,设备在转发时基于单设备逐跳转发,缺乏对整个网络的全局视角,这种局限性导致网络极易产生局部拥塞,引发时延变大和丢包率上升。对于时延敏感的游戏和直播类业务,需要网络提供毫秒级稳定时延,而对于视频和大数据传输类业务,则需要网络提供大带宽路径。随着业务需求的不断演进,IP网络的某些固有局限性愈发凸显变,例如,网络时延的测绘往往需要人工操作,网络优化方案的制定也往往依赖于专家的经验,且需要多次迭代规划以满足用户需求。更为棘手的是,这种基于传统方式的优化很难彻底消除拥塞问题。 IP网络业务复杂,排障耗时耗力 IP网络以其灵活的网络转发能力著称,但这种灵活性同时也伴随着运维的复杂性。尤其是在转发面,高达90%的丢包故障静默无告警,且故障根因多种多样,如器件故障、协议异常、传输链路误码等,由于缺乏有效的故障定位手段,处理故障时通常需要复现问题,并需要多个部门的工程师协同工作,包括NOC中心工程师远程监控、外线工程师上站处理等。因此,这类静默故障的解决往往耗时较长,MTTR(MeanTimeToRepair,平均故障恢复时间)超过8小时,而15% 的静默故障往往会耗费80%的运维人力资源。 网络切片为业务提供资源隔离、确定性、差异化质量保障。FlexE(FlexibleEthernet,灵活以太)切片技术和Flex-channe