无线数据知识图谱驱动的 6G智能运维新技术 6GIntelligentOperationandMaintenanceNewTechnologyDrivenbyWirelessDataKnowledgeGraph 摘要 本白皮书基于对无线通信网络数据的深入分析,针对当前无线网络运维所面临的现实痛点和挑战、以及未来6G时代运维需求进行了全面的探讨。本白皮书构建了无线通信网络内生因素知识图谱,以赋能智能运维。通过构建智能运维通用框架,并利用所述知识图谱,深度挖掘和解析无线网络内在因素之间的关联关系,从而实现对网络性能的调优和更新。在应对网络通信异常时,我们能够迅速追溯问题根源并进行诊断定位,通过向量数据库的搜索,提供有效的恢复和优化方案,并将其下发至通信网络执行。最后,本白皮书对调优执行方案进行效果评估,实现智能决策的闭环实施。这一过程有效提高了无线通信网络的性能和用户体验质量,为行业发展和运营商服务水平的提升奠定了重要基础。 目录 一、现状痛点与挑战1 1.1无线网络运维的现状1 1.1.1缺乏灵活性1 1.1.2过于依赖人力1 1.1.3根因定位困难1 1.2无线网络运维的需求2 1.2.1多样化的业务要求更灵活的运维方式2 1.2.2不断增加的成本压力要求更高性价比的运维方式2 1.2.3更复杂的网络环境要求更智能的运维方式2 1.3无线网络运维智能化转型的必要性3 1.4未来无线网络智能运维面对的挑战3 1.4.1云化网络分层解耦4 1.4.2被动事后式运维转为主动预测性运维5 1.4.3网络运维知识大模型的构建6 二、无线网络智能运维场景7 2.1网络指标预测与异常检测7 2.2网络故障自动诊断与修复10 2.3网络性能检测与优化10 2.4安全风险预警10 2.5智能化远程管理10 2.6网络需求自动识别与干预11 三、无线网络智能运维系统11 3.1系统需求11 3.1.1数据的多元化11 3.1.2低运维成本11 3.1.3适应复杂网络场景12 3.1.4快速异常定位12 3.1.5精准的溯源分析12 3.1.6函数级别的故障诊断12 3.2系统架构13 3.2.1概述13 3.2.2系统功能14 3.3关键技术15 3.3.1数据基础15 3.3.2知识图谱赋能智能运维16 3.3.3异常检测智能算法19 3.3.4根因溯源智能算法21 3.3.5基于向量数据库的策略智能推荐23 3.3.6策略下发系统24 四、应用案例25 4.1用户入网成功率25 4.1.1场景概述25 4.1.2图谱和数据26 4.1.3异常场景描述31 4.1.4异常处理策略32 4.1.5实验验证33 4.2无线质差分析和处理37 4.2.1概述37 4.2.2数据采集37 4.2.3本体构建37 五、发展趋势与展望39 参考文献40 缩略语41 文档作者列表: 贡献者 单位 尤肖虎、黄永明、何世文、杨伊婷、詹行、张宇豪、尤建洁、杨沛、易云山、任鹏、姜海航 紫金山实验室 张铖 东南大学 秦臻、庞盛业、陈飞佚 浙江大学 杨立、谢峰、孙文文 中兴通讯股份有限公司 严学强、习燕、赵明宇、王俊凡 华为技术有限公司 郑青碧 中国移动通信集团有限公司 黄兵明 中国联合网络通信集团有限公司 王首峰、李占武、马丽萌、郭建超 亚信科技(中国)有限公司 一、现状痛点与挑战 1.1无线网络运维的现状 1.1.1缺乏灵活性 无线网络的发展趋势决定了需要设计和部署新的网络运营模式来支持未来的业务期望,而当前的网络运维仍然过于被动、缓慢和不够敏捷。当前的模式主要是被动式事后运维,运维人员通过监测、诊断和故障排查等手段来响应和解决已经发生的问题和异常,以保障网络的正常运行。这就会导致较长的响应时间,从而影响网络的可用性和用户体验。长运维周期也将拖慢新业务的上线周期,在带来更高昂运营成本的同时,导致客户的流失。 1.1.2过于依赖人力 当前网络的平稳运行仍需依靠运维人员的维护操作,无法做到即插即用、自治自愈。网络出现问题时,设备首先开始产生告警,系统收到告警后派发工单,运维人员接到工单后开始排查问题,找到引发问题的根源后采取相应措施解决问题、消除影响,最后由系统核实回单质量完成闭环。整个异常处理过程中,人力起到了最核心的作用。 1.1.3根因定位困难 随着通信技术的发展,用户对带宽、数据传输速率、时延、可靠性等指标提出了越来越高的要求,使得无线通信网络的结构变得越来越复杂,功能也变得越来越多样化。大规模无线数据的海量、业务类型繁多、数据源多样化、组织结构松散及高动态性等主要特点给大数据环境下的运维工作带来巨大挑战[1],使运维人员难以建立系统化、层次化的关系知识。通过切片方式进行业务管理导致业务更加动态和复杂,从而增加了网络管理难度。此外,网络管理对象也急剧增多,包括传统意义上的运营商公网和各行各业的行业用户专网。随着网络功能虚拟化(NFV)和微服务架构(MA)等技术的不断引入,网络实现了分层解耦和按需部署,但同时也带来了运维复杂度的上升,故障定位定界成为5G以及未来6G时代运维极大的挑战。 1.2无线网络运维的需求 1.2.1多样化的业务要求更灵活的运维方式 基于新技术的新业务不断推出(泛在物联网、超高清视频、XR、垂直业务服务、Web3.0云服务等),需要新的运维运营系统和流程。为了推动这些新产品和服务,相关的运营支撑需要满足其预期全生命周期的要求,因此网络运维方式必须具备更好的灵活性和效率,在确保网络质量和性能方面更加稳健的同时,适应未来业务变化的趋势。 1.2.2不断增加的成本压力要求更高性价比的运维方式 根据行业研究和数据分析,过去几年中,全球各大运营商的运维成本已经呈现出显著增长的趋势。相关报告[2]指出,自2018年以来,运营商的平均运维成本已经增长了约25%。这一数字清晰地反映了运营商在适应新技术、满足用户需求以及维持网络稳定性方面所面临的挑战。 这种成本增长主要是由于运营商在部署和维护5G网络、增加小型基站密度、扩展光纤网络覆盖以及投资智能化网络管理系统等方面的巨额投资所导致的。尽管这些投资是为了满足日益增长的数据需求、提供更快速的连接和更优质的服务,但运营商的收入增长却相对较为缓慢,甚至有些地区出现了收入下滑的情况。根据AnalysysMason的报告预测,2021年至2026年,全球运营商服务总收入的复合年增长率乐观估计能达到2.4%。而与此同时,运营商的运维成本则呈现出持续上升的趋势,预计在2024年运维支出占总收入的比例将进一步增长到30%。这意味着,目前的收入增长已经无法支撑成本压力的上升,运营商面临着巨大的经营困境。 考虑到这一情况,运营商不得不寻求降低运维运营成本的途径,以应对不断增长的成本压力。这一趋势进一步凸显了运营商在转型过程中需要更加注重效率和创新的重要性,以确保业务的长期可持续发展。 1.2.3更复杂的网络环境要求更智能的运维方式 当今,随着全球基站数量持续增长,频谱范围从以往的三个主要频段扩展至十多个频段,各种异构网络(如LTE、NR、WLAN、卫星)大规模并行运行。与此同时,网络管理对象的数量急剧增加,覆盖了传统的运营商公网以及各行各业的行业用户专网。在这种更为复杂的网络环境下,为了应对网络结构的多样性和规模的不断扩大,网络运营需要更加自动化、智能化、高效化,以便更好地管理和维护网络设备和服务。从LTE到5G网络,随着网元和功能的复杂性逐步提升,接口数量不断增加,每新增一个网元都需要精心管理其接口及与现有网络的兼容性,这进一步凸 显了智能运维的重要性。因此,更复杂的网络环境必然需要更智能的运维方式,以确保网络的稳定性、安全性和高效性。 1.3无线网络运维智能化转型的必要性 虽然网络环境日趋复杂多样,但通过人工智能驱动的以客户为中心、主动化的智能运维模式,可以有效控制网络故障的处理时间、运维成本以及人为失误。随着网络规模和数据量的不断增加,故障发生的频率也会越来越高。目前的无线网络运维难以满足用户对网络质量和性能的要求,当前激烈的市场竞争导致潜在的客户流失。 现阶段的网络运维在强调确保高可靠的设备稳定性的同时,也亟需依靠人工智能技术来提升运维效率。大规模网络和海量设备不但对无线网络带来了极大的挑战,也产生了大量的无线数据,称为无线大数据(WBD)。这些庞大而复杂的数据蕴含丰富的信息价值,如何高效地采集、存储、处理和分析这些数据,从中发现有价值的模式和关联,将是无线网络运维走实现高度智能的关键。 传统的人工运维模式已经无法满足现代无线网络的需求。利用机器学习、大数据分析等人工智能技术,可以实现自动化、智能化的网络运维,提高故障检测、定位和恢复的能力,优化网络性能,降低运维成本。通过对历史数据的分析,可以预测潜在故障并提前采取措施;通过对实时数据流的监控和分析,可以快速发现异常并自动触发修复流程。 无线网络的智能化转型不仅有利于提高故障管理、性能优化、决策支持等传统运维领域的水平,更重要的是可以全面赋能网络运营的各个环节。在网络规划和建设阶段,可以基于人工智能模型预测未来流量需求,优化网络拓扑和资源配置;在网络优化阶段,可以通过大数据分析发现潜在的性能瓶颈,自动调优参数;在营销和服务方面,可以针对不同用户群体提供个性化的网络体验。 总之,依托人工智能等新技术实现无线网络智能化转型,是当前行业发展的必然趋势和重大机遇。只有抓住这一趋势,建立先进的智能运维体系,无线运营商才能在激烈的竞争中保持领先优势,为用户提供卓越的网络服务体验。同时,智能化转型也将为通信行业注入新的活力,催生创新服务和商业模式,助力B5G/6G时代的到来。 1.4未来无线网络智能运维面对的挑战 自动化与智能化的需求增长:由于现有的无线网络运维缺乏灵活性,未来的挑战之一是如何引入更多的自动化工具和智能化解决方案来提高运维的灵活性。这包括使用人工智能和机器学习技术来自动化故障检测、性能监控和网络优化等任务。 对专业技能和知识的要求更高:随着无线网络技术的发展,B5G/6G网络变得更加复杂,对运维人员的专业技能和知识提出了更高的要求。除了强烈依赖人力之外,也可以通过人工智能中的自监督学习和主动学习来进行辅助;运用自监督学习方法,系统可以在未标注的数据上进行训练,学习到数据的分布与结构。例如,在无线通信领域,可以通过网络设备和用户行为的日志来学习正常和异常模式,从而无需大量的人工标注。同时,在一些必须需要人工标注的情况下,系统可以识别出对当前模型最有价值的数据点,并请求运维人员进行标注。这样可以确保人工标注的工作集中在最能提高模型性能的地方。 快速定位故障与诊断技术的需求:在当今高度信息化和互联网化的环境下,网络故障可能导致严重的业务中断和损失,因此对于快速定位故障的需求变得尤为迫切。利用高级数据分析工具来处理和分析大量网络数据,以便更快地识别故障模式和潜在问题;实现细分颗粒度的实时监控系统,以便持续跟踪网络的性能指标和状态,确保快速响应潜在的问题;开发预测性维护模型,利用历史数据和AI算法来预测故障发生的时间和地点,从而提前采取预防措施;利用可视化技术帮助运维人员更直观地理解网络状态和故障信息,加快诊断和解决问题的速度,从而显著提高故障根因定位困难的问题。 1.4.1云化网络分层解耦 图1NFV架构 未来的无线网络业务要求网络必须具备敏捷、弹性和健壮等特征,因此全面云化成为5G核心网的架构基础。随着NFV(NetworkFunctionVirtualization)的发展步入成熟期,全面云化从全云化核心网开始实现。面向5G的核心网需要对虚拟网络功能软件进行系统优化重构,通过控制面和用户面分离构建分布式网络来降低时延,从而可以在部署和管理网络方面实现更大的灵 活性和敏捷性,以支撑更多行业需求,实现网络转型。下图1展示了NFV体系结构,通常由三个主要组件组成:NFV基础设施(NFVI)层、NFV虚拟网络层(NFVVNF)和NFV运营支撑层 (NFVMANO)。虚拟化网络功