1 6GAI数据服务框架与使能技术 6GAIDataServiceFrameworkand EnablingTechnologies 目录 摘要4 一、6GAI数据服务概述5 1.16GAI数据服务的产生背景5 1.26GAI数据服务的价值与潜力5 1.36GAI数据服务的定义6 二、6GAI数据服务框架与数据平面6 2.16GAI数据服务框架6 2.26G数据面7 2.2.1新增数据面的驱动力7 2.2.26G数据面的内涵9 2.2.3数据面与控制面/用户面的关系10 2.2.4数据面的组成单元10 2.2.5功能定义说明11 三、6GAI数据服务使能技术13 3.1数据服务编排技术13 3.2数据路由转发技术13 3.3数据预处理技术14 3.4数据分析与共享技术15 3.4.1数据可用性分析15 3.4.2数据价值评估15 3.4.3联邦学习16 3.5数据存储技术17 3.6数据安全保护技术17 3.7数据编织技术20 四、6GAI数据服务的应用场景22 4.1AI原生的新型无线网络架构下和空口下的数据服务应用场景22 4.2体验提质和网络提效的数据服务应用场景22 4.36GAI数据服务于工业场景23 4.4内生AI的跨域跨平台多中心数据服务应用场景24 4.5基于6G数据面架构的服务质量预测应用实施例25 五、总结与展望25 缩略语简表26 参考文献27 文档作者列表 贡献者 单位 严学强、赵明宇、习燕、唐朋成、王俊凡 华为 袁雁南、崇卫微、金辉、刘佳敏、张宏平 vivo 李唯源、李琴、廉月 中国移动 王首峰、曹晓华、宋亮、赵燕 亚信科技 梁亚从、包施晗、孙万飞 中国信科 程冠杰、秦臻、邓水光 浙江大学 凌颖、黄磊 中国电信 裴郁杉、李瑞华、黄蓉 中国联通 李文璟、周凡钦 北京邮电大学 尤建洁 紫金山实验室 摘要 感知和智能将是6G网络的两大内生能力,前者产生海量数据,后者基于数据进行自动决策以提升网络性能或作为服务提供给上层应用。6G内生智能能够利用人工智能(ArtificialIntelligence,AI)算法来提升网络性能,增强用户体验和效率,同时借助泛在算力和数据为AI提供多种支撑能力,实现高效的AI训练/推理、抽取和封装网络智能并服务于不同行业和应用。现有移动通信网络以用户面会话承载作为数据传输的“管道”,通过集成单点技术实现数据处理、数据监管及安全隐私保护,为智能应用提供特定数据服务能力,但缺乏归一化的数据服务框架,并面临着数据治理层面的诸多挑战。在算力和数据泛在分布的6G时代,全新感知和智能以及其使能的智能应用将带来全新数据类型。而且,数据本身蕴含的价值也有待挖掘,并以服务的形式提供给网络内外的数据消费者。本白皮书基于6G内生智能和感知以及分布式算力和数据等特征,提出独立于传统用户面的数据承载机制、数据编排及服务架构设计,引入具备随路处理和任意拓扑支持的6G数据承载机制、描述了数据面的功能架构和关键使能技术,最后给出了数据服务的典型应用场景。 一、6GAI数据服务概述 1.16GAI数据服务的产生背景 随着人工智能技术的不断成熟和应用场景的不断丰富,以深度学习为代表的人工智能应用已从消费、互联网等泛C端领域,向制造、安防、医疗等传统行业辐射。AI技术创新应用的大规模落地,带动了大数据智能市场的蓬勃发展,同样也为数据服务注入了市场活力。5G开启万物互联的场景连接,将千行百业接入到了移动通信网络,带来了新的场景和无处不在的数据。6G网络的作用之一是基于无处不在的大数据,将AI的能力赋予各个领域的应用和场景,通过广域覆盖和场景的智能适应,创造一个“智能泛在”的世界。因此,6G网络需要构建内生的、泛在的和分布化的AI能力[1]。6G网络中内生智能,对内能够利用AI算法来提升网络性能,增强用户体验和效率,对外为AI提供多种支撑能力,使得AI训练/推理可以实现的更高效、实时,能够抽取和封装网络智能,服务于不同行业的客户。6G新系统中将会有非常多种类的AI模型数据、训练数据,它们需要能在不同网络架构的各个网元节点之间进行交互和共享利用。随着AI行业商业化发展,更具有前瞻性的数据集产品和高定制化数据服务需求将成为主流。 移动通信网络作为数据的生产者和消费者,正在从数据的承载者向具有可信管控和价值挖掘的数据平台转变。以5G为代表的现有通信网络作为通信会话类数据传输的“管道”,仅仅扮演了终端设备和网络之间建立信息交互通路的角色。但随着内生感知和智能成为6G网络的基础能力,分布和泛在的算力与数据成为通信连接以外新的网络服务能力。不同于通信会话类数据的点到点传输,处理智能、感知、以及网络运营自身产生和消费的数据面临的挑战是需要以一种分布式的方法进行数据采集、预处理、存储和分析。为此,需要设计一种独立于传统用户面的数据服务架构,系统性地解决6G移动通信网络对非用户面数据的管控和价值变现的挑战。 1.26GAI数据服务的价值与潜力 内生感知和智能将是6G网络的两大主要新增能力,前者产生海量数据,后者基于数据进行自动决策以提升网络性能或作为服务提供给上层应用。得益于大数据技术以及人工智能的巨大成功,其在无线网络中的应用也日趋成熟。据华为预测,到2030年全球每年产生的数据总 量将达到1YB,相比2020年增长23倍[2]。大量数据的价值变现一方面需要借助智能分析算法,同时数据的真正价值体现依赖于其流动性和数据协作,因此数据的隐私保护和开放共享是实现数据流动并体现价值的重要机制;数据的拥有者或提供者把数据以一种服务的形式提供给数据消费者才能实现价值变现。不同于一般意义上的资产价值变现,数据变现不是一次性交易,需 要保证数据在隐私保护下实现数据的重复价值变现。对网络AI而言,基于大量训练数据训练好的AI模型,是大量数据经过算法挖掘后的价值呈现,同时也是需要保护的一种重要的知识产权。 1.36GAI数据服务的定义 从数据来源、应用范围、数据产生的时变性、隐私保护要求、存储要求等不同维度,6G网络中的数据可以划分为用户签约数据、网络数据、感知数据以及AI数据[2]。其中AI数据包含分布式网络AI训练和推理过程中传递和使用的测试数据、输入数据、中间数据、输出数据如模型、梯度、置信度、向量等。 6GAI数据服务是基于数据采集、预处理、分发、分析以及发布的框架,满足数据监管法律法规的要求,将数据作为一种服务产品提供。满足客户跨系统的实时数据需求,能复用并符合企业和工业标准,兼顾数据共享和安全[2]。其将汇聚后的内外数据通过融合加工、去隐私化处理、标准化地进行封装,形成对外数据服务,以标准化的数据服务方式,向6G内生AI网络及外部第三方用户提供开放服务,对数据进行资产化变现。AI数据服务的类型包括提供用于训练或推理的原始数据或预处理数据、数据分析、数据存储、数据安全隐私保护、数据共享和交易、数据溯源、合成数据等。数据服务的主体可以是终端、网络中的各个设备等,客体同样也可以为终端、网络设备,同时还包括外部第三方用户等。 二、6GAI数据服务框架与数据平面 2.16GAI数据服务框架 6G网络的内生智能和感知能力将使能智能连接的数字孪生世界。为满足6G网络架构和业务场景的新需求,创新性地设计归一化的6G数据服务框架,其将提供数据主体对数据的自主控制权、安全可信的数据访问控制机制,满足监管、审计和溯源要求,并消除单点信任及单点失效的风险,提供可信的智能数据服务。AI数据是6G数据的一部分,该框架同样用于6GAI数据服务。如下图所示。 图16G数据服务框架 数据服务:提供可信的数据服务。按场景和分级实施端到端的数据和隐私保护,实现合理合规的数据的采集获取、处理及存储等。 基础设施:6G网络的数据源来自基础设施层的各类网络,包括移动通信网络、IoT感知网络、车联网或物联网等基础网络。 网络AI:通过隐私保护处理及授权后,可由机器学习结合知识图谱等AI工具实现数据知识化,使能多样化的应用。 应用:数据服务的消费者,包括6G内部的网络功能模块、网络数据分析以及第三方应用等。 2.26G数据面 2.2.1新增数据面的驱动力 数据服务是6G系统的重要使能技术之一,面向通信优化需求进一步增强跨域数据协作、数据复用效率和时间累积效应。跨域数据协作包括核心网与无线接入网、终端、网络外部功能等之间的数据协作。数据复用需避免点对点方式中相同或类似数据的重复收集的问题。进一步考虑引入AI后单个时间点的少量即时数据难以满足需求,因此多个时间点的持久化数据有利于挖掘时间累积价值。面向新服务(如感知、计算)控制优化,提供网络功能和资源的实时状态数据,例如感知节点(如基站或UE)的位置信息、移动速度、通信负载、计算负载等。面向用户级数据,根据用户需求和授权支持其个人数据的产生、收集和存储,用户级数据控制和存储需由完全归用户个人所有的数据节点完成。未经用户授权的任何网络内外部功能无法控制、访问和使用所述用户级个人数据,为个人数据保护提供监管和数据泄漏可追溯的技术支撑。 6G数据功能提供网络所需的通用基础数据,包括网络设备级数据、UE级数据和非单UE级数据等,而不是应用功能间点对点的数据或通信控制数据。业务逻辑上数据面需考虑向数据提供者付费,不同于用户面向用户收费的数据传输逻辑,也不同于控制面保障控制信息高优先级实时传输的逻辑。在安全性和移动性等方面,数据面需求与用户面和控制面的需求也不相同。潜在数据面的数据终结点可位于核心网、无线接入网或UE,UE数据功能和网络数据功能之间的对等性增强。以通信感知一体化中的感知数据为例,所述感知数据包括感知测量数据和感知辅助数据等。感知测量数据主要包括终端与网络侧感知功能或基站与网络侧感知功能之间的感知测量数据(如时延、多普勒、角度、强度等)。感知辅助数据主要包括位置信息(如GPS位置)、时间信息,及其他感知设备(如摄像头、激光雷达等)的感知数据等。对于部分感知场景(如环境重构等),感知所需传输的数据量较大,并且所述感知数据终结于网络内部的感知功能而非网络透传。所以感知数据不同于网络透传的用户面数据,用户面承载的数据是终结于应用功能的数据。如果使用控制面传输大量感知数据,可能影响高优先级和高实时性的信令传输,并且控制面定位也不适宜传输大量数据。从终端角度考虑,当终端参与感知提供感知测量数据时,需考虑向终端用户付费,不同于现有控制面和用户面向用户提供的传输服务以流量等量纲向用户收费。根据不同感知场景需求,基于感知测量数据产生感知结果的功能可能是UE、基站或核心网功能,进一步考虑多个UE或基站协作进行感知测量时,感知数据的交互关系不局限于点对点。因此,可以考虑通过数据面来满足通信感知一体化的感知数据传输需求。 现有5G通信网络是基于会话构建的,其用户面用于承载会话数据。由于无法满足6G数据承载所需要的“随路计算”和“任意拓扑”支持,用户面无法承载6G网络新的数据类型。5G用户面的会话连接实现两个通信设备之间的信息交互,具体是由协议数据单元(ProtocolDataUnit,PDU)会话提供用户终端设备和网络之间端到端的用户面连接。而6G数据面传输则由数据采集、预处理、转发、存储和分析等功能组成。5G用户面会话只实现数据包传输,而6G数据面传输网络则需要实现随路计算,在数据管道中,数据被转换和优化以达到数据分析和智能应用所需状态。在数据转发行为上,会话的数据包基于目标地址进行转发;而数据管道中,数据包则基于数据服务和数据管道标识进行转发。基于5G用户面会话的数据转发属于TCP/IP层,而数据面的数据转发则属于应用层。此外,基于会话的拓扑是点对点的连接,而6G数据面则需要支持任意拓扑结构(如数据分发和数据聚合需要的树形结构)。如果沿用现有用户面承载所有6G网络数据,数据的起始和终结只能在PDU会话的两端,即用户设备(UserEquipment,UE)或用户面功能(UserPlaneFunctions,UPF),无法满足对感知数据、AI数据、网络行为和状态数据的分布式管控。因此6G