目录 文档作者列表5 前言6 概述7 1.问题一:为什么需要AI用例自生成?9 1.1技术特征内涵9 1.2必要性分析10 1.3可行性分析10 1.4对网络架构的影响11 1.5本章小结12 2.问题二:为什么需要QOAIS?13 2.1技术特征内涵13 2.2必要性分析13 2.3可行性分析14 2.4对网络架构的影响16 2.5本章小结16 3.问题三:如何支持AI生命周期管理?17 3.1技术特征内涵17 3.2必要性分析18 3.3可行性分析18 3.4对网络架构的影响19 3.5本章小结19 4.问题四:是否以任务为中心?20 4.1技术特征内涵20 4.2必要性分析20 4.3可行性分析20 4.4对网络架构的影响22 4.5本章小结22 5.问题五:如何支持算网融合?23 5.1技术特征内涵23 5.2必要性分析23 5.3可行性分析24 5.4对网络架构的影响24 5.5本章小结26 6.问题六:为什么需要自生长的数据服务?27 6.1技术特征内涵27 6.2必要性分析27 6.3可行性分析28 6.4对网络架构的影响29 6.5本章小结30 7.问题七:为什么需要自生长和可信的算法?32 7.1技术特征内涵32 7.2必要性分析32 7.3可行性分析33 7.4对网络架构的影响34 7.5本章小结35 8.问题八:如何理解分布式AI架构?36 8.1技术特征内涵36 8.2必要性分析36 8.3可行性分析36 8.4对网络架构的影响37 8.5本章小结39 9.问题九:分布式AI架构中不同节点如何协同?40 9.1技术特征内涵40 9.2必要性分析40 9.3可行性分析41 9.4对网络架构的影响41 9.5本章小结43 10.问题十:可以对外开放哪些AI能力?45 10.1技术特征内涵45 10.2必要性分析45 10.3可行性分析47 10.4对网络架构的影响48 10.5本章小结49 11.总结50 参考文档51 缩略语53 附录55 文档作者列表 贡献者 单位 邓娟、郑青碧、冷昀橘、李刚、温子睿 中国移动 王栋、李鹏宇、于梦晗、邢燕霞 中国电信 艾明,孙万飞、舒敏 中信科移动 李娜 爱立信 杨春刚 西安电子科技大学 赵燕、王达 亚信科技(中国)有限公司 彭程晖、王君、王飞、刘哲 华为技术有限公司 张凯宾、温海波、沈钢、陈端 上海诺基亚贝尔 袁雁南 维沃移动通信有限公司 吴连涛、杨旸、李凯 上海科技大学 薛妍、谢峰、杨立 中兴通讯股份有限公司 周凡钦、丰雷 北京邮电大学 徐勇军 重庆邮电大学 杨婷婷 大连海事大学 冯钢、秦爽 电子科技大学 许阳 OPPO 前言 人工智能(ArtificialIntelligence)在最近十年发展迅猛,在挖掘大数据样本的非线性规律,与环境交互的在线精准决策等领域快速超越了以人工为主的专家经验(HumanIntelligence)模式,在计算机视觉、自然语言处理、机器人控制等领域取得了巨大的成功。一方面由于以深度学习、强化学习等为代表的人工智能算法能力的突破;另一方面以GPU为代表的人工智能算力成本的快速下降和普及,在未来的十年的市场占有率有可能会超越CPU,也加速了这一趋势。 随着ICT(InformationandCommunicationsTechnology)技术的不断融合,网络正朝向深度IT化方向发展。在5G网络的演进过程中,AI技术开始应用在无线网络信道估计,基站节能减排[1]和网络运维等领域。应用方式主要还是以云端智能为主,在云端汇聚大量的数据,利用集中的算力对数据进行预处理,AI模型训练和验证等。但是在网络中传输大量的原始数据,一方面对传输带宽压力大,另一方面对于数据隐私保护也会带来很大的挑战。3GPP定义了NWDAF支持网络数据的收集和处理,有利于在网络架构中引入AI相关的功能。然而当前的网络和AI技术的结合仍处于初级阶段。AI叠加在网络之上,AI在网络中发挥的作用散落在网络不同的功能点,其主要目标是利用AI提升网络的性能,运营和价值。 未来6G网络的作用之一是基于无处不在的大数据,将AI的能力赋予各个领域的应用,创造一个“智能泛在”的世界。6G应在5G基础上全面支持整个世界的数字化,网络要助力千行百业的数智化转型,需要满足和提供相比云端智能实时性更高,综合能耗和安全隐私更优的智能化服务[2]。同时,网络运营维护也需要从局部的智能化运维向高水平的网络自治演进。这些都迫切要求网络与AI技术更紧密的结合,将AI能力通过网络架构的革新深度内化到网络中。为此,6G网络提出了“智慧内生”的基本特征构想,即6G网络将在设计之初就考虑与人工智能技术融合的理念,将AI和大数据的应用融入网络的基因当中,形成一个端到端的体系架构,根据不同的应用场景需求,按需提供AI能力和服务。 通过在6G网络架构的设计中充分考虑AI的算法,算力和数据以及网络连接等诸多要素,6G将成为融合连接和算力的新型基础设施,从而极大提高AI资源的使用效率并使AIaaS(AIasaService)成为可能,AI能力在网络中无处不在、无孔不入,并像人体的大脑和神经网络一样,以分布式或集中的方式随时随地按需提供给网络自身及第三方,实现智慧的泛在可得、全面赋能万事万物。 ——中国移动邓娟、上海诺基亚贝尔陈端、重庆邮电大学徐勇军 概述 6GANATG2是6GANA下负责研究基础网络架构的工作组,其将识别6G网络内生AI的基本技术特征,研究其对6G网络架构的影响,对标准化的影响,构建6G网络内生AI整体框架,定义基础架构,并对涉及的关键使能技术进行探讨。面向该目标,TG2成员单位经过全面收集和充分探讨,凝练出现阶段业界广泛关注的、对6G网络架构存在潜在影响的十大核心技术问题。针对每项问题,从特征内涵、必要性、可行性、对网络架构的影响等四个方面展开分析,研究该问题所示技术特征是否6G网络内生AI架构所需,并给出了TG2的观点和建议。这十个问题分别是: 一、为什么需要AI用例自生成? 二、为什么需要QoAIS? 三、如何支持AI生命周期管理? 四、是否以任务为中心? 五、如何支持算网融合? 六、为什么需要自生长的数据服务? 七、为什么需要自生长和可信的算法? 八、如何理解分布式AI架构? 九、分布式AI架构中不同节点如何协同? 十、可以对外开放哪些AI能力? 网络执行 算力 问题七 问题六 算法 数据 连接 问题五 问题四 对外能力开放 集中式AI超脑 AI工作流1 AI工作流3 分布式 AI边脑 AI工作流2 AI工作流4 问题十 问题九 问题八 问题一 需求导入 问题二、三 质量评估保障 十个问题间的逻辑关系如下图所示: 底层资源 计算存储通信 承接TG1对需求和应用场景的研究,面向不同行业和场景对6G网络内生AI千差万别的需求,TG2提出的第一个问题即是:如何去表达和导入用户对6G网络AI服务的需求?AI用例(需求表达形式)的自生成(一种导入方式)为什么会成为6G网络支持的技术特征? 进一步地,在服务需求的基础上,如何去分析和映射到网络可以理解的AI服务的质量需求?针对这一问题,TG2提出QoAIS(QualityofAIService)AI服务质量的概念,并给出一种供参考的指标体系设计。作为AI服务的提供者,网络如何评估和持续地满足用户的上述需求,实施QoAIS保障,则需要从网络AI的管理、控制、业务流等多个层面展开思考。 问题三从网络AI的管理角度提出如何通过对AI生命周期的管理来自动化的实现AI应用的开发、 部署和相关的模型管理,来实现QoAIS的保障? 问题四则是从多维资源融合的角度,提出是否以任务为中心,协同控制网络AI所需四种资源要素 (即算法、算力、数据、连接),以实时的、持续的满足用户对QoAIS服务质量要求。 由于算法、算力和数据将同传统连接一样,成为网络中可管控的新资源维度,资源的异质性及挑战和需求的差异性使得它们在网络架构的设计中呈现出不同的技术特征,需进一步展开研究: 问题五从算力维度,提出如何深度融合算力和连接资源以实现更高效能的AI任务? 问题六从数据维度,提出为什么需要通过内生AI改善当前数据价值密度低,存取效率低等问题, 实现按需动态的数据编排和配置,反哺于内生AI的数据服务; 问题七从AI算法维度,针对当前AI领域面临的两大挑战:AI算法对大数据的过度依赖和AI算法的可信?提出为什么可通过基于模型的计算实现AI算法的自我进化,以及如何提供可信的AI算法? 在上述资源的部署架构方面,6G将呈现集中式和分布式相结合的特点。集中式资源下的AI能力供应在5G网络中已有较多的实践,因此问题八和九提出6G如何理解分布式AI架构,体现在哪些方面,以及不同节点间如何协同的问题。 最后,从资源对外开放的角度,问题十提出6G网络中上述资源可包装成哪些特定的能力向第三方开放。 本白皮书的最后一章总结了现阶段6G网络内生AI架构需具备的重要技术特征,对下一步工作进行了展望,并呼吁业界聚焦到关键技术问题的深入探讨和研究上。在本版本的编制过程中,TG2成员单位经过多次开放性技术探讨,对于6G网络内生AI的需求、概念和内涵已逐渐达成共识,对上述技术特征的重要度尚无统一意见,在对网络架构的影响方面仍需深入全面的分析。在6G网络内生AI研究伊始,希望本白皮书版本能成为AI技术专家和6G网络专家紧密合作的契机,共同助力构建“智慧泛在”的未来社会! ——中国移动邓娟 1.问题一:为什么需要AI用例自生成? 1.1技术特征内涵 AI用例自生成:网络自身根据数据分析推演或外部导入,生成关于AI用例描述的过程。通过AI用例的管理将AI用例部署到网络中,网络根据AI用例的描述按需调配网络元素(包括数据、算法、算力、连接等)以满足该用例的性能需求。 AI用例:AI用例是用户在智能应用场景下向网络提出的一次AI服务请求,一个AI用例可能涉及到一类或多类网络内生AI服务(如AI训练、验证和推理服务)的调用。如下示例为一个AI用例涉及单一类型服务和涉及多种类型服务的情况: -单一类型服务:AI数据服务或模型训练服务或模型验证服务或模型推理服务 -多种类型服务:AI数据服务和模型训练服务 智能应用场景:指应用AI用例所生成的智能的场景,一个智能应用场景下可能需实施一个或多个AI用例才能达到智能化目标。智能应用场景例如网络自治类场景、行业类场景、未来数据推演出的新场景等[3]。 以网络自治中的智能应用场景举例说明智能应用场景与AI用例之间的关系:如网络通过KPI (KeyPerformanceIndicator)指标监测发现某CBD(CentralBusinessDistrict)区域语音切换成功率普遍较差,需要进行智能化提升。智能应用场景为提升该CBD区域内所有小区的切换成功率,智能化目标为该CBD区域内所有小区的切换成功率达到目标值。网络通过智能分析,诊断出影响该区域切换成功率的因素有部分小区的SSB波束覆盖不佳、部分小区的邻区配置不准确、部分小区的切换测量参数配置值不佳等三个原因,从而生成此智能应用场景下的三个AI用例: AI用例一:优化部分小区的SSB波束覆盖 AI用例二:优化部分小区的邻区配置 AI用例三:优化部分小区的切换测量参数值 AI用例描述:AI用例描述承载了与AI用例相关的信息,这些信息是网络为了满足用户提出的AI服务请求,在实操层面需获知的框架性或辅助性信息。从描述中,网络可获知在智能应用场景、输入输出数据、模型选择、模型训练、模型验证优化、以及实施模型输出的结论/决策等方面的信息。“可行性分析”部分给出了针对上述AI用例一的一种描述方式。 AI用例管理:AI用例生成后,针对不同智能应用场景,按需管理和智能部署AI用例。 1.2必要性分析 面向网络智能自治,采用人工发现问题并使用AI解决问题,始终受到人工认知的局限性,网络的智能化能力和网络功能性能潜力也将无法最大化激发[4];同时,依赖人工的烟囱