6G内生AI架构及AI大模型 刘光毅 2023年10月 1 6G内生AI的驱动力 2 6G内生AI架构设计及关键特征 3 6G与AI大模型 2 人工智能已成为新一轮产业升级的核心驱动力,产业的自动化、数字化、智能化需要泛在智能 定制网络 智能覆盖 应急通信 运行与维护 网络自治需要AI 个性化推荐 智能导航 机器翻译 声纹识别 用户需要AI 智能制造 机器人救援 安全监控 医疗识别 企业需要AI 6G与AI的融合包括“AI赋能网络”和“网络使能AI”两个方面 3 传统通信系统的性能提升遭遇瓶颈 新 赋能通信网络性能提升 通 信 空口 更精确的信道信息 更精确的定位 更强大的干扰消除能力更高的能效谱效容量 网络 更快速的场景适应能力更均衡的流量调度 更快速的组网干扰规避 更精细的业务识别更准确的故障定位 4 增 项 能 AI 6G提出更挑战的需求指标 AI赋能网络性能的驱动力 移动通信技术的发展遭遇瓶颈,迫切需要技术创新和交叉学科融合发展利用AI赋能网络性能提升成为主要解决思路之一 网络运维运行效率、复杂度和成本之间产生矛盾 网络运维效率 矛盾三角 网络复杂度成本 增 能 项 的 强 现有技术难以完全满足6G需求 更大规模MIMO信道估计困难更密集的基站部署干扰更严重更复杂的系统设计带来能耗上升海量异构设备组网路由复杂 多样化通信场景需求碎片化4 ITU将6G场景扩展到泛在智能,需要将AI打造成6G通信网络的新能力和新服务,实现AIaaS ITU将6G场景扩展到泛在智能 6G网络内生提供AI服务 随时随地获得AI 低时延AI推理/训练 支持移动式AI AI服务质量保障 AI安全隐私保护 5G 通信能力 通信服务 6G 通信能力+计算能力感知能力数据能力AI模型能力 AI服务 55 场景用例驱动式AI 外挂或嫁接式AI AI 赋能网络 海量流量数据 智能数据分析 针对特定空口、网络优化用例设计单独的AI模型 在网络中新增AI服务器或AI相关网络功能,如NWDAF AI服务器 NWDAF CN RANUE 信道条件多变 切换性能降低 天线权值调优 用户移动预测 网管 存在问题:数据的实时性、有效性和一致性难以保证,性能难以达 存在问题:AI模型泛化性较低,开发周期长、成本高 到预期;难以实现数据采集、训练、推理、优化、验证的AI全流程,试错成本高; 网络赋能AI 提交AI服 务订单 网络传输 UE 网络 云AI服务提供商 智慧工厂 实时多智能体协作 针对不同第三方AI场景设计不同AI服务流程云AI服务提供商在用户提交订单后提供尽力而为的AI服务 车联网 高速智能跟随 面向6G与AI融合需求,场景用例驱动、外挂或嫁接式的现有AI设计方式通用性和效率有待提升 XR/VR 用户移动预测 存在问题:通信网络无法根据差异化场景需求,快速部署 AI服务 存在问题:网络作为透明管道,数据上传云端,难以高效利用网络中泛在的通感算数智等资源,无法保障AI的服务质量和安全 6 面向6G泛在智能的愿景,网络与AI的融合需要有三大转变,6G网络将是内生AI 远程AI服务 基于QoAIS的网络AI 服务 云AI供应商 1.从场景驱动到泛在智能的网络与AI一体化服务供给框架 网络使能AI场景 AI赋能网络场景 工业互联网智慧农业车联网智慧医疗云游戏/云XR 网络智能优化 AIaaS QoAIS 2.从外挂叠加到内生一体 QoAISAIaaS 内生AI 3.从尽力而为到按需可得和服务保障 1 6G内生AI的驱动力 2 6G内生AI架构设计及关键特征 3 6G与AI大模型 8 面向泛在智能等多种服务需求,6G将新增多个逻辑面,提供通信、感知、计算、AI 、大数据、安全等一体融合的多维网络能力,以及平台化、一体化的服务体系 与5G网络不同,6G网络将定义新的数据面、智能面、计算面等, 并有望扩展传统的控制面和用户面 数据面: 用户需求: 通信需求 数据开放需求 计算服务需求 AI服务需求 安全服务需求 数字孪生 管理网络数据,提供数据 服务 计算面: 管理计算并提供计算服务 智能面: 为原生AI提供全生命周期 的运行环境 9 AI服务的完成需要通信、数据、计算、智能面的协同 基于上述融合架构,东西向流程实现AI赋能网络,南北向流程实现网络使能AI,满足内外AI服务的QoAIS要求。 2.从外挂叠加向内生一体转换 1.泛在智能的网络和AI一体化服务框架 3.从尽力而为向按需可得转换 AI 赋能 网通信控制 络 通信承载 数据控制 数据处理 网络使能AI 计算面 计算控制 计算执行 通信面 数据面 AI用例生成及策略 AI任务全生命周期管理 智能面 AI管理和编排 服务QoS解析 AI任务管理 AI任务调度 模型控制 模型操作 数字 孪 网络功能通 生 编排信 面 四要素资源的 控制数 字孪生 AI训练、推理、压缩、验证等的结果 10 AI服务质量(QoAIS)指标体系 QoAIS保障机制 AI服务质量(QoAIS)指标体系,突破传统QoS体系中以会话和连接性能为主要关注指标,将安全、隐私、自治和资源开销作为新的评估维度纳入,形成一套标准化的AI服务质量评价体系,为用户AI服务质量的衡量和保障机制的设计提供了统一的依据 平台化服务网络 管理编排 服务QoS 分布式算力(边) 分布式算力(边) 分布式算力(中心) 分布式算力(中心) 任务管理 任务控制 分布式算力(端) 分布式算力(端) 统一IP算网底座 分布式算力(网) 分布式算力(网) OTN/OXC OTN/OXC OTN/OXC 算网基础设施层 全光底座 例如:推理速度、能源消耗、计算安全、数据隐私、模型可控性等 例如:任务优先级、算法资源保障优先级、数据资源保障优先级等 例如:性能指标界、训练耗时、计算开销等 智慧城市智慧工业智慧生活智慧园区智慧娱乐 QoAIS是管理编排和任务管理/控制的重要输入,管理编排 需要将服务QoS分解为任务QoS,再映射到对连接、计算 、数据和算法等各方面的资源QoS要求上 为保障QoAIS的达成,需要“三层闭环”的保障机制 QoAIS指标体系是网络对AI服务的质量和效果进行保障所 使用的一套指标体系 QoAIS包含AI服务的QoS、AI任务的QoS、AI资源的QoS 三个层次上的指标,三层指标间具有映射关系 11 5GMEC边缘计算缺点 编排管理、控制面、用户面三个维度实现计算和通信深度融合 传统网络中提供AI服务需要通信和计算协议之间频繁的交互与协调,需要设计一套通算融合的内生AI协议,实现对计算和通信的协同管控与承载,满足AI所需的连接和分布式计算服务、以及基于AI的连接和计算融合控制需求。 控制面:计算和通信深度融合的三种模式 管理面融合的松耦合设计效率低成本高 安全性隐私性不够 模式一 CRC 集中控制 RRC 模式二 模式三 编排管理:计算和通信资源的协同编排管理。 xNB CRC 优势:宏观网元连接关系、各类资源状态,保证网络级性能指标较优。 高计算效率 低能耗、低时延 满足各类AI场景差异化 QoAIS需求 xNB CRC RRC 6G内生AI的算力需求 CRC:ComputingResourceControlNC:NodeCompute 优势:当QoAIS指标发生恶化时,可快速调整,保障QoAIS目标的持续达成。 用户面: 联合设计“计算协议+通信协议”满足QoAIS+均衡分配网络资源,满足“性能+开销”上的需求。 面向网络中AI的海量训练数据需求和极高的试错风险,需要网络数字孪生实现按需的数据生成与可靠的AI与验证 数据生成及优化 网络虚拟场景 网络AI需求 外部需求自生成的需求 预测的网络变化数据数据孪生建模需求 数据生成需求 数据数据模型 构建场景 数字 孪生体 模型优化 (如精准度优化) 数据按需生成 数据采集 生成的场景数据 数字规划体 已处理的网络数据 (如用户、业务 等数据) 旨在降低孪生网络从物理网络采集和传输数据的开销,提高数据采集和处理效率,解决传统真实数据获取难等问题; 技术:GAN数据增广技术 AI预验证 旨在不影响网络运营的情况下完成网络决策的性能预验证,降低 采集库 需求 无线物理网络 需要采集的数据类型、体量、频次等 虚拟化核心网 CUDU 云化无线网 AAU 网络运维操作及AI决策可能导致网络性能恶化的潜在风险; 差异化的网络AI需求需要通信、计算、数据、智能面网络功能的灵活组合,基于服务化的网络架构设计和实现为按需灵活编排提供基础 API 编排层 网络功能层 通信面 数据面 计算面 智能面 通信与算力层(无线通信,光通信,计算,存储) 连接与路由层 VNFs VNFs VNFs VNFs NFV-O SDN-O 业务编排器 其他功能 全局数据库策略数据采集与分析 微服务支持 OSS/BSS等 14 1 6G内生AI的驱动力 2 6G内生AI架构设计及关键特征 3 6G与AI大模型 15 发展模式新跃迁 当前网络AI泛化性有限 AI迈入通用智能时代,大模型的出现将为6G与AI的融合带来巨大变革 ChatGPT现象级事件,标志着人工智能进入通用智能时代 动力智能 能动会控 从“能听、会说、能看、会控”,走向“能理解、会思考、会创作”,甚至能“自主决策、自主处理问题” 认知智能能理解会思考 从小模型到大模型,生产效率跨越式提升 天线权值调优 天线权值调优 基础通用大模型具有泛化性,网络智能化将从用例驱动转变为能力驱动,迅速降低应用开发门槛,加速AI工程化、规模化落地 流量数据分析 流量数据分析 用户移动预测 感知智能 用户移动预测 计算智能 能存会算 能听会说能看会认 弱AI时代 通用智能时代(强AI时代) ... ... ... 小模型 ... 基础大模型 (普适通用,如NLP,CV,多模态) 行业大模型 (教育) 行业大模型 (网络) 行业大模型 (泛娱乐) 小模型 小模型 小模型 小模型 小模型 小模型 小模型 小模型 小模型 6G网络内生AI如何使能AI大模型?如何设计赋能网络的AI大模型? 16 6G内生AI为AI大模型的训练过程提供链接、数据服务,为推理过程提供链接、计算、模型拆解/分发服务。 AI训练服务 AI推理服务 处理后数据处理后数据 海量数据采集 数据处理 推理请求 AI推理 UE6G网络云AI供应商 特点 AI大模型训练通常在数据中心的多台服务器中,服务期间需要用高速率光纤连接,难以将AI大模型的训练过程部署到无线网络中。 服务从用户、网络中采集大量数据,数据的预处理和流量的调度, 支撑AI大模型的训练。 潜在6G网络承担数据采集、预处理等数据服务,节省网络中的数据 增益传输,为云AI训练AI大模型提供更好的数据服务。 未来AI大模型需要哪些特殊的数据分析技术?数据处理功能分布式 问题部署后网络中数据该如何合理调度? UE6G网络云AI供应商 AI大模型需要较大的储存空间和较强的AI推理芯片,单基站无法 满足该需求。 在实现合理模型分割的前提下,可将大模型分布式的部署到无线网络中,提供AI推理服务。 在6G网络中分布式部署AI大模型,更靠近用户侧,可能在时延方面具有优势。 分布式部署导致推理时延增加和靠近用户侧传输时延减少该如何权衡?大模型分割、压缩、加速等技术是否可行;大模型分布式部署后节点之间数据如何合理调度? 17 与ChatGPT不同,网络中存在大量结构化数据,且网络不同问题间的共性不清晰,网络AI大模型面临较大挑战 1.面向上述场景,可考虑分阶段探索,首先探索网络运维人工智能大模型从小规模、离线入手,向大规模、实时发展,