您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国移动]:面向5G行业终端的实时计算技术研究 - 发现报告
当前位置:首页/行业研究/报告详情/

面向5G行业终端的实时计算技术研究

信息技术2023-04-12-中国移动爱***
面向5G行业终端的实时计算技术研究

课题编号:2022-01-C-010 面向5G行业终端的实时计算技术研究ResearchonRealtimeComputingTechnologyfor5GIndustryTerminals 2023年4月 研究报告要点 自5G商用以来,各行各业都在推动5G融合业务的发展,不同业务的通信场景逐渐趋于多样化,也对实时性、可靠性、安全性提出了更高的需求。在时延敏感场景中,关键是降低网络端到端时延。随着5G、新型短距等技术推动网络通信时延不断下降,终端操作系统计算时延在端到端时延的占比不断提升。 目前5G行业终端操作系统可粗略分为嵌入式实时操作系统和通用操作系统。而两类操作系统在设计目的、技术架构、应用方式等方面存在较大差异,导 致工业控制、电力保护、自动驾驶等实时任务和数据采集、数据处理、AI训练等非实时任务无法在同一设备上运行。本研究课题旨在保留操作系统的通用处理能力的前提下,提升终端操作系统实时性,保障高实时、高性能业务需求,实现异构设备的生态兼容。 本研究报告主要阐述了各类典型行业客户的业务需求,并对业务场景根据低、中、高时延进行性能分级,研究了终端实时虚拟化系统及五种技术实现路线:专有硬件实时增强、硬件实时虚拟化、操作系统实时虚拟化、微内核虚拟化、算力调度实时增强,阐明相关技术的原理、优缺点和适用场景,并针对性提出了性能高、易用性好、兼容性强的分级解决方案,为业界提供了最佳实践参考。最后对终端侧实时虚拟层和硬件、应用软件之间的接口方面提供标准化建议。 研究单位:中国移动通信集团有限公司、中国信息通信研究院、浪潮通信技术有限公司、北京东土科技股份有限公司、中科创达软件股份有限公司、紫光展锐(上海)科技有限公司 研究人员:刘玮哲、王小莹、房正正、张悦、姜永、张天静、陈晟民、张硕、林加、张伟强 完成日期:2023年4月 目录 1范围1 2规范性引用文件1 3缩略语1 45G行业终端实时计算需求分析2 4.15G应用场景性能需求2 4.1.1实时性要求2 4.1.2可靠性要求3 4.1.3安全性要求4 4.2典型场景的业务性能指标4 4.35G典型场景的端到端时延构成分析5 55G行业终端实时计算典型场景7 5.1低时延场景7 5.2中低时延场景8 5.3中等时延场景9 65G行业终端操作系统现状10 6.1嵌入式实时操作系统10 6.2通用操作系统11 75G行业终端实时计算关键技术11 7.1专有硬件实时增强12 7.2硬件实时虚拟化13 7.3微内核实时虚拟化14 7.4操作系统实时虚拟化15 7.5算力调度实时增强16 85G行业终端实时计算解决方案18 8.1PLC工业控制解决方案18 8.1.1虚拟化层实时性优化18 8.1.2内核层实时性优化20 8.2网络数据转发方案20 8.2.1硬件层实时性优化20 8.3高清视频传输解决方案21 8.3.1应用层实时性优化21 8.3.2虚拟化层实时性优化22 8.3.3内核层实时性优化23 8.4小结24 9总结与展望25 参考资料26 面向5G行业终端的实时计算技术研究 1范围 本研究报告基于5G行业客户的典型业务需求,分析典型业务对于5G行业终端的实时性、可靠性和安全性等关键指标的要求,通过端侧实时计算技术研究,提出适用终端操作系统的多种实时性增强技术。本报告适用于各类5G行业终端,尤其承载时延敏感类业务的5G行业终端。本报告同时提供PLC工业控制、高清视频传输、网络数据转发等场景分级解决方案,为相关业务研究人员提供参考。本研究报告将重点对5G行业终端操作系统的实时计算技术进行研究,不涉及或较少涉及端侧实时计算的调度及相关接口标准的制定。 2规范性引用文件 下列文件中的条款通过本研究课题的引用而成为本研究课题的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本研究课题,然而,鼓励根据本研究课题达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本研究课题。 切片分组网(SPN)设备技术规范,中国移动通信集团有限公司. 3缩略语 下表所述术语和定义适用于本研究课题。 表1中英文对照 缩略语 英文全称 中文含义 AP ApplicationProcessor 应用处理器 API ApplicationProgrammingInterface 应用程序编程接口 CFS CompletelyFairScheduler 完全公平调度器 CNC ComputerNumericalControl 计算机数字控制机床 CP Coprocessor 协处理器 CPE CustomerPremiseEquipment 客户前置设备 DTU DataTerminalUnit 数据终端单元 1 GPL GeneralPublicLicense GNU通用公共许可证 GPU GraphicProcessingUnit 图形处理单元 GSO GenericSegmentationOffload 通用分段延后处理 HMI HumanMachineInterface 网络人机界面 IPA IPPacketAccelerator IP数据包加速器 IPC Inter-ProcessCommunication 进程间通信 MEC Multi-AccessEdgeComputing 多接入边缘计算 NPU Neural-networkProcessUnits 神经网络处理单元 OTA Over-the-AirTechnology 空中下载技术 PCIE PeripheralComponentInterconnectExpress 高速串行扩展总线标准 PLC ProgrammableLogicController 可编程逻辑控制器 QoS QualityofService 服务质量 RTOS Real-timeOperatingSystem 实时操作系统 RTU RemoteTerminalUnit 远程终端控制单元 SCADA SupervisoryControlAndDataAcquisition 数据采集与监视控制系统 SDIO SecureDigitalInputandOutput 安全数字输入输出 SMIPC SharedMemoryInter-ProcessCommunication 共享内存进程间通信 SPN SlicingPacketNetwork 切片分组网 VMM VirtualMachineManager 虚拟机管理器 45G行业终端实时计算需求分析 4.15G应用场景性能需求 目前5G通信已经进入制造、矿山、电力等多个产业领域,不同行业存在多样化的通信场景,也面临用户对于具体应用的不同需求,主要有以下几种业务性能要求。 4.1.1实时性要求 实时性是指必须在规定时间完成计算并给出确定性结果。业务实时性不仅取决于其逻辑功能的计算结果,也取决于计算结果输出的物理时间。这种确定性的 时间约束规定了在某个截止时间完成某项任务,既可以定性分析也可以定量分析。定性分析时,可根据截止时间对系统性能的影响程度分为硬实时、软实时、 准实时三种情况。硬实时是指一旦违背了时间约束,就会造成无法挽回的严重后果,如人员伤亡和重大经济损失等;准实时允许偶尔超过时限,但超时所作的操作和结果无意义;软实时是指偶尔打破时间约束不会造成致命错误,而是造成服务质量(QoS)下降,其后果可以容忍和补救,超时的响应仍然具有一定意义。三种情况的故障模式和示例系统如下表2所示。 表2实时系统的故障模式和示例系统 故障模式 示例系统 硬实时 将错过的截止时间视为系统故障 机器人控制、自动驾驶系统、航天器和行星探测器 准实时 会丢弃错过截止时间的计算,并可能会降低其性能要求以适应错过的截止时间 财务预测系统、机器人装配线的不合格零件 软实时 试图满足截止时间,但在错过截止时间时不会视为系统故障 网页浏览、用于游戏的音频和视频传输软件、多传感器同步采集的延迟 定量分析时,实时性多数状况下可由端到端时延和时延抖动来衡量。端到端时延是指数据(一个报文或分组)从网络(或链路)的一端传送到另一端所需要的总时间,它由4部分构成:发送时延、传播时延、处理时延、排队时延。在某些场景下也测量往返时延,即从发送方发送数据开始,到发送方收到接收方的确认为止,总共经历的时延。时延常以毫秒为单位来衡量。数据包的大小、链路上传下行速率、通讯距离、通讯介质的种类、节点的处理能力都会影响时延。在工业自动化场景中,执行器或传感器等现场设备和控制器以周期为单位进行数据交换、处理各种通信请求,因此也可用循环周期来表征实时性指标。 工业等领域的应用不仅要求时延要低,还要保证时延的确定性。时延抖动是基于时延产生的,即为最大延迟和最小延迟的时间差值。时延抖动的不确定性将对行业用户造成很大影响,甚至可能会造成灾难性的事故。 4.1.2可靠性要求 可靠性主要来自两个方面:一是保证终端长期运行不宕机,二是保障通信网络长期不掉线。在系统的高可靠性(也称为可用性)中,X个9是衡量其可靠性 3 的标准,X可代表数字3-6,整体代表系统正常使用时间占全年的百分比。以可靠性5个9为例,可列计算公式如下(1-99.999%)*365*24*60=5.26分钟,表示该 系统在连续运行1年时间里最多可能的业务中断时间是5.26分钟。 4.1.3安全性要求 安全性是指将具有高安全要求的关键应用(或数据)与普通应用(或数据)进行分离,并针对性地实施差异化的安全策略,分等级保障不同应用的安全,例如保证在网络传输过程中数据不会损失或篡改,同时也要保证设备在应用运行过程中的用户隐私安全等。隔离机制可在硬件、系统和应用等不同层面上实现。其中,虚拟化技术为应用和通信提供相互隔离、安全的执行环境,是防范安全问题的一种有效手段。 4.2典型场景的业务性能指标 本篇报告选取了部分典型时间敏感应用的业务技术指标要求,并划分为三种时延等级,包括低时延(T1<10ms)、中等时延(控制类T2<50ms,采集类T2<100ms)、高时延(T3<200ms),详情如表3所示。从业务时延、可靠性和吞吐量角度看,最具挑战性的场景涉及工业自动化控制,具体包括运动控制、离散控制等,其次是过程控制、自动驾驶操控、电力配电业务和用于远程控制的高速视频传输。而在海量物联网中的时延要求是相对宽泛的,比如无人机操作及交通管理、智能电网的音视频传输等。不同应用场景的有效载荷范围变化较大,从配电自动化的4 字节到运动控制的250字节、再到音视频传输的1.5千字节。 表3部分典型应用场景的业务技术指标 时延等级 场景 端到端时延 /循环周期 有效载荷大小 (Payload) 抖动 可靠性 用户数据速率 (Datarate) 低 运动控制 <2ms 40-250B <循环控制 99.9999% >10Mbps 离散控制 2-10ms 99.9999% 过程控制 10-50ms 99.9999% 周期 中 用于远程控制 远程控制 <10ms,视频 15-150KB x50% 99.999% 的视频传输 传输<100ms 自动驾驶 控车指令 <20ms,环境信息<100ms 15-150KB - 99.999% >=5Mbps 差动保护 <12ms >245B 抖动±50us 99.999% >2Mbps 配网自动化 <15ms >4B - 99.999% >2Mbps 精准负荷控制 <50ms - - 99.999% 48.1Mbps~1 .13Mbps <循环 无人机操作及交通管理 <200ms 40-250B 控制周期 99.999% >10Mbps x50% 高 用电信息采集 低压集抄<3s, 精准费控 - - 99.99% >2Mbps <200ms 电网移动巡检 多媒体信息 <200ms,控制信息<100ms 15-150KB - 99.9%~99.9999% 4~100