中国移动 ChinaMobile 中国移动数据快递技术 白皮书 中国移动2023年 中国移动数据快递技术白皮书编制人员 编制人员 编写单位: 中国移动通信有限公司研究院、中移信息技术有限公司、中移(苏州)软件技术有限公司、中国移动通信集团北京有限公司、中国移动通信集团湖南有限公司、中国移动通信集团浙江有限公司、中国移动通信集团广东有限公司、中国移动通信集团江苏有限公司、中国移动通信集团贵州有限公司、中国移 动通信集团宁夏有限公司、华为技术有限公司 参编人员: 陆璐、孙酒、李志强、刘鹏、杨红伟、赵广宇、杜宗鹏、储琴琴、许豪豪、 元鑫、徐硕、张飞、车轮奔、莫韦蓬、符康、蒋艳明、黄舒吴、李学敏、梁巍、庆祖良、郭吴明、田智、王萍、饶倩胤、曹仕礼、黄金明、黄璐、张军林、段临晶 II 申国移动数据快速技术白皮书前盲 前言 信息通信领域的领先运营商,充分发挥中央企业“网络强国、数字中国、智慧社会”主力军的作用,系统打造以5G、算力网络、智慧中台为重点的新型信息基础设施,创新构建“连接+算力+能力”新型信息服务体系,制定了算力网络总体发展策略,明确了核心理念、场景展望、发展路径以及技术 体系,提出了“泛在协同”、“融合统一”和“一体共生”的三个发展阶段,先后发布《算力网络白皮书》[、《算力网络技术白皮书》[]及《算网一体网络架构及技术体系白皮书》3,持续推动我国数字经济的健康发展。 数据快递是面向海量数据在线高效传输的网络服务,依托中国移动强大的算力网络基础设施,可提供数据快递站和直通两类业务模式,结合高吞吐、高弹性、高安全、低时延等关键技术,最大化提升数据在线传输效率,为用户提供专线传输、聚合传输、错峰传输差异化数据传输服务,助力数字中国、东数西算等国家战略的实施。 本白皮书详细描述了数据快递产生背景及驱动力、典型应用场景、方案架构和技术体系,并对数据快递服务的产业发展给出了儿点倡议。 本白皮书的版权归中国移动所有,未经授权,任何单位或个人不得复制或持贝本白皮书之部分或全部内容。 III 中国移动数据快递技术白皮书目录 目录 编制人员前言 1背景及驱动力 1.1产业驱动 1.2技术驱动 2典型应用场景 2.1云间灾备 2.2影视剪辑 2.3科学计算 2.4基因测序 2.5家庭宽带 3“1+2+3”解决方案 3.11套技术架构 3.22类业务模式10 3.33种服务能力,11 4“三高一低”技术体系1.4 4.1高吞吐技术14 4.2高弹性技术16 中国移动数据快递技术白皮书目录 4.3高安全技术.17 4.4低时延技术 5产业发展倡议20 A参考文献 B缩略语表23 中国移动数据快递技术白皮书1背景及驱动力 1背景及驱动力 求日益增多,同时多云数据备份、数据异地上云等场景对在线数据迁移的效率提出更高要求,实现海量数据在广域网高吞吐传输成为迫切需求。 1.1产业驱动 随着数字经济的蓬勃发展,应用场景多样化和数据爆炸式增长的趋势越发明显,海量数据分析处理的需求愈发强烈。在国家“东数西算”战略推动下,数据中心作为数字经济发展的关键基础设施,正处于高速发展阶段,已逐步 形成“网络+计算”的规模扩张双引擎。为适应当前数据中心面临的巨大 变革,数据网络传输带宽也不断增加。伴随着数据中心数据量和复杂性的指数级增长,性能问题逐渐凸显,特别在高性能计算、无人驾驶、AI大模型和工业现场网等多样化泛在算力场景下,数据上云和云上处理越来越成为数据处理的主要形式。多样化泛在算力需求便得数据的生产端、处理端和便用端被此交错,数据流通量剧增,而数据传输效率将直接影响算力供给效率。 众多海量数据上云,以及用户多端、多地和多场景接入的不确定性,带来大 流量突发、时延变化范国围大和可靠性难以保障等新挑战。为此,需要采用新型的数据传输关键技术,以实现算力网络基础设施的“降本增效”,提升数据中心计算效率、为“东数西算”数据底座提供有力支撑 - 中国移动数据快递技术白皮书 1.2技术驱动 1背录及驱动力 传统的TCP/IP网络难以满足广域数据传输的性能需求,为了保障用户的服务体验,需要从端、网多技术协同改进。在广域网数据传输的场景中,用户需要传递的数据量较大,传输距离较远,且希望有较高的速率。而传统的TCP技术随着传输距离变长、丢包率的上升,有效吞吐急剧下降,而且TCP对所有的流、所有的场景一视同仁,并不会对广域网数据传输做性能优化。这种标准化的“公平”实现,也导致TCP在广域网数据传输时展现 出糟糕的性能间。广域网通常基于IP转发,而IP的统计复用和尽力而为的 设计策略,导致网络中存在着拥塞和丢包。这些都会严重影响TCP对于网络环境的感知,从而导致TCP难以充分利用网络资源,尤其是在高带宽、高时延的网络中。因此,在广域数据传输时,需要对传输层进行性能优化,在保障高可靠的同时提升吞吐,以应对海量数据的长距离传输:需要在网络 层提供更好的网络环境,以减少网络中的拥塞和丢包。此外,在广域数据传输时,也需要综合考患端侧和服务器侧的I/O能力,进行体系化的技术创新,以优化用户的使用体验;在用户接入侧考虑使能弹性带宽、动态存储,来方便用户的传输业务,以构建创新的商业模式。 中国移动数据快递技术白皮书 2典应用场景 2典型应用场景 2.1云间灾备 随着云计算产业的高速发展,云数据中心承载了企业IT的各项业务,海量增长的数据给存储、传输和保护带来新的挑战,做好应用数据灾备,是保障企业数据安全和业务连续的必要手段。以运营商话务数据灾备为例,单个IT云资源池每天的数据备份量在TB级别。主备数据中心一般是异地建设,数据传输距离较长,而且数据量较大,但对数据传输时效性要求不高,可利用网络潮汐效应在空闲时段传输。如何提高数据传输效率、降低数据传输成本,对企业降本增效、增强市场竞争力具有重要意义。 图2-1云间海量数据灾备 BEPOA (P1) SA/B/C BA/B/C 080/E/F_ SND/E/F. 2.2影视剪辑 影视综艺节目的拍摄素材需要经后期制作公司剪辑、谊染,由于拍摄地不固定,需要根据拍摄和制作周期将拍摄素材批量传输至后期制作公司所在地。 3 中国移动数据快递技术白皮书2典型应用场景 一部大型综艺或影视节目的原始素材数据量是PB级别,单次传输的数据量 在10TB~100TB量级,采用人工硬盘快递方式存在两次数据拷贝(源端上 传、目的地下载)以及人工搬运(乘坐飞机或高铁搬运磁盘阵列),每次行程需要2~3天,且需要专人操作,时效性差、效率低。如何充分利用网络能力,通过在线传输为音视频行业提供便捷的线上数据搬移服务,满足时效性的同时,减少人工投入成本,对网络提出了新的挑战。 图2-2影视综艺数据人工硬盘快递 数据上传数据下载 烤卡 人工硬盘快递 盗彩机存请卡驱盘阵列后期制作公司影视综艺拍摄地 2.3科学计算 智算和超算快速发展,中国在此领域已经达到了国际先进水平17,但智算和超算中心大数据导入、导出缺乏高效低成本方案,尤其在支撑天文、气象等科学计算场景。以FAST天文数据计算为例,FAST每年约200多个[8观测 项目,单项目产生观测数据量TB~PB量级,年产数据约15PB。如果数据导 出采用人工方式,由于缺乏专人专岗负责数据拷贝操作,数据导出申请可能 被滞后数月处理,再加上数据传输和目的地数据导入操作非常耗时,将极大 影响数据获取的时效性。面向科学计算海量数据异地迁移场景急需一种高效、经济的数据在线传输方案。 图2-3天文数据人工硬盘快递 数上传数联下载 人工碳盘快递 科学计算教据源超算或智算中心 4 中国移动数据快递技术白皮书 2.4基因测序 2典应用场景 基因测序技术日趋成熟,使得测序时间大幅缩短,应用得到全面推广,可面向科研机构、医疗服务机构或个人提供各类基因测序与数据分析服务。传统基因测序以本地实验室分析为主,时效性与规模受本地算力资源约束而难以 提升,基因测序数据上云逐渐成为行业趋势。国内某基因公司基因测序数据 量100PB/年,上云数据量是TB~100TB量级/次,基因测序数据源和超算云 数据中心之间通过固定带宽的专线连接,价格较高,缺乏更高效低成本的数 据传输方案。 图2-4基因测序数据异地上云 基因测序实验室 B端客户生物样本微始数据原始数据分析服告 C选容户一生物样本分折报警 基因测序仪存罐节点 由本地实验室分析迁移至云上分析 B客户生物样本基因测序实验室 原数据 私有云 分析报告 C选春户一生物样本公有云分折报 基因测序仪广城网 2.5家庭宽带 家庭新业务(如多维视频和云业务)的涌现,带来突发大流量、低时延和高可靠性等网络传输需求。以VR场馆和VR视频为例,终端输出1080P画质 时,内容源进入GPU资源池处理,GPU流化到用户端,单用户需要40M带宽,一台GPU服务器按60路并发,3台总共7.2G并发带宽,由于用户 接入的随机性和突发性,数据传输具有临时、突发和大流量需求的特点。为 此,如何通过高效、便捷、经济的方式将突发大流量数据从内容源传送到用 户端,充分挖掘城域网的数据管道价值,提升运营商网络效益,是数据快递要解决的核心问题之一。 中国移动数据快递技术白皮书 图2-5家庭新业务应用 2典应用场景 云魔百和业务 运营管控系统内音源 办公 培训企业内网防火洁 - 协作 BhSPN理节点 云康百和 Cinternet 用户端UPENPE PE MTOMNET 务平台 本地 娱乐家庭网路 OLTBRASCR 业务网络应用 游戏用户端 地市边缘云内客酒 分析和总结以上典型应用场景,存在以下共同特征:单次传输数据量较大:TBPB量级。 2.流动频次较多:有定期或不定期数据传输需求,峰值带宽要求高。 3. 实时性要求不高:主要是温冷数据,非强实时热数据,但传输完成时间 越快越好。 成本敏感:客户不想单独开高带宽专线,因为传输频次不定,网络利用 率和性价比不高。 对于此类数据传输场景,传统专线和人工硬盘快递都难以很好的满足用户需 求。本方案为用户提供了灵活弹性、高效经济的广域高吞吐数据传输服务。 6 中国移动数据快递技术白皮书 3“1+2+3”解决方案 3“1+2+3”解决方案 数据快递是一种高效、经济、安全、可靠的海量数据传输服务。它基于IP网络构建高弹性、高吞吐的数据传输网络,并利用弹性带宽、负载均衡、安全加密等技术,为客户提供更卓越、高效的数据传输体验,实现任务式算网 新服务。 传统的海量数据传输方案包括人工硬盘快递和专线在线传输[9][10][][12]。 1人工硬盘快递:由专人在数据源执行下载,然后通过物流快递或者专人运输,最终在数据消费端执行上传操作,过程耗时较长,操作繁,且硬盘有损坏和丢失风险。 2.专线在线传输:当用户使用低成本的小带宽专线时,大批量数据传输太慢,时效性很差,影响使用:当使用高成本的大带宽专线时,对于很多不定期批量数据传输场景,专线利用率不高,当前按月固定带宽收费模式性价比较低。因此,存在“低带宽等不起,高带宽用不起”的困局, 限制了数据迁移的效率与规模。 随若互联网技术的发展,IP网络作为连接世界的基础设施,具备了天然的弹性和高吞吐潜力,为构建高效的数据快递解决方案提供了有力支持。本百皮书充分利用IP网络的统计复用、弹性供给等优势,构建基于IP网络的高 弹性、高吞吐数据快递解决方案。 7 申国移动数据快通技术白皮书 3.11套技术架构 3“1+2+3”解决方案 数据快递解决方案实现数据源端到目的端的海量数据传输。数据源是指产生或存储大量数据的设备或系统,例如企业服务器、数据库、存储设备等。数 据源可以是分布在不同地域和网络环境的多个节点,也可以是集中在一个地 点的单个节点。数据目的端是指接收或处理大量数据的设备或系统,例如云 计算平台、智能计算中心、超级计算中心等。数据目的端可以是第三方提供的公共服务,也可以是数据快递运营商自建的云数据中心。 基于数据源端到目的端的海量传输需求,按照分层思想设计数据快递解决方 案总体架构,主要包括云专网