iew 运营商AI先进存力白皮书 汇聚产业新动能,共创AI新时代 -2023年 版权声明 本白皮书版权属于中国移动通信有限公司研究院、中国联合网络通信集团有限公司、中国人工智能产业发展联盟、华为技术有限公司和中国科学技术大学,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源:中国移动通信有限公司研究院、中国联合网络通信集团有限公司、中国人工智能产业发展联盟、华为技术有限公司和中国科学技术大学”。违反上述声明者,编者将追究其相关法律 责任。 ntyforpreview 编写委员re会view Onlyfo 顾问 陈国良、周跃峰 指导委员会 刘景磊、赫罡、魏凯、庞re鑫、v顾ie雪w军 编委 陈佳媛、闫晗、童俊杰、李诚、靳震、曹晓峰、董吴、曹峰、丁志彬、何雨今、王振、王旭东、周宇、杨小林、纪烨、韩茂、蒋海林、钟毅、蔡钊、易恩来、蓝文海、谭华、苟欣、沈荣锋、 孙睿、江军航、郭洪星、黄维恩、阮政委、孙晓艺、宋天宇、段芳成、钟昭、宋建嘉 e 主编单位 中国移动通信有限公司研究院、中国联合网络通信集团有限公司、中国人工智能产业发展联盟、华为技术有限公司、中国科学技术大学 Onlyfor 序言iew 类社会正在跑步进入通用人工智能时代。从运营商要抓住大模型的发展机遇,首先需要构建领先 AlphaGo到ChatGPT,人工智能领域的里程碑事的AI基础设施,尤其是数据存储能力,也即存力。在 件不断涌现,GPT-4首次展现极强的语义理解能力、内大模型场景中,先进数据存力尤为重要。大模型的参容生成能力和持续对话能力,这是一个新时代来临的标数和数据规模都呈指数级增长,对存储的扩展性、稳志。产业界纷纷加强大模型相关领域的研究,并推出一定性、性能、时延等都提出更高要求。比如一个训练些新产品和新应用,传统信息产业生态正在被重塑。运批次前后的数据加载和保存阶段,如果存取性能不足,营商作为ICT基础设施建设的主力军,迎来AI发展的新会导致计算资源(如CPU、GPU等)的浪费。存力是 机遇。算力价值的前提和基础,只有数据存得好、算得快、 从对内网络业务角度看,大模型将会加速运营商网络智 传得稳,整个AI基础设施才能够更好发挥算力的作用。 能化升级。首先,利用人工智能的分析、策略优化与预本白皮书重点研究了运营商如何构建AI先进存力,- 测等能力来赋能网元、网络等业务系统,有助于提升电是分析目前运营商行业AI场景的总体发展态势与应用信网络的智能规建、智能运维、智能管控能力。其次,现状,展望了运营商作为国家数字经济发展引擎的重要通过人工智能设计套餐,将人工智能嵌入用户流量管理作用。二是分析支撑大模型应用的AI基础设施存在的中,有助于提升网络运营、市场营销、客户服务的效率。挑战,分析得出AI先进存力是构建领先AI基础设施的 同时,借助大模型还可能对6G智简网络以及云网融合关键一环。随着AI与通信产业的深度融合,AI大模型 的研究提供帮助,促进6G技术迅猛发展。不仅会赋能网络的泛在智能能力,还将助力运营商推动 干行百业智能化升级。 从对外政企业务角度看,大模型也将助力运营商赋能干 行百业智能化升级。结合运营商的数据优势、算力优势、前行不缀,未来可期。通用人工智能奔涌而来,赋能行业使能经验优势,运营商将成为数字经济智能化的关数字经济的全面智能化升级。运营商引领时代潮流,键一环。一方面,将运营商的大模型能力外溢至行业客智算底座将成为干行百业创新变革的重要基石。 户,面向政务、教育、医疗等推出行业大模型新应用, 这也是当前运营商重点发力的方向。另一方面,结合运营商算力、网络等资源优势,为大模型创业者和研发机 构提供智算服务,做AI淘金时代“卖铲人” 陈国良 中国科学院院士 Only 前言iew 一大模型席卷全球的热潮中,人们已经深刻认识到通过全闪存分布式存储,实现存储节点干万级每秒读写二人工智能作为经济社会发展中一项革命性技术力次数(IOPS,Input/OutputPerSecond)和数百GB/s 量,将驱动全球产业实现巨大飞跃甚至跨越式发展,深带宽,提升训练效率;通过向量存储,实现高性能向量 刻影响未来世界的竞争格局。通信行业作为信息通信基检索能力。 础设施的建设者和运营者,既为AI的发展提供基础设 华为公司在数据存储产业上的大规模投入超过十年,提 施支撑,又将会是AI应用落地的先行者。供专业AI存储支撑大模型蓬勃发展,助力运营商引领 大模型时代,数据决定AI智能的高度。更多的训练数新时代。通过与业界专家、客户和伙伴深入交流,中国据是AI模型选代升级的前提,更高的数据质量也决定移动研究院、中国联通、人工智能产业发展联盟、华为着大模型训练的效果。国内要发展人工智能,并使这一和中国科学技术大学联合编写了本自皮书。自皮书详细产业得到高速的发展,一定要重视数据和信息的数字化阐述了AI先进存力对运营商AI先进基础设施的支撑作 记录。如今,国内建设了大量的数据中心,算力相对较多,用,建立了一套综合的评估AI先进存力的特征体系,但存力较少,很多高价值的信息都没有被记录下来。作可有效牵引对人工智能计算中心的科学规划。我相信这为数据的载体,数据存储成为AI大模型的关键基础设施。是一次非常有意义的探索,将凝聚更多的行业力量共同 推进运营商AI产业的发展。 构建AI先进存力是构建领先AI基础设施的核心条件之 一。大模型的持续创新突破,需要从数据的角度对AI凡人微光,汇聚成炬。华为愿与产业各方更加紧密携手全流程进行优化。首先,数据归集阶段要高效处理多地努力,汇聚产业力量,共创运营商AI新时代。 域、多分支收集PB级多样化的原始数据;其次,在模型训练阶段需要对海量小文件的随机读取以及模型数据集快速保存;最后,在模型推理阶段需要快速检索增量源数据和向量数据。这些挑战都需要创新的AI存储解 决方案,比如通过智能数据编织,实现跨系统、跨地域周跃峰博士 的全局统一数据视图和调度;通过近存计算,卸载部分华为公司副总裁 数据预处理能力,减少数据搬迁,缩短数据准备时间; review 图目录 review 图1数据-模型-送代全生命周期,.03 图2A/大模型全流程存储需求分析. 图3算力中心架构到存力中心架构...18 图4多业务接口的统一一存储逻辑图...19 图5传统文件系统架构向并行文件系统架构发展.21 目录 CONTENTS 01AI发展概述 01 1.1AI基本概念, 1.2AI发展阶段 1.3我国AI大模型发展现状 .01 ..02 iew .04 02运营商是助推AI强劲发展主力军 05 2.1 运营商高度重视AI发展 ..05 2.2运营商应用AI的主要方向 ..09 03运营商AI存力挑战 11 3.1AI存力是运营商发力大模型的基础, .1. 3.2运营商AI存力面临的主要挑战 eview .13 04AI先进存力发展趋势 17 4.1AI先进存力内涵, ..17 4.2AI先进存力关键技术 .18 05运营商AI先进存力产业发展建议 25 参考文献 27 AI发展概述 1.1AI基本概念 eview 工智能(Al,ArtificialIntelligence)是指通过传统分析式AI主要用于分析式应用,即对输入内容 计算机技术和算法模拟人类智能的一种技术。进行分析和判断,生成输出分析结果,如推荐系统、 它可以让计算机像人一样思考和学习,从而实现自图像识别、智能语音等。在传统的分析式AI时代, 主决策的智能化行为。AI已在计算机视觉、智能语音只能根据已有的数据进行学习和预测,无法处理新 自然语言处理等应用领域迅速发展,开始像水、电、的、未知的情况。 煤一样赋能于各个行业。AI主要分为分析式AI和生 成式Al。 01|AI发展概述 运营商AI先进存力白皮书 生成式AI主要用于内容生成,即使用AI生成新内容,如文本、图片、音频、视频等。生成式AI在学习归纳 已有数据的基础上,学习数据产生的模式,并创造数据中不存在的新样本,实现了从数据分析到内容创作的跨 越式发展,打开了AI应用新市场,已在文字创作、代码生成、图像生成等多场景实现了应用落地。 1.2AI发展阶段 人工智能科学诞生至今60多年的发展历史过当前人工智能处于第三个发展阶段,2006年加拿大日程中,人工智能经历了三次发展高潮,分别是Hinton教授提出了深度学习的概念,极大地发展了 1956到1970年代,1980到1990年代和2000年人工神经网络算法。随后以深度学习、强化学习为 代至今。1959年ArthurSamuel提出了机器学习,代表的算法研究的突破,算法模型持续优化,极大 推动人工智能进入第一个发展高潮期。此后70年代地提升了人工智能应用的准确性。这个时期的AI训 末期出现了专家系统,标志着人工智能从理论研究练数据多为文本、图片、音频等单模态数据,存储 走向实际应用。80年代到90年代随着美国和日本方式为本地盘或存储池形式的外置存储。 立项支持人工智能研究,人工智能进入第二个发展高潮期,期间人工智能相关的数学模型取得了一系列重大突破。1997年,IBM深蓝战胜了国际象棋世 界冠军GarryKasparov,是一个里程碑意义的事件。 这个时期的AI训练数据多为结构化数据,存储方式以本地盘存储形式为主。 AI发展概述|02 运营商AI先进存力白皮书 近年来深度学习发展高潮迭起,Transformer大模型景覆盖、精度限制突破、泛化能力增强和研发能力 自动化,成为了AI走向产业化应用的重要途径。另亿甚至更大,模型层数从开始的个位数逐步发展到一方面,大模型也改变了AI模型的开发方式,客户成百上干,原始数据集也达到PB级,为满足大模型无需针对单个场景再开发单独的AI模型,而是由AI对存储的性能和容量需求,外置存储进一步升级为大模型厂商开发基础的LO层模型,由行业IT供应商“性能型存储+容量型存储”。开发L1层的行业模型,应用场景IT供应商提供L2 大模型实现了更好的泛化能力和更高的性能,正在 成为AI发展的新范式。一方面,大模型实现了多场 层的细分场景模型。 基础模型LO行业模型L1细分场景模型L2 科研机构科研机构+行业伙伴科研机构+行业场景化专家 +行业知识 灵活适配违约风险 细分场景识别 3C质检 流行元素 标注 需求、数据、 舞弊动机汽车制造 识别巡检 辅助设计 经验反馈经验结构化财务异常 智慧医疗自动驾驶金融风控表示沉淀反馈检测 纺织质检 门店 半定制 沉淀行业Know-how 图1-数据-模型-选代全生命周期 03|AI发展概述 运营商AI先进存力白皮书 1.3我国AI大模型发展现状 O 2020年起,我国的大模型在数量和技术水平干问大模型参数在10万亿级以上、腾讯混元大模型 上都有明显提升,涵盖了智能语音、计算机和华为盘古大模型参数量均在万亿级以上、百度文视觉、自然语言处理等多个领域,并在能源、金融、心一言大模型参数量在2干亿级以上,上海人工智航天、制造、传媒、城市、社科以及影视等领域应能实验室书生浦语大模型参数量在干亿级别。 用落地。从大模型业界评价看,国内大模型处于百花齐放状从大模型的布局体系来看,科技大厂在算力层、框态。综合实力方面,头部科技大厂如华为、百度、阿里、架层、模型层、应用层进行了四位一体的全面布局。腾讯等在大模型研发投入、技术能力和人才团队方华为、百度均从芯片到应用进行自主研发的全面布面均有较强实力。商用推进方面,头部科技大厂均局,如华为的“昇腾芯片+昇思框架+盘古大模型依托现有业务领域进行大模型应用推广,更容易形 +行业应用”、百度的“昆仑芯+飞桨框架+文心成大模型的规模化应用。 大模型+行业应用”。垂直行业企业和科研院所, 主要以大模型算法研发和细分领域应用为主, 从大模型参数量看,科技大厂和头部科研机构已上线的大模型参数量普遍在干亿级以上,如阿里通义 AI发展概述|04 eview 2运营商是助推AI强劲发展主力军 2.1运营商高度重视AI发展 view 信运营商作为ICT基础设