数据要素与先进存储融合发展研究报告 中国信息通信研究院产业与规划研究所 2024年9月 版权声明 本报告版权属于中国信息通信研究院,并受法律保护。 转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。 前言 数据作为新型生产要素,是基础性和战略性资源,也是发展新质生产力的重要基础。世界各国高度重视数据价值释放,争相抢占数据资源新高地,塑造国家竞争新优势。我国率先将数据列入生产要素,率先构建数据交易场所,率先开展数据资产入表,引领全球数据要素市场发展潮流。 新技术、新模式、新基建带来数据要素领域的新发展。以人工智能为代表的新技术加快数据要素价值释放。随着人工智能大模型的到来,冷数据逐渐变热,也产生了更多热数据。大模型训练数据源深度持续拓展,数据存储周期显著加长。人工智能大模型对高质量数据集也提出了新要求,数据集的质量影响人工智能的智商,人工智能大模型的训练和推理越来越依赖高质量数据集的提供和先进存储的支撑。 数据资产化带来“数据信贷”“数据信托”等数据要素价值化新模式的探索,为数据要素价值释放创造了基础条件。数据要素促进金融市场发展,数据抵押贷款、数据信托等金融产品反过来又拓展了数据要素的应用场景。数据资产流通交易也带来了数据副本量的快速增加。数据已成为数字经济时代最重要的资产之一。正如金融资产存在银行保险箱里一样,数据资产也需要有安全可靠的保险库。先进存储设施正是存储数据资产的保险库,是存储数据资产的最重要的基础设施,为数据的资产化、产权化提供坚强保障。 数据基础设施是典型的新基建,与数据要素如影随形、相生相伴、相辅相成,但二者也是矛和盾的关系。数据基础设施是数据“供得出、流得动、用得好、保安全”的关键载体。数据基础设施的建设为数据的全生命周期管理构筑了坚实支撑。存储设施与网络、算力、数据采集、数据流通、数据安全等设施共同构成数据基础设施的“六个底座”, 是“六位一体”的关系。特别是,数据和存储设施的关系就像水和瓶子一样,随着水流量的大规模增加,需要更大容量的瓶子,且这个瓶子不能存在瓶颈。“瓶能装水亦能覆水”,“覆水难收”,瓶子要坚固。同时,也要尽可能实现节能环保。反之,随着瓶子容量、质量的提高,会带动更大规模水流量的产生,对瓶子的要求又进一步提高。如此往复,呈螺旋上升之势。 为进一步促进数据要素领域发展,应建设高质量数据集,强化新型人工智能存储创新与应用;分步推动数据资产入表,优化数据资产评估体系;加快建设先进存储设施,优化我国数据基础设施建设布局,将数据基础设施打造成促进数据要素发展的坚强底座。 一、数据要素发展势头强劲,成为经济社会新动能1 (一)我国数据要素领域面临重大发展机遇1 (二)我国数据存储领域呈现快速发展态势3 (三)新技术新模式新基建促进数据要素新发展5 二、数据要素与人工智能相互促进,先进存储奠定坚实基础7 (一)人工智能加速数据要素升温,冷数据向温热数据转变7 (二)人工智能提升数据存储价值,数据保存周期显著加长8 (三)高质量数据集助力人工智能,先进存储加速数据归集9 (四)人工智能对存储提出高要求,新型人工智能存储取得突破10 三、数据资产化推动数据要素价值释放,先进存储成为数据资产保险库11 (一)数据资产评估入表和产权登记取得重要突破12 (二)数据资产流通交易带来数据副本量快速增加15 (三)先进存储为数据资产提供安全可靠的保险库16 四、先进存储设施是数据基础设施的关键一环17 (一)数据基础设施是关键性载体,存储是“六个底座”之一17 (二)数据基础设施建设提速提质,先进存储占比不断提升19 (三)存力中心建设成为典型模式,各地建设取得重要成效22 五、发展建议24 (一)推进高质量数据集建设,强化新型人工智能存储创新应用24 (二)完善数据资产评估体系,增加数据资产的存储安全性评估24 (三)加快建设先进存储设施,优化我国数据基础设施建设布局25 图1数据使用范围与对应的数据副本量增加情况16 图2数据基础设施组成部分19 图32019年-2023年我国数据中心机架数21 图42021年-2025年我国存储总量及先进存储占比22 党的十九届四中全会将数据列入生产要素,提出“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”。这是全球范围内首次将“数据”明确作为生产要素,是巨大的理论创新,具有里程碑意义。数据作为新型生产要素,与各类新技术、新模式、新基建紧密相关、相辅相成。特别是,数据要素与数据基础设施相互依存、相互促进。其中,作为数据基础设施重要组成部分,先进存储设施代表存储领域未来发展方向,具有大容量、高效率、高可靠和绿色低碳等特点。先进存储具有的这些优势为数据要素发展奠定了坚实基础。所谓先进存储是指应用全闪存阵列、SSD等先进存储部件,采用存算分离、高密等先进技术,单位容量数据操作能力达到万IOPS(每秒读写次数)以上的存储模块1。 一、数据要素发展势头强劲,成为经济社会新动能 (一)我国数据要素领域面临重大发展机遇 各国积极推动数据价值释放,数据成为国家基础性战略性资源。当前,全球数据量井喷式增长,数据已融入生产生活各方面,深刻影响并重构着经济社会运行和社会治理,成为影响国家未来发展的关键资源。据IDC预测,2024年全球将生成159.2ZB数据,2028年将增加一倍以上,达到384.6ZB,复合增长率为24.4%。全球各国很早就认识到数据的战略地位。美国最先发布《大数据研究和发展倡议》,引发全球大数据发展浪潮,并以“政府引导、企业参与、市场运作”的模式为主,投入大量资金用于数据基础设施建设。欧盟率先发布数据战略,并于2022年4月通过《数据治理法案》,作为落实战略的具体举措。为充分发挥海量数据对经济发展的促进作用,提高数据应用 1来源:《工业和信息化部等六部门关于印发<算力基础设施高质量发展行动计划>的通知》 水平,释放数据要素价值,各国围绕推进数据基础设施建设、构建数据可信流通环境、完善数据法律法规、加强数据领域国际合作等方面,全方位加快布局建设,争相抢占数据资源新高地,塑造国家竞争新优势。 我国数据要素政策持续出台,数据基础制度体系不断完善。我国高度重视数据领域高质量发展,出台了一系列推动数据要素体系化建设的政策文件,为推动数据要素价值释放提供了指引。2022年12月,党中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”),系统性布局数据基础制度体系的“四梁八柱”,绘制数据要素发展的长远蓝图。为贯彻落实“数据二十条”,国家数据局等十七个部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,提出数据要素发展总体目标和十二项重点行动,推动数据要素发挥乘数效应,赋能经济社会发展。财政部出台 《关于加强数据资产管理的指导意见》,明确了依法合规管理数据资产、明晰数据资产权责关系、完善数据资产相关标准、加强数据资产使用管理、稳妥推动数据资产开发利用、健全数据资产价值评估体系等12个方面的主要任务。我国数据基础制度体系加快推进建设,统筹管理、协调发展的体制机制进一步完善。 各地区数据管理机构纷纷设立,数据工作体系初步形成。为深入贯彻党中央和国务院关于数据工作的决策部署,2023年10月,国家数据局正式挂牌成立,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。从地方层面看,近些年来,31个省(区、市)和新疆生产建设兵团陆续完成数据管理机构的组建工作,初步形成了上下联动、横向协同的全国数据工作体系。数据管理体制机制的建设加快推动了 数据基础制度构建,是抓抢数字经济发展先机、打造经济发展新动能的重要举措。 各行业持续推动数字化转型,数据要素乘数效应加速显现。数据要素领域建设的核心目标是深化数据融合应用,推动数据要素进一步赋能,强化数据在提高生产效率与资源配置效率方面的作用,培育新质生产力。2024年,国家数据局联合多部门先后发布两批共48个“数据要素×”典型案例,推动发挥数据在解决行业发展难题、促进行业效益提升等方面的重要作用,释放数据要素价值。目前,数据要素已在各行业开展了众多应用,如金融行业基于企业用电数据,经过脱敏、深度分析,掌握企业用电行为、用电缴费、用电水平、用电趋势等特征内容,为银行在信贷反欺诈、辅助授信、贷后预警等方面提供决策参考。数据要素已经成为赋能各行业数字化转型和智能化升级的重要基础。通过测算数据开发对经济增长的贡献度,可以看出,2022年第一、二、三产中数据对经济贡献度分别为0.32%、0.65%、1.69%,较2021年分别增长0.25%、0.49%、0.62%2,数据对经济增长的驱动效应逐步体现并加强。 (二)我国数据存储领域呈现快速发展态势 伴随人工智能、大数据等技术的高速发展,数据量呈指数级增长,海量数据对存储提出了更高的要求。我国加快发展存储产业,特别是先进存储技术成为重要发展方向,各地纷纷加快部署先进存储设施以提升数据存储和处理能力。 从存储政策方面看,我国各级政府积极制定出台产业发展政策。国家层面,工业和信息化部等6部门于2023年联合印发的《算力基 2数据来源:2024年中国信通院数字经济与工业经济领域深度观察 础设施高质量发展行动计划》提出,到2025年,存储总量超过1800EB,先进存储容量占比达到30%以上。截至2023年底,我国存力规模达到约1.2ZB3,其中,先进存储容量占比超过25%。未来,我国存储容量将继续快速增长。2023年12月,国家发展改革委等部门发布的《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》提出,加快全闪存储等先进技术部署应用,推动西部地区承接全国范围的存储备份、离线分析等业务。地方层面,深圳市工业和信息化局发布《深圳市算力基础设施高质量发展行动计划(2024-2025)》,提出大力发展先进存储技术,并鼓励存算并举,规划建设与计算相匹配的存储体系。《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)》提出,以“先进介质、高效架构、兼容生态、安全可信”为支撑,在智算中心内加快部署下一代先进存储技术。山东、广西、宁夏、湖南等地也提出了先进存储建设目标,以提升数据存储和处理能力,满足日益增长的存储和处理需求。 从存储产业方面看,我国存储产业规模较大。存储产业上游包含存储芯片与元器件,例如NANDFlash(SSD颗粒)、DRAM(动态随机存取存储器)等,中游包含存储整机和存储系统,下游是应用与服务。据IDC、Gartner等第三方机构预测,到2025年,我国存储产业规模将超万亿元,上游产业链超过2600亿元,中下游超过8000亿元。我国存储产业规模庞大,具有广阔的发展空间。 从存储技术方面看,我国数据存储介质研发、存储整机及系统产业领域已达到较高水平。存储介质领域,我国的NANDFlash和DRAM芯片已跻身全球主流水平。存储整机领域,国内存储厂商百花齐放,在全闪存储、分布式存储、备份存储、存储内生安全、统一文件系统、 3数据来源:数字中国发展报告(2023年) 数据编织、数据湖等存储技术领域已经具备国际竞争力。未来,存储技术将继续向“大容量、高性能、高效架构、安全可靠、绿色低碳”方向发展。 当然,我国存储领域也面临发展难题。主要包括新型人工智能存储技术研发有待进一步加强、存储与其他数据基础设施协同不够、先进存储设施建设步伐较慢等问题。例如,根据IDC数据,当前美国先进闪存在存储市场中的占比为53%,相比之下,我国的同类产品占比为18.2%,是全球平均水平的一半。因此,应发挥政策引导作用,加快我国存储产业发展,为网络强国、数据强国建设提供强有力支撑。 (三)新技术新模式新基建促进数据要素新发展 数据要素与行业新技术(以人工智能为代表)、新模式(以数据资产抵押贷款