No.202225 大数据白皮书 (2022年) 中国信息通信研究院2023年1月 版权声明 本白皮书版权属于中国信息通信研究院,并受法律保 护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。 前言 中央全面深化改革委员会第二十六次会议指出,数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。大数据是数据的集合,是围绕数据形成的一套技术体系,并衍生出了丰富的产业生态,成为释放数据价值的重要引擎。 近一年来,从宏观看,各国通过政策、法案、设立机构等方式,持续推进自身大数据战略,我国党中央、国务院围绕数据要素市场建设、数据要素价值释放密集提出一系列重要论断、作出一系列战略部署,进一步增强了我国大数据发展动能。从微观看,数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域均伴随相关政策、技术、产业、应用的不断演进,发展目标进一步明确和丰富,发展成效不断显现。 本白皮书是中国信通院自2014年以来第七次发布的大数据白皮书。本白皮书聚焦过去一年来大数据领域不断涌现的新技术、新模式、新业态,分析总结全球和我国大数据发展的总体态势,并重点针对数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域,逐一分析、探讨其发展现状、特征、问题和趋势,最后对我国大数据未来发展进行展望与研判。希望本白皮书为社会各界深入了解大数据领域提供有价值的参考。 一、大数据发展总体态势1 (一)各国深化推进自身大数据战略1 (二)我国大数据发展态势好动力足2 (三)五大核心领域发展方向进一步明确5 二、数据存储与计算:通过深度优化实现提质增效7 (一)数据存储与计算发展历久弥新8 (二)当前数据存储与计算发展呈现三大特点10 (三)数据存储与计算面临的主要挑战与发展趋势13 三、数据管理:在政策引领下规模化落地15 (一)政策驱动行业实践日益成熟16 (二)当前数据管理发展呈现四大特点18 (三)数据管理面临的主要挑战与发展趋势21 四、数据流通:流通规范体系加速构建23 (一)数据流通发展重心向“规范化”转移23 (二)当前数据流通发展呈现四大特点24 (三)数据流通面临的主要挑战与发展趋势28 五、数据应用:积极探索数据深层价值的释放路径30 (一)数据应用开始探索第三阶段实践路径31 (二)当前数据应用发展呈现三大特点33 (三)数据应用面临的主要挑战与发展趋势36 六、数据安全:强需求牵引产业生态飞速发展38 (一)数据安全发展基础不断夯实38 (二)当前数据安全发展呈现三大特点40 (三)数据安全面临的主要挑战与发展趋势44 七、总结与展望46 参考文献48 图1大数据产业五大核心领域6 图2数据存储与计算领域技术发展历程9 图32020-2022年DCMM参评企业数量增速17 图4数据管理组织架构示意图19 图5数据应用向基层渗透35 图6数据分类分级“七步走”方法论图示43 表目录 表1近一年内国家层面推动大数据产业的代表性政策4 表2五大核心领域发展现状和新形势下的发展方向7 表32022年数据流通规则建设相关政策清单25 表4数据应用三个阶段31 表5典型数据应用方法论汇总32 表6多个行业的企业数字化运营成熟度情况34 表7近几年数据分类分级相关规范43 一、大数据发展总体态势 2022年,全球大数据技术产业与应用创新不断迈向新高度。宏观看,国际方面,美欧、韩日、澳洲通过政策、法案、设立机构等形式,持续深化实施自身大数据战略。国内方面,党中央、国务院再次做出一系列重要部署,我国大数据领域良好的发展态势进一步巩固。微观看,数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域发展成效不断显现。本章将对国内外大数据领域的最新进展进行总体叙述。 (一)各国深化推进自身大数据战略 近一年来,美欧、韩日、澳洲通过政策、法案、设立机构等形式,持续深化推进自身大数据战略。 美欧发布法案,确保数据价值在隐私保护的前提下释放。美国众议院和参议院于2022年6月发布了《美国数据隐私和保护法案》讨论稿,该法案在制度设计上既考虑了增强个人数据权利的国际趋势,又包含数据价值释放的内容。法案并未禁止一般个人数据处理活动,而是为个人提供了“选择退出”方式,以促进对个人数据的合理利用。欧洲议会于2022年4月就欧盟《数据治理法案》进行最终投票表决,并获得议会批准。该法案是落实《欧洲数据战略》的重要举措,构建了三个适用于各个行业的数据共享机制,确保在符合欧洲公共利益和数据提供者合法权益的条件下,实现数据更广泛的国际共享。法案构建了适用于所有部门的数据使用权基本规则,将促进个人和企业自愿 共享数据,并统一某些公共部门数据的使用条件。 韩日设置专门机构,推进各行业数字化转型。韩国在2022年4月成立了以国务总理作为委员长的“国家数据政策委员会”,作为国家数据和新产业政策的管理机构,并于9月召开了韩国国家数据政策委员会的第一次会议,发表了对8个数据领域、5个新产业领域、共计13个领域的改善计划,目标是在韩国打造全球顶级水平的数字力量。2021年9月,日本政府成立数字厅,成为负责日本行政数字化的最高部门,旨在构建更完善的数字政府,推动数字化转型,目标为“用智能手机在60秒内完成所有行政程序”,最大程度利用数字技术优势,将数字科技作为全新要素融入传统社会,促进经济社会形态积极转型。 澳洲发布国家数据安全战略,开始构建国家数据安全框架。2022年4月,澳大利亚内政部颁布《国家数据安全行动计划》,其为澳大利亚首个国家数据安全行动计划,意味着澳大利亚的国家数据安全框架正式开始构建。《行动计划》致力于建立一个全国性的方法来保护公民数据,保护公民的数据(收集、处理和存储在数字系统和网络上的信息)免受侵害,同时为政府、企业和个人构建数据安全要求。 (二)我国大数据发展态势好动力足 我国大数据经过多年高速发展,不断取得重要突破,呈现良好发展态势。一是产业规模高速增长,2021年,我国大数据产业规模增加到1.3万亿元,复合增长率超过30%1;二是创新能力不断增强,2021 1国家互联网信息办公室《数字中国发展报告(2021年)》,2022年7月 年我国发表大数据领域论文量占全球31%2,大数据相关专利受理总数占全球超50%,均位居第一3;三是生态体系持续优化,2021年我国大数据市场主体总量超18万家4,一批大数据龙头企业快速崛起,初步形成了大企业引领、中小企业协同、创新企业不断涌现的发展格局;四是市场前景广受认可,我国大数据领域投融资金额多年来总体呈现上升趋势,2021年大数据相关企业获投总金额超过800亿元5,再创历史新高。 近一年,我国在政策、人才、资金等方面持续加码,为大数据后续发展注入强劲动力。 政策方面,中央、地方发布一系列支持文件,对大数据产业、数字技术、数据要素市场、数据安全等方面进行了重点部署。中央层面,2021年底,《“十四五”大数据产业发展规划》的出台明确了未来五年大数据产业发展工作的行动纲领。2022年,党中央、国务院先后通过《要素市场化配置综合改革试点总体方案》、《关于加快建设全国统一大市场的意见》、《关于构建数据基础制度更好发挥数据要素作用的意见》等文件,多次强调了释放数据要素价值对于我国发展的必要性、紧迫性,为我国大数据发展提供了良好的政策环境和明确的发展目标。地方层面,31个省(区、市)均通过发布大数据专题规划、数字经济总体规划等形式,明确了各地大数据技术、产业、应用的发展路线图、时间表,凸显出各地在大数据布局方面的积极性。 2中国信通院根据WebofScience数据库收录的SCI论文数据统计得到。 3中国信通院根据Inspiro知识产权数据库的数据统计得到。 4中国信通院根据企查查相关数据统计得到。 5中国信通院根据公开监测、获取到的企业信息,结合企业介绍、主营业务及服务介绍及相关其他信息,进行筛选和分类得到。 表1近一年内国家层面推动大数据产业的代表性政策 时间 文件 内容 2021.11 工信部《“十四五”大数据产业发展规划》 提出“到2025年底,大数据产业测算规模突破3万亿元”的增长目标,以及数据要素价值体系、现代化大数据产业体系建设等新目标 2022.1 国务院 《要素市场化配置综合改革试点总体方案》 提出拓展规范化数据开发利用场景,发挥领军企业和行业组织作用,推动人工智能、区块链、车联网、物联网等领域数据采集标准化。加强数据安全保护,强化网络安全等级保护要求,推动完善数据分级分类安全保护制 度,运用技术手段构建数据安全风险防控体系。 2022.4 中共中央国务院 《关于加快建设全国统一大市场的意见》 提出加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动 数据资源开发利用。 2022.12 中央全面深化改革委员会第二十六次会议,审议通过《关于构建数据基础制度更好发挥数据要素作用 的意见》 习近平总书记强调“数据基础制度建设事关国家发展和安全大局,要维护国家数据安全,保护个人信息和商业秘密,促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系” 来源:中国信息通信研究院 人才方面,过半“双一流”高校设立大数据相关专业,多省份积极开展人才培育专项行动,人才供给能力显著增强。高校教育方面,147所“双一流”高校中有87所已开设了大数据专业,占比达到59%6,根据上海软科统计,大数据专业热度已经超过软件工程等传统热门专业。各省积极开展大数据人才培育专项行动,例如广东实施“十万”产业数字化符合性人才培训行动,上海要求各级党校(行政学院)要增加大数据与城市数字化转型的培训内容,浙江围绕数字人才制定“高精尖缺”人才目录,江苏搭建“智改数转”人才智库平台,福建明确要求县级以上地方人民政府制订大数据人才发展计划。 6中国信通院根据教育部《普通高等学校本科专业备案和审批结果》进行统计获得 资金方面,多省份通过设立专项资金或采取税收优惠政策等方式,对大数据企业、应用进行定向扶持和培育。例如,宁夏对于区内符合标准的优质大数据企业给予最高300万的资金支持,山东、黑龙江等省份要求省内县级以上人民政府每年需统筹安排资金专项扶持大数据相关企业,浙江、广东、重庆等推出一系列围绕大数据企业的税收减免政策,江苏省每年在省级财政安排12亿元专项资金支持工业企业“智改数转”,贵州、辽宁、河北、云南等省份对建设成果显著的大数据应用项目补贴1000-3000万。 (三)五大核心领域发展方向进一步明确 经过多年技术和产业的发展,大数据领域内部逐渐细化,形成数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域。如图1所示,数据源通过数据存储与计算实现压缩存储和初步加工,通过数据管理提升质量,通过数据流通配置给其它相关主体,通过数据应用直接释放价值,并由数据安全技术进行全过程的安全保障。 这五大核心领域由于发展起步时间不同、应用需求紧迫程度不同等原因,发展模式存在差异。在当前数据成为生产要素并快速融入生产、分配、流通、消费等各环节的新形势下,大数据五大核心领域的发展方向均进一步明确。 图1大数据产业五大核心领域 来源:中国信息通信研究院 数据存储与计算领域:实现海量数据的高效存储与计算。本领域发展时间长,在数据规模增长、形态变化等新需求持续推动下,逐步演化出数据库、大数据平台、实时计算等成熟技术框架。当前,数据存储与计算领域已经能够支撑PB级海量数据的高效存储和准实时计算,发展方向聚焦为在持续提升能力基础上,通过精细化运营和技术升级实现“降本提质”。 数据管理领域:实现数据质量提升、管理高效。本领域属于投入周期