数据要素化新阶段的数据基础设施白皮书 从车厘子自由到数据自由 南京邮电大学数据要素创新实验室安恒信息技术股份有限公司 2024年11月 南京邮电大学数据要素创新实验室安恒信息技术股份有限公司 2024年11月 目录 1 我国正在步入数据要素化发展新阶段 02新要素 2 全球数据生产方式正在发生深刻变化 09市场流通的数据只是冰山一角 3 从“车厘子自由”到“数据自由”:技术赋能的数据自由之路 版权声明 安恒信息、南京邮电大学数据要素创新实验室联合北京交通大学、南京邮电大学、北京京数智科技开发有限公司等机构,在全面、系统研究国家数据基础设施相关理论、政策、实践的基础上,推出我国第一份数据基础设施白皮书——《数据要素化新阶段的数据基础设施白皮书》。本白皮书的版权归南京邮电大学数据要素创新实验室、北京京数智科技开发有限公司与安恒信息共同所有。 未经授权,任何单位或个人不得以任何形式对本白皮书的全部或部分内容进行复制、传播、修改、改编、翻译、汇编或用于商业目的等侵犯版权的行为。若需在其他作品、研究、报告、演示等中引用本白皮书的内容,请务必明确标明:“摘自《数据要素化新阶段的数据基础设施白皮书》”,并确保引用内容的准确性与完整性,遵循相关的学术规范和法律法规。 对于违反本版权声明的行为,我们将保留依法追究其法律责任的权利,以维护版权所有者的合法权益以及知识成果的正当性与严肃性。 02新空间 03新设施 04新产业 07新要求 4 数据可信流通利用基础设施赋能“数据自由” 18数据流通利用基础设施 20数据可信流通利用基础设施架构:“数由”空间 32“数由空间”赋能“数据自由” 10全球公域数据即将完全耗尽 10数据生产方式正在发生巨变 5 “数据自由”释放社会与经济价值 36数由空间赋能城市数据基础设施实践 39数由空间赋能行业数据基础设施实践 42数由空间赋能企业数据基础设施实践 42数由空间赋能跨境数据基础设施实践 12全流程动态安全下的数据流通 13“物流冷链”技术发展赋能“车厘子自由” 15“数据冷链”技术发展赋能“数据自由” 6 愿景和展望 图表目录 图1数据空间正成为数据要素化新阶段的新型空间形态03 图2国家数据基础设施(NDI)总体框架…………………………………………………..…..…..…..…..…..…...………..……..……..……..………..……...…04 图3数据产业图谱(2023)…………………………………………………………………..………………..…..………..……...………..……...………..…….....05 图4数据基础设施新要求……………………………………………………………………..……………..…..………..……...………..……...………..…….…….07 图5流通数据的冰山模型……………………………………………………………………..…………..…..………..……...………..……...………..…….………09 图6公域数据即将耗尽10 图7冯.诺依曼计算架构……………………………………………………………………….…………………..………..……...………..……...………..……..….12 图8数由空间架构……………………………………………………………………………..….….….….…...………..……...………..……...………..…….…...22 图9数由器架构………………………………………………………………………………..………..……..………..……...………..……...………..…….…......23 表1数据流通利用基础设施能力类型与技术实现25 图10隐私计算技术………………………………………………………………………….....………..………....………..……...………..……...………..……...26 图11数据使用控制框架28 图12数据加密技术30 图13数据脱敏技术31 图14三数一链……………………………………………………………………….....………..………....…......………..……...………..……...………..……......34 图15城市数由空间赋能城市交通优化37 图16城市数由空间支撑金融行业发展38 图17医疗行业数由空间赋能医学模型落地40 图18公安行业数由空间赋能反诈业务41 前言 自2023年10月国家数据局正式挂牌成立以来,我国数据要素政策法规不断完善,数据资源开发利用进程提速,数据产业生态繁荣发展,数据安全保障能力持续增强。特别是今年7月28日党的二十届三中全会提出“建设和运营国家数据基础设施,促进数据共享”后,国家数据局加快研究制定《国家数据基础设施建设指引》,指导部分城市开展数据基础设施建设试点,全国各地区各部门积极开展区域数据流通利用基础设施、行业数据流通利用基础设施和企业数据流通利用基础设施建设,各科研院所和企事业单位积极开展数据流通应用技术创新实践,我国数据基础设施建设已进入发展快车道。 当前,我国经济社会正处于数据要素化发展新阶段,在生产要素、空间形态、基础设施、产业形态等方面都表现出新的特点,对数据也提出了既要大规模、高通量、快速率流通,也要保证在流通过程中动态安全的新要求,隐私计算、区块链、数据空间等新兴数据流通利用技术应运而生。国家一方面将大力支持技术创新突破,另一方面将持续推进技术广泛应用,推动这些技术基础设施化,实现既能高效流通又能确保安全的“数据自由”。 以安恒信息为代表的一大批数据企业,在数据流通利用基础设施建设和运营方式开展了有益探索。安恒信息采用隐私保护、使用控制、信任保障、互联互通、数据安全、价值发现等数据安全流通技术,自主研发的“数由器”,以及依托“数由器”打造的“数由空间”,有效地实现了“数据自由”,构建起了城市数据基础设施、行业 数据基础设施、企业数据基础设施和跨境数据基础设施等成熟应用。 安恒信息、南京邮电大学数据要素创新实验室联合北京交通大学、南京邮电大学、北京京数智科技开发有限公司等机构,在全面、系统研究国家数据基础设施相关理论、政策、实践的基础上,推出我国第一份数据基础设施白皮书——《数据要素化新阶段的数据基础设施白皮书》,以期为国家数据基础设施建设和运营理论界、政策界和实践界提供借鉴和参考。 参与《白皮书》编写的有:涂群、张茜茜、刘世峰、宫大庆、王军、范渊、刘博、陶立峰、王吾冰、聂桂兵、周亚超。 第⼀章 我国正在步入 数据要素化发展新阶段 以2019年党的十九届四中全会首次提出数据是继土地、劳动力、资本、技术以外的第五大生产要素为标志,我国经济社会正步入数据要素化发展新阶段。数据要素化发展新阶段的“新”,主要体现在新要素、新空间、新设施、新产业、新要求等五方面。 01 数据基础设施⽩⽪书数据基础设施⽩⽪ 15.1新要素 数据要素具有虚拟性、非稀缺性、原始性、易复制性、多环节性、非消耗性、非排他性、非均质性、边际效应递增性、交易不确定性、时效性、场景依赖性、“阿罗信息悖论”、价值不确定性、功能替代性、协同性、多样性、规模性、可加工性、流动性等20多个不同于传统生产要素的特点。数据作为新兴生产要素不仅对传统经济理论和信息系统理论构成了冲击,也为社会经济生产生活带来了巨大改变。 数据要素作为新兴生产要素,一方面通过参与社会生产活动,发挥自身价值潜能,提高社会生产效率,另一方面通过全方位赋能其他传统生产要素,充分发挥数据要素对其他传统生产要素的放大、叠加和倍增作用,实现数据要素的乘数效应。数据要素与劳动力相结合能提高劳动生产率;数据要素与技术相结合能加快技术迭代,促进产研融合;数据要素与资本要素结合能够降低后者的不确定性风险,加强金融服务的广度和纵深。 15.2新空间 人类社会的空间形态经历了物理空间、网络空间、计算空间和数据空间四个发展阶段。在7000多年的人类文明发展史中,全人类几乎一直生活在一个单一空间—物理空间中,人们所有的生活、工作、学习都在这个物理空间中进行。直到上世纪90年代,互联网的出现使人类第一次在物理空间之外拥有了一个新的空间—网络空间。网络空间起初的功能以连接为主,主要是将不同地区和国家的人连接起来用于传输信息。随着互联网在全球的快速普及,个人、企业、政府等不同主体逐渐将在物理空间中开展的工作、生活、学习等所有活动几乎都迁移到网络空间,个人的购物、会议、学习、办公、交友、订餐、打车、旅游等活动几乎全部在网上实现,企业的人财物产供销生产经营管理业务、政府的公共服务和社会监管等职能的数字化、网络化、智能化程度也越来越高。互联网上日益爆发性增长的各种2C、2B、2G业务对计算能力提出了越来越高的要求,这时网络空间不仅需要更强大的连接功能,而且对计算功能的要求更加强烈,网络空间也随之升级迭代为计算空间。 02 近年来,随着移动互联网、工业互联网、物联网的快速发展,我国移动电话用户总数超过17亿户,重点工业企业关键工序数控化率超过62%,楼宇道路监控、智能家居、智能汽车等物联网设施装备日益普及。这些智能设备都成为数据采集装置,每时每刻都在生产数据,快速推动从前的零散、少量、低价值数据碟变为集聚、海量、高价值的大数据,数据的生产要素价值作用日益突显。这时不仅需要更加强大的连接和算力功能,对数据更大规模、更快速率、更高通量流通利用的需求更强烈,算力空间也随之升级迭代为数据空间,而使用控制、隐私计算、区域链、数据沙箱、智能合约、数据标识、语义发现、元数据智能识别等可信安全的数据流通技术正在成为数据要素化发展新阶段的主流技术。 数据空间正在成为数据要素化新阶段的新型空间形态 图1数据空间正在成为数据要素化新阶段的新型空间形态 国家数据基础设施(NDI)纵向上从顶到底分别是国家数据流通利用基础设施、国家算力基础设施、国家网络基础设施、国家数据安全基础设施等四层架构,横向上覆盖数据采存算管用全生命周期各环节,包括数据采集平台、数据汇聚平台、数据加工平台、数据共享平台、数据开放平台、数据运营平台、数据交易平台和数据存储平台等。国家数据基础设施(NDI)在基础设施形态、数据全生命周期、行业和区域空间三个维度相互融合、相互支撑,形成支持数据全生命周期不同环节、不同行业、不同区域数据要素化的统分结合架构。 物理空间 物理空间由大型机器设备,交通,通讯设施工程等组成 网络空间 网络空间由光线,卫星,无线网络,交换机,路由器,基站,TCO/IP协议,IPV6等组成 计算空间 计算空间,由计算芯片,存储器,服务器等组成 数据空间 数据空间由数据安全流通平台,各种协议,标准等组成 释意: 图2国家数据基础设施(NDI)总体框架 15.3新设施 国家数据基础设施是数据要素化发展新阶段最重要的基础设施,是指从数据要素价值释放的角度出发,在网络、算力等设施的支持下,面向社会提供一体化数据汇聚、 处理、流通、应用、运营、安全保障服务的一类新型基础设施,是覆盖硬件、软件、标准规范、机制设计等在内的有机整体。 国家数据基础设施:从数据要素价值释放的角度出发,面向社会提供数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的一类新型基础设施,是集成硬件、软件、模型算法、标准规范、机制设计等在内的有机整体。 04 数据流通利用设施:国家数据基础设施的重要组成部分,为跨层级、跨地域、跨系统、跨部门、跨业务数据流通利用提供安全可信环境,包括可信数据空间、数场、数据元件、数联网、区块链网络、隐私保护计算平台等技术设施。 03 15.4新产业 数据产业是数据要素化发展新阶段的主要产业形态,是指利用现代信息技术对数据资源进行产品或服务开发,并推动其流通应用所形成的新兴产业,包括数据采集汇聚、计算存储、流通交易、开发利用、安全治理和数据基础设施建设等。 从构成要素来看,数据产业包括数据资源、数据技术、数据产品、数据企业和数据生态等五种要素。从产业主体来看,数据产