1 001 引言 ■数林概貌 ■数林指数 ■评估方法 附录 004 011 015 024 001 本报告为国家社科基金重大项目“面向数字化发展的公共数据开放利用体系与能力建设研究”(批准号:21&ZD337)的阶段性成果之一。 本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范: 复旦大学数字与移动治理实验室.中国地方政府数据开放报告——省域指数(2022年度)[R/OL].(2023-01-10)[引用日期,格式为YYYY-MM-DD].http://ifopendata.fudan.edu.cn/report 002 引言 引言 “中国开放数林指数”是我国首个专注于评估政府数据开放水平的专业指数,由复旦大学数字与移动治理实验室制作出品。开放数据,蔚然成林,“开放数林”意喻我国政府数据开放利用的生态体系,一棵棵地方开放“数木”由最初的丛然并生、成荫如盖,直至枝繁叶茂、花开结果,终将成长为一片繁盛多样、枝杈相连、持续循环的中国“开放数林”。 “中国开放数林指数”自2017年首次发布以来,定期对我国地方政府数据开放水平进行综合评价,精心测量各地“开放数木”的繁茂程度和果实价值,助推我国政府数据开放生态体系的建设与发展。2018年以来,“中国开放数林指数”为国家互联网信息办公室信息化发展局监测我国公共信息资源开放情况提供数据支持。 开放数林指数将省作为一个“区域”,而不仅仅是一个“层级”来进行评测,并发布《中国地方政府数据开放报告——省域指数》(以下简称《报告》)。 2017 2018 2019 2020 2021 2022 数林概貌 一、数林概貌 截至2022年10月,我国已有208个省级和城市的地方政府上线了政府数据开放平台,其中省级平台21个(含省和自治区,不包括直辖市和港澳台),城市平台187个(含直辖市、副省级与地级行政区)。与2021年下半年相比,新增15个地方平台,其中包含1个省级平台和14个城市平台,平台总数增长约8%。自2017年起全国地级及以上政府数据开放平台数量持续增长,从2017年报告首次发布时的20个到2022下半年的208个,如图1所示。 ■图1历年地级及以上平台数量增长情况 目前,我国74.07%的省级(不含直辖市)政府已上线了政府数据开 放平台,自2015年浙江省上线了我国第一个省级(不含直辖市)平台以来, 省级平台数量逐年增长,目前已达到21个,如图2所示。 ■图2历年省级(不含直辖市)平台上线情况 截至2022年10月,全国各地上线的省级(不含直辖市)政府数据开 放平台的地区分布如图3所示,颜色越深,代表平台上线时间越早,整体上呈现出从东南部地区向中西部、东北部地区不断延伸扩散的趋势。 ■图3各省级(不含直辖市)平台上线时间的地理空间分布 自中国开放数林指数2017年首次发布以来的六年中,全国各地的政府 数据开放平台已蔚然成林。图4为2017年到2022年期间,省级地方(不含直辖市)政府数据开放平台区域分布的变化情况。 ■图42017-2022年省级(不含直辖市)平台分布 截至2022年10月,全国各省域政府数据开放平台的整体上线情况如图5所示,平台包括省(自治区)本级和省内下辖地市,图中颜色越深,代表该省域政府数据开放平台的整体上线程度越高。目前,广东省、广西壮族自治区、江苏省、江西省、山东省、四川省与浙江省的省(自治区)本级和下辖所有地市都已上线了数据开放平台(图中显示为全境深绿色的省域)。 同时,福建省、甘肃省、海南省、河北省、河南省、辽宁省和宁夏回族自治区已上线了省(自治区)本级平台,但省内多数地市尚未上线平台;黑龙江省、内蒙古自治区、山西省和西藏自治区内有少部分下辖地市上线了数据开放平台,但省(自治区)本级平台尚未上线。目前,陕西省和青海省上线了省本级平台,但省域内所有地市尚未上线数据开放平台,吉林省和云南省的省本级和下辖绝大多数地市均未上线数据开放平台。从整体上看,东南沿海和中部地区的政府数据开放平台已经基本相连成片。 ■图5各省域平台整体上线情况地理空间分布 数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数)后得出的数量,体现的是平台上开放的可下载数据集的数据量和颗粒度。图6列出了省域数据容量排在前十的地方,并反映了省域有效数据集总数、省域数据容量和单个数据集平均容量之间的关系。与数据集数量相比,数据容量更能体现一个省域的数据开放总量,单个数据集平均容量更能反映一个省域开放数据集的平均水平。从图中可见,山东省的有效数据集总数与数据容量在全国居于首位,浙江省开放的数据集在单个数据集平均容量上全国最高。 ■图6省域数据容量(前十名)、有效数据集总数与单个数据集平均容量比较 010 数林指数 二、数林指数 2022年度全国省域开放数林的指数分值、排名和等级如表1所示。山东省和浙江省的综合表现最优,进入第一等级“五棵树”。贵州省也总体表现优秀,进入第二等级“四棵树”。其次是四川省、广西壮族自治区、广东省、福建省、海南省、江苏省、辽宁省等地。在四个单项维度上,山东省在利用层排名第一,浙江省在准备度和数据层排名第一,贵州省在平台层排名第一。 ■表1中国开放数林指数省域综合排名 省域开放数林指数空间分布如图7所示,颜色越深代表综合指数分值越高。指数分值较高的地方主要集中在我国东南部的山东省、浙江省、广东省以及西部的贵州省、四川省和广西壮族自治区,成为省域优质“数木”。 ■图7省域开放数林指数空间分布 “数林匹克”指数 数据开放是一场马拉松,而不是速滑赛,不在于一个地方是否跑得早、跑得急,而在于这个地方能否跑得长、跑得久,能持续稳定地向社会提供优质数据,并坚持不懈地推动政府数据的开放利用。报告继续通过“数林匹克”四年累计分值,反映一个地方在过去四年(2019年-2022年)开放数据的持续水平。 省域“数林匹克”指数由2019年到2022年这四年该省域的全年开放 数林综合指数的分值累加而成。表2为2019-2022省域“数林匹克”累计分值排在前十名的地方,浙江省分值最高,其次是山东省、贵州省和广东省。 ■表2省域“数林匹克”累计分值(前十名) 014 评估方法 三、评估方法 3.1评估指标体系 开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与,组成“中国开放数林指数”评估专家委员会,以体现跨界、多学科、第三方的专业视角。专家委员会基于数据开放的基本理念和原则,立足我国政府数据开放的政策要求与地方实践,借鉴国际数据开放评估经验,构建起一个系统、专业、可操作的地方政府数据开放评估指标体系,并每年根据最新发展态势和重点难点问题进行动态调整。 “中国开放数林指数”发布以来的六年,社会各界对公共数据的需求日益增长,我国各级各地政府对数据开放工作的重视程度和推进力度也不断提升,全国各地政府数据开放平台数量显著增加,数据开放数量与容量也已初具规模,数据开放已成为数字政府建设的重要组成部分,“开放数据,蔚然成林”的愿景正在逐步实现。 然而,我国政府数据开放工作目前仍存在不充分、不协同、不平衡、不可持续等问题和挑战,因此,2022年开放数林指标体系重点围绕协同联动、普惠包容、精准务实、安全保护、持续长效等基本理念和方向,对数据开放的准备度、平台层、数据层和利用层四个维度开展评估,以促进公共数据开放利用的持续推进与价值释放。具体的指标调整方向主要包括以下五个方面: 枝杈相连 独木不成林,只有让“数木”们既能因地制宜,百数齐放,又能枝杈相连,根系相通,才能成长为一片繁盛多姿的数林。因此,2022开放数林指数特别关注各地数据开放工作的整体性和协同性,包括省域内城市平台的上线比例、省市平台间的互联互通、跨地区平台间的协同联动、开放数据法规政策体系的完备程度、不同层级间标准规范的贯彻呼应、同类数据集在数据项上的一致性,以及数据利用促进活动的省市协同与跨省联动等方面。 万木争荣 数据开放的目标不是锦上添花,而是雪中送炭,以降低各类市场和社会主体获取数据的门槛,使相对弱势的组织和个体也能平等获得和利用公共数据,共享公共数据开放的红利,营造万木争荣、普惠包容的公共数据开放生态,促进公共数据资源的“共同富裕”。 因此,2022开放数林指数重点关注数据开放的无歧视原则,评测各地在开放数据的过程中是否能平等对待中小企业和社会组织等各类利用主体,各类社会主体是否对开放的政府数据进行了有效利用并形成了多样化的利用成果。同时,由于数据开放的价值不仅体现在经济增长上,也体现在社会发展上,开放数林指数还将特别关注能使老人、妇女、儿童、残疾人等相对弱势群体收益的公共数据的开放利用情况,以促进数字社会的包容性发展。此外,在开放主体和开放数据范围上,2022开放数林指数鼓励政府部门之外的社会主体,特别是国有企事业单位开放具有公共价值的数据,共同参与公共数据供给。 精耕细作 开放数林的繁茂离不开精耕细作与精准滴灌。根据十四五规划等国家政策文件的要求,2022开放数林指数将评测对象聚焦于企业注册登记、交通、气象、卫生四个重点领域的关键数据集,对其质量和规范进行更为深入细致的评估,以强化优质供给,激活数据价值。具体而言,在数据质量方面新增了对数据可理解性的评测,在数据规范方面,提高了对数据集描述说明的真实性和丰富性的要求,新增了对数据字典的测评,并将针对以上四个重点领域,评测利用开放数据所开发的服务应用与创新方案的质量和成效。 同时,2022开放数林指数在法规政策和标准规范上,聚焦于对实际工作能起到关键推动作用的制度安排和具体要求,关注政策法规中对数据开放工作设立专人专岗和专项财政预算、平台互动回复时限等方面的要求,鼓励在年度工作计划中明确列出当年计划开放的数据集名称和字段。在平台建设和运营上,提高对实用性功能的要求,在评估方法上引入了“体验官”,以加强对用户真实感受和体验的评测。 遮阳挡雨 枝繁叶茂的树冠像一把绿伞,在繁荣生长的同时也遮挡了直射的阳光,保护树林中的动物不被灼伤。开放数林也要撑起一把数据的保护伞,平衡好开放利用和安全保护之间的关系,尽可能开放该开放的数据,严格管住该管住的数据,把安全贯穿数据开放和利用的全过程,避免数据“伤人”,使数林始终舒适“宜人”。 因此,2022开放数林指数尤为关注数据开放利用全过程的安全管理,并对平台方与用户行为的规范、数据开放利用所涉及到的个人和组织的合法权益的保护、用户被平台采集的个人数据的知情权保障等方面也设置了相应的指标。 生生不息 植数造林非一日之功,数据开放是一项长期性、持续性的工作,需要不断夯实根基,剪枝修数,培土浇水。2022开放数林指数通过存量与增量相结合的方式考察一个地方的数据开放准备度,不仅评测相对稳定的法规政策,也将评估各地每年最新制定的工作计划与方案、数字政府建设方案、政府工作报告。 同时,2022开放数林指数注重对平台运营的稳定性和开放数据目录的及时更新的评测,关注数据容量的动态提升,强调互动回复的时效性,关注开放数据利用成果对于数字经济、数字社会和数字政府建设三个方面的赋能价值,使数据开放既有产出,更有成效,形成可持续的、生生不息的价值创造闭环。 鉴于以上理念和愿景,2022中国开放数林指数指标体系框架如下: 评估指标体系共包括准备度、平台层、数据层、利用层四个维度及下属多级指标(如图8所示): 准备度是“数根”,是数据开放的基础,包括法规政策、标准规范、组织推进等三个一级指标。 平台层是“数干”,是数据开放的枢纽,包括平台体系、开放协议、发 现预览、数据集获取、社会数据及利用成果提交展示、使用体验、互动反馈等七个一级指标。 数据层是“数叶”,是数据开放的核心,包括数据数量、开放范围、关 键数据集质量、关键数据集规范、关键数据集安全保护等五个一级指标。 利用层是“数果”,是数据开放的成效,包括利用促