001 001 目录 目录 引言 ■数林概貌 ■数林长势 ■数林指数 ■评估方法 附录 ■数林亮叶 001 007 013 016 022 034 041 本报告为国家社科基金重大项目“面向数字化发展的公共数据开放利用体系与能力建设研究”(批准号:21&ZD337)的阶段性成果之一。 本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范: 复旦大学数字与移动治理实验室.中国地方公共数据开放利用报告——城市(2024年度)[R/OL].(2024-09-26)[引用日期,格式为YYYY-MM-DD].http://ifopendata.fudan.edu.cn/report 002 引言 引言 “中国开放数林指数”是我国首个深耕于公共数据开放领域的专业指数,由复旦大学数字与移动治理实验室制作。自2017年首次发布以来,“中国开放数林指数”定期对我国地方公共数据开放利用水平进行综合评价,精心测量各地的“开放数木”,助推我国公共数据的供给流通与价值释放。 开放数林指数将直辖市、副省级城市和地级城市,都作为一个“空间”和“聚落”,而不仅仅是一个行政"层级"来进行评测,并发布《中国地方公共数据开放利用报告——城市》(以下简称《报告》)。 2017201820192020 202120222023 数林愿景 开放数据,蔚然成林,“开放数林”意喻我国公共数据开放利用的生态体系,我们期待: 开放数林有深根沃壤。只有始终根植于肥沃的“黑土地”上,“数木”才能在充足养分的供给下,固本培元,厚积薄发。 开放数林能去芜存菁。只有修去徒增负担的“冗枝”,剪掉有形无用的“败叶”,“数木”才能强化主干,萌发新枝。 开放数林可普惠共济。各类主体,不分大小亲疏,都可在“大数”下乘凉用材,摘果饮浆,共享其利。 最终,一个个地方的开放“数木”将共同成长为一片根深叶茂、生生不息、人人得益的中国开放数林。 2024 评估方法调整 1、坚守公共数据供给的“基本面” 开放数林指数认为,公共数据开放和授权运营这两种公共数据供给方式虽路径不同,但目标一致,都是为了扩大公共数据资源供给,降低市场和社会主体获取公共数据的门槛,释放公共数据的价值,两者相辅相成,又各有侧重。相对于授权运营,公共数据开放具有普惠、便捷、公平、门槛低、创新空间大等特点。首先,对于广大市场和社会主体而言,数据开放这种方式的受益面更大,便捷度更高,过程更为公平透明,获取数据的门槛和成本也相对更低。更重要的是,数据开放这种直接提供数据的方式具有更大的包容性和创新空间,许多伟大的创新不是被预先设计或“审核”出来的,许多场景在未获得数据并对其进行挖掘前还无法验证其可行性。如对所有的场景都要求先授权再使用,虽然有助于提高数据利用过程的安全性和确定性,但也将降低数据创新活动所必须的探索性和灵活性,可能带来抑制创新的结果,而只有容忍一定程度的“不确定性”,才有可能收获预想不到的创新惊喜。 因此,数据开放和授权运营这两种公共数据供给方式需要协同推进, 发挥各自所长,而不应相互取代或挤压空间,既不能局限于数据开放这一种方式来供给公共数据,也要防止对所有的公共数据,特别是明显不承载个人信息和不影响公共安全的公共数据,都只采用授权运营这一种方式来向社会供给,否则将不利于公共数据的普惠供给和数字经济的高质量发展。对于具有基础性和公益性的、社会受益面较广的、不承载个人信息和不影响公共安全的、主要依靠公共财政资金生成的、又不需要再投入较高成本就可向社会直接提供的公共数据,仍应优先选择数据开放这种方式进行供给,力求“应开尽开”。因此,2024开放数林指数将坚守公共数据供给的“基本面”,聚焦于对各地的公共数据开放利用水平进行评测。 2、将评估维度“准备度”更名为“保障层” 公共数据开放工作在地方层面已进行了12年的探索,只靠做好前期“准备”已无法保障这项工作的深入和持续推进,因此,2024开放数林指数将准备度更名为保障层,以从法规政策、标准规范和组织推进等方面加强对公共数据开放工作提供全过程保障与支撑能力的测评。对保障层中的各项指标强化其对服务层、数据层和利用层起到的保驾护航作用,并注重法规政策的动态性和组织推进的长效性,新增了“数据开放法规政策更新”这项指标,并提升了公共数据年度工作计划等指标的权重。 3、关注服务实效与创新探索 2024开放数林指数服务层继续强化对服务实效的评估,弱化或取消了部分平台功能建设类指标,而强调平台功能上线后的持续稳定运营,从而使用户在发现、获取及利用数据的各个环节中都能得到更好的体验。同时,评估在2022年首次引入“体验官”进行评测的基础上,进一步提高了用户体验这项指标的权重,以更好反映体验官们的真实感受。此外,服务层还结合地方的创新实践新增了一些具有探索性与引领性的新指标,如结合AI大语言模型技术的智能数据推荐服务。 4、强调高利用、高需求数据的数量与质量 2024开放数林指数进一步提高了数据层的评估权重,以体现对数据供给数量和质量本身的注重,并加强了数据层与利用层评估的联动,以利用者的视角来分析和评价各地关键数据集的数量与质量。基于利用层发现的7个常见场景,数据层梳理出了这些场景中利用程度较高且各地开放情况较好的数据集,并评测各地在这些高利用数据集上的开放情况。在质量评测中,还重点对各地高利用数据集的可理解性与及时性进行评测,同时新增了准确性指标,以加强对数据内容准确程度的评测。 除了新增指标外,数据层指标继续强化了对高下载数据与基础性数据的评估,基于2024年对各地平台上普遍下载量较高的数据集的分析,再结合各地平台的数据开放实际情况,扩大了高下载数据与基础性数据的评测范围。 5、强调利用成果的实际效果而非“形式主义“成果 2024开放数林指数利用层重产出、看实效,关注各地利用开放数据利用产生的真应用、真成果,以及对经济发展、公众生活、学术研究等方面带来的真效益。在各地已普遍举办数据大赛的背景下,利用层不再评估各地组织的开放数据创新利用比赛和引导赋能活动,而聚焦于数据利用成果的实际产出情况;也不再评测“成果数量”,而是更注重对需求高、质量优、有实效的重点利用成果的评估。同时,利用层将原有的“成果多样性”“成果价值”指标融于对成果产出和成果质量的评估中,以突出重点场景的数据利用成果与价值释放。 利用层重点选取了各地常见的实时公交、停车导航、无障碍导航、AED查找、信用贷款、商业医保、开业创业7个场景,来评估各地在这7个场景中的成果产出和成果质量。同时,利用层还关注各地开发的有特色、方便用、能推广的利用成果。在成果评估中,利用层引入了体验官来筛选出有实效的真成果,剔除了由各地政府自身开发、未标注数据来源、不便于获取、不容易使用、不再更新维护、功能过于单一的“水”成果。 006 数林概貌 一、数林概貌 截至2024年7月,我国已有243个省级和城市的地方政府上线了数 据开放平台,其中省级平台24个(不含直辖市和港澳台),城市平台219 个(含直辖市、副省级与地级行政区)。与2023年下半年相比,新增17 个地方平台,其中包含2个省级平台和15个城市平台,平台总数增长约8%, 如图1所示。 ■图1历年地级及以上地方数据开放平台增长情况 目前,我国337个城市(含直辖市、副省级与地级行政区)中已有 219个城市上线了公共数据开放平台,占总数的65%,历年城市平台数量 增长情况如图2所示,各城市平台上线时间如表1所示。 ■图2历年城市(含直辖市、副省级与地级行政区)平台上线情况 ■表1城市数据开放平台上线时间一览表(按拼音首字母排序) 截至2024年7月,全国各地上线的城市公共数据开放平台的地区分 布如图3所示,颜色越深,代表平台上线时间越早。目前,所有直辖市,福建、广东、广西、贵州、黑龙江、湖北、江苏、江西、山东、四川与浙江共11个省域所有下辖城市都已上线了公共数据开放平台,形成我国最为密集的城市“开放数林”。同时,安徽、宁夏下辖的绝大多数城市也已上线了开放平台。然而,青海省内的所有城市以及海南、河南、吉林、辽宁、陕西和云南省内的绝大多数城市尚未上线公共数据开放平台。 ■图3城市平台上线时间的地理空间分布 自2017年中国开放数林指数首次发布以来的八年中,全国城市公共 数据开放平台已蔚然成林。图4为2017年到2024年,地级以上城市(含直辖市)公共数据开放平台的地理空间分布情况。 ■图42017-2024年城市平台地理空间分布 报告梳理了目前各城市平台累计下载数量最高的十类数据集的名称、下载次数与城市平台开放比例(见表2),从表中可见,虽然目前社会对这些数据集的需求较高,但在全国各地方的开放比例仍然较低。 ■表2城市平台累计下载数量最高的十类数据集 报告从各城市已经落地的开放数据利用成果中分析出七类高频场景并结合各城市平台开放情况筛选出32类高利用数据集,表3是各城市平台开放比例最高的五类高利用数据集。目前,公交站点路线、医疗机构、企业/个体户注册登记数据等高利用数据在各城市平台的整体开放比例较高。 ■表3城市平台开放比例最高的五类高利用数据集 012 数林长势 二、数林长势 各地公共数据开放基础保障能力不断提升,以法规政策、组织保障来支撑公共数据开放与利用。部分城市如杭州、苏州、上海等地已构建了较为完备的法规政策体系,德州、济南等地则连续制定和发布公共数据开放年度工作计划与开放清单。然而,多数城市对公共数据开放年度计划的重视程度仍旧不足,部分城市在年度开放计划的工作方面存在未制定、不连续、内容不充分等问题。 多数城市平台已能提供较为稳定的基本服务,帮助用户发现、获取和利用数据。少数城市还在不断探索更深度的服务方式(如字段搜索),并被其他地方学习借鉴。然而,部分城市在数据开放服务运营上仍存在不足:一是在平台使用与数据获取中设置了过高门槛或繁琐流程,便利性不足;二是某些功能缺少维护而“僵尸化”,缺乏实用性;三是对来自用户的各类反馈及诉求无法进行及时有效的回应,互动性有待提升。 各地公共数据开放数量质量不断提升,显示出各城市加大公共数据供给的成效。各城市对高下载、高利用数据的开放程度仍然不足。此外,各地对于时效性较高的数据所提供的API接口数量虽有增长,但总量仍较少,当前城市中仅杭州、济南、深圳、温州开放了少量能够每天更新的数据接口。各地无条件开放的数据接口虽然总量较多,但普遍存在需要申请且申请后无响应、使用说明不清晰、无法调用、无数据或数据不更新等问题。在数据质量方面,各地都能在守住开放数据安全性底线的前提下,在数据可获取性、格式可用性、数据可理解性、内容完整性等方面取得明显进步。但是,少部分城市平台在数据可获取性方面仍存在不少问题。例如,被列为“无条件开放”的数据却需要申请甚至申请后也无响应、对下载数据设置了重重限制、数据文件无法打开或打开后无内容等问题。各城市开放数据的及时更新程度不高,无条件开放的数据集中能够按年度更新的数据占比仅有18%,部分城市平台的数据甚至出现曾经开放后又中断供给的现象。 各地已利用开放数据开发了多种便利民众生活的场景应用,释放出较大的社会公益价值和科研价值。例如,超过半数城市开放的停车场数据对市场开发的停车导航应用提供了支撑,较多城市利用开放数据实现了公交实时到站预报服务和无障碍设施导航服务,部分城市开始探索AED设备、新能源充电站、母婴设施的搜寻服务。各地高校的师生也利用城市开放数据开展研究,已发表超过100篇明确引用各地开放数据的科研论文。然而,各城市开放数据对于数字经济的价值释放作用仍然不足,一是只有少部分城市在信用贷款、商业医保、开业创业场景产出了有效应用;二是只有极少数城市的特色场景应用是“真创新”,能够孵化落地和持续运营。 015 数林指数 三、数林指数 2024年度全国城市开放数林的指数分值如表4所示,报告还基于综合指数分值将各地的公共数据开