您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[复旦大学]:2024中国地方公共数据开放利用报告 - 发现报告

2024中国地方公共数据开放利用报告

AI智能总结
查看更多
2024中国地方公共数据开放利用报告

1 001 001 目录 目录 引言 ■数林概貌 ■数林长势 ■数林指数 ■评估方法 附录 ■数林亮叶 001 007 016 019 023 031 038 本报告为国家社科基金重大项目“面向数字化发展的公共数据开放利用体系与能力建设研究”(批准号:21&ZD337)的阶段性成果之一。 本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范: 复旦大学数字与移动治理实验室.中国地方公共数据开放利用报告——省域(2024年度)[R/OL].(2024-09-26)[引用日期,格式为YYYY-MM-DD].http://ifopendata.fudan.edu.cn/report 引言 引言 “中国开放数林指数”是我国首个深耕于公共数据开放领域的专业指数,由复旦大学数字与移动治理实验室制作。自2017年首次发布以来,“中国开放数林指数”每年对我国地方公共数据开放利用水平进行综合评价,精心测量各地的“开放数木”,助推我国公共数据的供给流通与价值释放。开放数林指数将省及其下辖地市作为一个整体的“区域”来进行评测, 并发布《中国地方公共数据开放利用报告——省域》(以下简称《报告》)。 2017201820192020 202120222023 数林愿景 开放数据,蔚然成林,“开放数林”意喻我国公共数据开放利用的生态体系,我们期待: 开放数林有深根沃壤。只有始终根植于肥沃的“黑土地”上,“数木”才能在充足养分的供给下,固本培元,厚积薄发。 开放数林能去芜存菁。只有修去徒增负担的“冗枝”,剪掉有形无用的“败叶”,“数木”才能强化主干,萌发新枝。 开放数林可普惠共济。各类主体,不分大小亲疏,都可在“大数”下乘凉用材,摘果饮浆,共享其利。 最终,一个个地方的开放“数木”将共同成长为一片根深叶茂、生生不息、人人得益的中国开放数林。 2024 评估方法调整 1、坚守公共数据供给的“基本面” 开放数林指数认为,公共数据开放和授权运营这两种公共数据供给方式虽路径不同,但目标一致,都是为了扩大公共数据资源供给,降低市场和社会主体获取公共数据的门槛,释放公共数据的价值,两者相辅相成,又各有侧重。相对于授权运营,公共数据开放具有普惠、便捷、公平、门槛低、创新空间大等特点。首先,对于广大市场和社会主体而言,数据开放这种方式的受益面更大,便捷度更高,过程更为公平透明,获取数据的门槛和成本也相对更低。更重要的是,数据开放这种直接提供数据的方式具有更大的包容性和创新空间,许多伟大的创新不是被预先设计或“审核”出来的,许多场景在未获得数据并对其进行挖掘前还无法验证其可行性。如对所有的场景都要求先授权再使用,虽然有助于提高数据利用过程的安全性和确定性,但也将降低数据创新活动所必须的探索性和灵活性,可能带来抑制创新的结果,而只有容忍一定程度的“不确定性”,才有可能收获预想不到的创新惊喜。 因此,数据开放和授权运营这两种公共数据供给方式需要协同推进, 发挥各自所长,而不应相互取代或挤压空间,既不能局限于数据开放这一种方式来供给公共数据,也要防止对所有的公共数据,特别是明显不承载个人信息和不影响公共安全的公共数据,都只采用授权运营这一种方式来向社会供给,否则将不利于公共数据的普惠供给和数字经济的高质量发展。对于具有基础性和公益性的、社会受益面较广的、不承载个人信息和不影响公共安全的、主要依靠公共财政资金生成的、又不需要再投入较高成本就可向社会直接提供的公共数据,仍应优先选择数据开放这种方式进行供给,力求“应开尽开”。因此,2024开放数林指数将坚守公共数据供给的“基本面”,聚焦于对各地的公共数据开放利用水平进行评测。 2、将评估维度“准备度”更名为“保障层” 公共数据开放工作在地方层面已进行了12年的探索,只靠做好前期“准备”已无法保障这项工作的深入和持续推进,因此,2024开放数林指数将准备度更名为保障层,以从法规政策、标准规范和组织推进等方面加强对公共数据开放工作提供全过程保障与支撑能力的测评。对保障层中的各项指标强化其对服务层、数据层和利用层起到的保驾护航作用,并注重法规政策的动态性和组织推进的长效性,新增了“数据开放法规政策更新”这项指标,并提升了公共数据年度工作计划等指标的权重。 3、关注服务实效与创新探索 2024开放数林指数服务层继续强化对服务实效的评估,弱化或取消了部分平台功能建设类指标,而强调平台功能上线后的持续稳定运营,从而使用户在发现、获取及利用数据的各个环节中都能得到更好的体验。同时,评估在2022年首次引入“体验官”进行评测的基础上,进一步提高了用户体验这项指标的权重,以更好反映体验官们的真实感受。此外,服务层还结合地方的创新实践新增了一些具有探索性与引领性的新指标,如结合AI大语言模型技术的智能数据推荐服务。 4、强调高利用、高需求数据的数量与质量 2024开放数林指数进一步提高了数据层的评估权重,以体现对数据供给数量和质量本身的注重,并加强了数据层与利用层评估的联动,以利用者的视角来分析和评价各地关键数据集的数量与质量。基于利用层发现的7个常见场景,数据层梳理出了这些场景中利用程度较高且各地开放情况较好的数据集,并评测各地在这些高利用数据集上的开放情况。在质量评测中,还重点对各地高利用数据集的可理解性与及时性进行评测,同时新增了准确性指标,以加强对数据内容准确程度的评测。 除了新增指标外,数据层指标继续强化了对高下载数据与基础性数据的评估,基于2024年对各地平台上普遍下载量较高的数据集的分析,再结合各地平台的数据开放实际情况,扩大了高下载数据与基础性数据的评测范围。 5、强调利用成果的实际效果而非“形式主义“成果 2024开放数林指数利用层重产出、看实效,关注各地利用开放数据利用产生的真应用、真成果,以及对经济发展、公众生活、学术研究等方面带来的真效益。在各地已普遍举办数据大赛的背景下,利用层不再评估各地组织的开放数据创新利用比赛和引导赋能活动,而聚焦于数据利用成果的实际产出情况;也不再评测“成果数量”,而是更注重对需求高、质量优、有实效的重点利用成果的评估。同时,利用层将原有的“成果多样性”“成果价值”指标融于对成果产出和成果质量的评估中,以突出重点场景的数据利用成果与价值释放。 利用层重点选取了各地常见的实时公交、停车导航、无障碍导航、AED查找、信用贷款、商业医保、开业创业7个场景,来评估各地在这7个场景中的成果产出和成果质量。同时,利用层还关注各地开发的有特色、方便用、能推广的利用成果。在成果评估中,利用层引入了体验官来筛选出有实效的真成果,剔除了由各地政府自身开发、未标注数据来源、不便于获取、不容易使用、不再更新维护、功能过于单一的“水”成果。 数林概貌 一、数林概貌 截至2024年7月,我国已有243个省级和城市的地方政府上线了数据开放平台,其中省级平台24个(不含直辖市和港澳台),城市平台219个 (含直辖市、副省级与地级行政区)。与2023年下半年相比,新增17个地方平台,其中包含2个省级平台和15个城市平台,平台总数增长约8%,如图1所示。 ■图1历年地级及以上地方数据开放平台增长情况 目前,我国27个省级行政区(不含直辖市和港澳台)中已有24个上线了公共数据开放平台,占总数的89%。历年省级平台数量增长情况如图2所示,各省级平台(不含直辖市和港澳台)上线时间如表1所示。同时,报告还发现有4个省级平台在上线后又出现了无法访问的情况,包括甘肃、河南、青海与新疆。 ■图2历年省级(不含直辖市)平台上线情况 ■表1省级(不含直辖市)数据开放平台上线时间 截至2024年7月,各地已上线省级(不含直辖市)公共数据开放平台的地理分布如图3所示,颜色越深,代表平台上线时间越早,整体上呈现出从东南部地区向中西部、东北部地区不断延伸扩散、相连成片的趋势。 ■图3各省级(不含直辖市)平台上线时间的地理空间分布 自中国开放数林指数2017年首次发布以来的八年中,全国省级公共数据开放平台已蔚然成林。图4为2017年到2024年期间,省级地方(不含直辖市)公共数据开放平台的地理空间分布情况。 ■图42017-2024年省级(不含直辖市)平台地理空间分布 截至2024年7月,全国各省域数据开放平台的整体上线情况如图5和表2所示,省域包括省(自治区)本级和省内下辖城市,图中颜色越深,代表该省域数据开放平台的整体上线程度越高。目前,福建、广东、广西、贵州、黑龙江、湖北、江苏、江西、山东、四川与浙江共11个省域的省(自治区)本级和下辖所有地市都已上线了数据开放平台(图中显示为全境深绿色的省域)。从整体上看,东南沿海、华中和西南地区的数据开放平台已经基本相连成片。 ■图5各省域平台整体上线情况地理空间分布 ■表2部分省域及下辖地市平台上线情况 自2017年中国开放数林指数首次发布以来,各地平台上开放的有效数据集总数逐年增长(如图6所示),2017年全国所有地方只开放了八千多个数据集,2024年已增长到37万多个,是八年前的44倍。 ■图6历年地方政府开放的有效数据集总数 数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数)后得出的数量,体现的是平台上开放的可下载数据集的数据量和颗粒度。2019年以来各地平台无条件开放的可下载数据集的容量从2019年的约15亿到2024年超679亿,六年间增长了45倍,如图7所示。 ■图7历年各地方政府无条件开放数据集的总容量(数量级:万) 随着《“数据要素×”三年行动计划(2024—2026年)》的推进和数据要素市场化配置改革的深入,扩大公共数据资源供给,有序推进公共数据开放,已成为近几年来我国公共数据领域的一项重要工作。基于《“数据要素×”三年行动计划(2024—2026年)》中的12个重点领域,各地在重点领域开放的有效数据集总数如图8所示,城市治理、金融服务、绿色低碳等重点领域开放的有效数据集总数最多,其次是交通运输、现代农业、文化旅游、医疗健康等领域,工业制造、应急管理与气象服务领域开放的数据集较少。 ■图8各地开放的重点领域的有效数据集总数 报告梳理了目前各地平台累计下载数量最高的十类数据集的名称、下载数量与地方平台开放比例(见表3),从表中可见,虽然目前社会对这些数据集的需求较高,但在全国各地方的开放比例仍然较低。 ■表3各地平台累计下载数量最高的十类数据集 ■表4各地平台开放比例最高的五类高利用数据集 报告从各地已经落地的开放数据利用成果中梳理出七类高频场景并结合各地平台开放情况筛选出32类高利用数据集,表4是各地平台开放比例最高的五类高利用数据集。然而,目前高新技术企业、医疗机构、企业/个体户注册登记等高利用数据集在全国各地方平台的开放比例多在40%以下。 015 数林长势 二、数林长势 各地公共数据开放基础保障能力不断提升,以法规政策、标准规范、组织保障来支撑公共数据开放与利用。部分省域已构建了较为完备的法规政策体系并制定了详细的标准规范文件。例如,浙江、贵州、山东建立了完善的公共数据开放法规政策体系,形成了全省统一的标准规范,并连续制定和发布公共数据开放年度工作计划与开放清单。然而,多数省域对公共数据开放年度计划的重视程度仍旧不足。 各地平台服务水平取得明显进展,11个省域的所有地市均上线了数据开放平台,并逐步实现了省市间前台入口及后台账户的互联互通,使用户可在省域内部进行“无感漫游”。多数省域平台已提供稳定优质的数据发现、数据获取和数据利用服务,部分省域正在探索更深度、更智能的服务方式。然而,部分省域在数据开放服务运营上仍存在不足:一是在平台使用与数据获取过程中设置了过高门槛或繁琐流程,便利性不足;二是某些功能缺少维护而“僵尸化”,缺乏实用性;三是对来自用户的各类反馈及诉求无法进行及时有效的回应,互动性有待提升。 各地公共数据开放数量质