1 001 001 目录 目录 001 002 004 017 024 027 038 引言 ■数林概貌 ■数林指数 ■数林标杆 ■数林亮叶 ■评估方法 附录 本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范: 复旦大学数字与移动治理实验室.中国地方公共数据开放利用报告——省域(2023年度)[R/OL].(2023-11-01)[引用日期,格式为YYYY-MM-DD].http://ifopendata.fudan.edu.cn/report 引言 引言 “中国开放数林指数”是我国首个专注于评估公共数据开放利用水平的专业指数,由复旦大学数字与移动治理实验室制作出品。自2017年首次发布以来,“中国开放数林指数”定期对我国各地公共数据开放利用水平进行综合评价,精心测量各地的“开放数木”,助推我国公共数据的流通与价值释放。 2023年起,开放数林指数将年度报告的名称从《中国地方政府数据开放报告》改为《中国地方公共数据开放利用报告》,以体现从“政府数据开放”迈向“公共数据开放”的方向,以及指数对公共数据从流通、到利用、到价值释放全过程的关注。开放数林指数将省及其下辖地市作为一个整体的“区域”来进行评测,并发布《中国地方公共数据开放利用报告——省域》(以下简称《报告》)。 201720182019 202020212022 数林愿景 开放数据,蔚然成林,“开放数林”意喻我国公共数据开放利用的生态体系,我们期待: 开放数林是繁盛多姿的,各种“数木”都能竞相并生、枝杈相连、根系相通; 开放数林是生生不息的,无时无刻不在成长变化,充满生机和活力;开放数林更是包容温暖的,既能让林子里的各种“生物”共享数林的 美好,又能遮阳挡雨,不让他们被数据“灼伤”或“淋湿”。 最终,一棵棵地方开放“数木”能够成长为一片繁盛多样、持续生长、包容宜人的中国“开放数林”。 2023 数林概貌 一、数林概貌 截至2023年8月,我国已有226个省级和城市的地方政府上线了数 据开放平台,其中省级平台22个(不含直辖市和港澳台),城市平台204 个(含直辖市、副省级与地级行政区)。与2022年下半年相比,新增18 个地方平台,其中包含1个省级平台和17个城市平台,平台总数增长约9%。 自2017年起全国地级及以上公共数据开放平台数量持续增长,从2017年 报告首次发布时的20个到2023下半年的226个,如图1所示。 ■图1历年地级及以上数据开放平台数量增长情况 目前,在我国27个省级行政区(不含直辖市和港澳台)政府中, 81.84%已经上线了公共数据开放平台。自2015年浙江省上线了我国第一个省级(不含直辖市和港澳台)平台以来,省级平台数量逐年增长,目前已达到22个,历年已上线与未上线数据开放平台的省级地方数量如图2所 示,表1是各省级平台(不含直辖市和港澳台)上线时间。同时,报告也注意到有五个省级平台在上线后又出现了无法访问的情况,主要集中在中西部地区,包括甘肃、河南、宁夏、青海与新疆。 ■图2历年省级(不含直辖市)平台上线情况 ■表1省级(不含直辖市)数据开放平台上线时间 截至2023年8月,全国各地上线的省级(不含直辖市)公共数据开 放平台的地区分布如图3所示,颜色越深,代表平台上线时间越早,整体上呈现出从东南部地区向中西部、东北部地区不断延伸扩散、相连成片的趋势。 ■图3各省级(不含直辖市)平台上线时间的地理空间分布 自中国开放数林指数2017年首次发布以来的七年中,全国各地的公 共数据开放省域已蔚然成林。图4为2017年到2023年期间,省级地方(不含直辖市)公共数据开放平台区域分布的变化情况。 ■图42017-2022年省级(不含直辖市)平台分布 userid:414195,docid:144762,date:2023-11-04,sgpjbg.com 截至2023年8月,全国各省域数据开放平台的整体上线情况如图5和表2所示,省域包括省(自治区)本级和省内下辖城市,图中颜色越深,代表该省域数据开放平台的整体上线程度越高。目前,福建省、广东省、广西壮族自治区、贵州省、江苏省、江西省、山东省、四川省与浙江省共9个省域的省(自治区)本级和下辖所有城市都已上线了数据开放平台(图中显示为全境深绿色的省域)。从整体上看,东南沿海和中部地区的数据开放平台已经基本相连成片。 ■图5各省域平台整体上线情况地理空间分布 自中国开放数林指数2017年首次发布以来,每年采集到的各地平台上开放的有效数据集总数逐年增长(如图6所示),2017年全国所有地方只开放了八千多个数据集,2023年已增长到34万多个,是7年前的41倍。 ■表2部分省域及下辖地市平台上线情况 ■图6历年地方政府开放的有效数据集总数 数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数)后得出的数量,体现的是平台上开放的可下载数据集的数据量和颗粒度。2019年以来各地平台无条件开放的可下载数据集的容量从2019年的15亿到2023年超480亿, 5年间增长了32倍(如图7所示)。 ■图7历年各地方政府无条件开放的数据集总容量(数量级:万) 《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》明确提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用。”当前,部分地方已在积极探索授权运营工作,截至2023年9月,各地已正式出台的与公共数据授权运营相关的法规政 策如表3所示,发布的相关征求意见稿如表4所示。 ■表3各地公共数据授权运营相关法规政策一览表(截至2023年9月) ■表4各地公共数据授权运营相关法规政策征求意见稿一览表(截至2023年9月) ■表5地方公共数据授权运营平台或专区 目前各地已公开上线的公共数据授权运营平台或在数据开放平台上开设授权运营专区的地方如表5所示。 012 数林指数 二、数林指数 2023年度全国省域开放数林指数分值如表6所示,报告还基于综合指数分值将各地的公共数据开放利用水平分为五个“开放数级”。浙江省和山东省的综合表现最优,进入第一等级“五棵数”,获得“数开繁盛”大奖。贵州省也总体表现优秀,进入第二等级“四棵数”,其次是福建省、四川省、广东省、广西壮族自治区等地。在四个单项维度上,浙江省在准备度、数据层和利用层上表现最优,贵州省在服务层上表现最优。 ■表6中国开放数林指数省域综合排名 省域开放数林指数空间分布如图8所示,颜色越深代表综合指数分值越高。指数分值较高的地方主要集中在我国东部的浙江省、山东省、福建省、广东省以及西部的贵州省、四川省和广西壮族自治区。 ■图8省域开放数林指数空间分布 “数林匹克”指数 数据开放利用是一场马拉松,而不是速滑赛,不在于一个地方是否跑得早、跑得急,而在于这个地方能否跑得长、跑得久。报告继续通过“数林匹克”四年累计分值,反映一个地方在过去四年(2020年-2023年)开放数据的持续水平。省域“数林匹克”指数由2020年到2023年这四年该省域的全年开放数林综合指数的分值累加而成。 表7为2020-2023省域“数林匹克”累计分值排在前十名的地方,浙江省分值最高,其次是山东省、贵州省和广东省。 ■表7省域“数林匹克”累计分值(前十名) 016 数林标杆 三、数林标杆 1.浙江省 浙江省已建立了完备的数据开放与授权运营法规政策体系,制定了地方性法规《浙江省公共数据条例》、地方政府规章《浙江省公共数据开放与安全管理暂行办法》以及一般规范性文件《浙江省公共数据开放工作指引》,并制定了我国省级层面首部专门针对公共数据授权运营的规范性文件《浙江省公共数据授权运营管理办法(试行)》,以规范公共数据授权运营管理,推动公共数据有序开发利用。 浙江省数据开放平台注重用户获取数据的体验,提供了类似“购物车”的“数据批量下载”功能(如图9所示),用户可在选择添加多个数据集 后一并下载。同时,还通过“社会数据专区”为企业和社会组织提交自己持有的数据提供了入口(如图10所示), 供其他用户下载。其中,部分社会数据来自于以往数据开放大赛孵化的成果,实现了公共数据的价值释放与回流。 ■图9浙江省平台的“数据批量下载”功能■图10浙江省平台的“社会数据专区” 浙江省平台开放的数据集整体质量较高,在可用性、可理解性、完整性与及时性等方面均在全国处于领先位置。平台还设有数据高铁专区,通过接口形式将业务场景下实时产生的数据向用户开放,用户申请接口后基于调用参数即可持续获取数据(如图11所示),降低了数据产生到开放之间的流通时间。浙江数据开放平台还为开放的数据集提供了较为详细的描述说明,为部分数据集提供了数据字典,以描述数据采集的背景并对数据字段作出解释(如图12所示)。 ■图11浙江省数据开放平台的数据高铁专区 ■图12浙江省数据开放平台上为部分数据提供数据字典说明 浙江省注重公共数据的开放利用和价值释放,通过对开放数据的有效利用为公众提供更便捷的服务,鼓励社会力量积极参与城市治理。例如,为了在高速应急施救中解决社会救援资源调度不足、利用率低、响应不及时等问题,浙江数据开放创新应用大赛孵化的“安迅应急救援——道路安全的守护者”应用通过汇集公共数据和社会数据并进行分析利用,建立了一套社会救援力量数字化调度体系,整合优化施救驻点和救援资源分布,缩短救援响应时间,形成1分钟接警、3分钟出警、15分钟到场的“1315”高速公路施救流程标准和城市道路施救流程标准,大幅提高了道路应急救援效率(如图13所示)。 ■图13浙江省的“安迅应急救援”项目 “安诊无忧”陪诊服务是浙江省2022年数据开放创新应用大赛评选出的优秀作品。“安诊无忧”利用医院信息数据(包括医院的名称、位置、级别、类型等数据项)、医疗机构服务情况(包括急诊、门诊人次等数据项)、护士职业证书数据、职业技能证书等开放数据,并结合自有数据,搭建线上陪诊预约平台,为老人、儿童、残障人士提供专业陪诊服务。“安诊无忧”致力于对接陪诊师的需求与供给,改善弱势人群的就医体验,减少患者的就诊时间和负担,如图14所示。 ■图14浙江省的“安诊无忧”陪诊服务应用 2.山东省 山东省注重制定年度数据开放工作计划,发布数据集开放清单,在《2023年新增公共数据开放清单》中提供了数据来源、数据集名称、字段、开放属性、开放条件、更新频率、计划开放时间等具体信息(如图15所示)。 山东省无条件开放的数据数量在全国处于领先地位,省本级无条件开放数据集的平均容量近120万,省域内所有地市开放数据集的平均容量超 46万。此外,省本级与省域内各地市开放的高需求高容量数据也名列前茅,尤其体现在企业注册登记、气象、卫生等领域。 山东省数据应用创新创业大赛设置了多条赛道,其中“数据赋能高校创业赛道”(如图16所示)为高校学生提供了门槛较低的参赛通道,以扩大比赛的参与面。 ■图15山东省《2023年新增公共数据开放清单》(部分截图) ■图16山东省开放数据利用大赛设置高校就业赛道 为了解决商业医保理赔数据打不通、流程繁琐等问题,山东省推出“政保通”平台,向商业保险机构开放公共数据,打通商业医保理赔服务的“最后一公里”(如图17所示),运用隐私计算技术实现数据“可用不可见”,并按照“一数一授权”的模式,要求个人数据需经本人授权后方可被调用。 ■图17山东省"政保通“支撑商业医保快速理赔 023 数林亮叶 四、数林亮叶 除了以上两个标杆案例,2023年其他省域在公共数据开放利用和授权运营工作上也出现了不少亮点: 数据层亮叶 海南省在卫生健康领域开放的数据容量较高、质量较好,涉及到医疗机构、药品目录、疾病诊断信息等市场需求高、具有较高利用价值的数据;福建省对省级平台上已开放数据及时进行更新,约50%的无条件开放数据集