1 交通运输 公共数据开放利用报告 001 引言 ■全国交运数林概貌 ■交运数林指标体系 ■交运数林指数 ■地方交运数林标杆 ■交运数据开放国外案例 ■交运数林建言 ■交运数林指数评估方法 附录 001 003 008 012 016 042 061 063 070 001 本报告为国家社科基金重大项目“面向数字化发展的公共数据开放利用体系与能力建设研究”(批准号:21&ZD337)的阶段性成果之一。 本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范:复旦大学数字与移动治理实验室.2023交通运输公共数据开放利用报告[R/OL].(2023-05-25)[引用日期,格式为YYYY-MM-DD].http://ifopendata.fudan.edu.cn/report 引言 近年来,国家对公共数据开放工作高度重视。2020年4月9日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》首次将“数据”与土地、劳动力、资本、技术等传统要素并列,提出要推进政府数据开放共享,研究建立促进企业登记、交通运输、气象等公共数据开放和数据资源有效流动的制度规范。2021年3月13日,《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中提出要"扩大基础公共信息数据安全有序开放,探索将公共数据服务纳入公共服务体系,构建统一的国家公共数据开放平台和开发利用端口,优先推动企业登记监管、卫生、交通、气象等高价值数据集向社会开放"。2021年12月,国务院办公厅印发 《要素市场化配置综合改革试点总体方案》,再次要求“优先推进企业登 记监管、卫生健康、交通运输、气象等高价值数据集向社会开放”。 交通运输部在印发的《推进综合交通运输大数据发展行动纲要(2020-2025年)》(交科技发[2019]161号)中明确将“深入推进大数据共享开放”作为五项主要任务之一。2021年12月,交通运输部发布的《“数字交通”十四五发展规划》针对“行业成体系、成规模的公共数据较少,数据开放与社会期望还存在差距”的现状,提出“研究制定交通运输公共数据开放和有效流动的制度规范,推动条件成熟的公共数据资源依法依规开放和政企共同开发利用”。 作为国家经济命脉,交通运输领域生成和储存的公共数据内容丰富,应用面广,开放交通运输领域的公共数据对助推数字经济和数字社会发展具有重要意义。2021年起,“中国开放数林指数”系列报告定期发布交通运输公共数据开放利用报告,这也是“中国开放数林指数”系列报告下首个持续发布的行业领域类报告。 “中国开放数林指数”是我国首个专注于评估政府数据开放水平的专业指数,由复旦大学数字与移动治理实验室制作出品,自2017年5月首次发布以来,定期对我国政府数据开放水平进行综合评价,精心测量各地各领域“开放数木”的繁茂程度和果实价值,助推我国政府数据开放生态体系的建设与发展。开放数据,蔚然成林,“开放数林”意喻我国政府数据开放利用的生态体系,每一个地方和领域的开放“数木”由最初的丛然并生、成荫如盖,直至枝繁叶茂、花开结果,终将成长为一片繁盛多样、枝杈相连、持续循环的中国“开放数林”。 一、全国交运数林概貌 目前,国家交通运输部官网数据开放栏目(链接:https://www.mot.gov.cn/sjkf/)与交通运输部综合交通出行大数据开放云平台(链接:https://transportdata.cn/)都已开放了来自交通运输领域的数据集。两个平台无条件开放的数据集754个,数据容量近9千万,数据内容主要涉及国内部分省市的交通线路站点、客运站班次、线路、货运车辆、运输与维修经营业务等方面。同时,还开放了来自航空公司和OpenITS联盟的研究数据。 同时,“出行云”平台上还开放了153个有条件开放的数据集,内容主要涉及国内部分省市的地面公交、出租车、运输车的定位数据,轨道桥梁隧道数据,公交、出租车的线路、站点站台与票价数据,公路高速路路线与收费数据,百度地图路况数据以及与人口、房价、气象等相关的数据。 截至2022年10月,我国已有208个省级和城市的地方政府上线了数据开放平台,其中省级平台21个(含省和自治区,不含直辖市),城市平台187个(含直辖市、副省级和地级行政区),共开放了283413个有效数据集。其中,有11个省级和96个城市平台共开放了9489个交通运输领域数据集。 交通运输领域开放数据的主要提供机构包含交通运输部门、公安部 门、地铁/轨道集团、公交公司等。与其他条线部门相比,交通运输行业开放的数据集总数仅次于教育部门,其次是文化旅游、农业农村、民政、市场监管、统计等部门;交通运输部门开放的数据容量达到10.81亿,在各部门中仅次于市场监督管理、生态环保部门,其次是住房和城乡建设、城管、医疗保障等部门,如图1和图2所示。 教育交通运输(含轨道交通、公交公司) 文化旅游农业农村民政 市场监管(含工商、质监、食药监) 统计局财政 人力资源和社会保障应急管理(含安全生产监督管理) 卫生健康体育 住房和城乡建设 城管生态环保水利 国土(规划和自然资源) 公安司法商务 经济和信息化/工业和信息化 医疗保障科学技术档案 审计税务气象 新闻出版广播电影电视 金融监管发展改革(含物价、粮食)国有资产监督管理 民族宗教 518 421 346 232 780 764 1241 1182 2080 2041 1900 1785 1742 1599 2495 2419 2949 2844 2844 3840 3681 3667 3643 3414 3337 4555 5496 5830 6403 7524 9489 9872 020004000600080001000012000 ■图1各条线部门开放的有效数据集总数 市场监管(含工商、质监、食药监) 生态环保交通运输(含轨道交通、公交公司) 住房和城乡建设 城管医疗保障气象 司法民政水利 文化旅游人力资源和社会保障 国土(规划和自然资源) 商务公安教育 农业农村应急管理(含安全生产监督管理) 税务体育 新闻出版广播电影电视 财政卫生健康档案 发展改革(含物价、粮食) 统计局科学技术民族宗教 经济和信息化/工业和信息化 金融监管审计 国有资产监督管理 6825 5783 5489 5165 5058 4962 4517 4299 4217 4000 3956 3629 3514 2682 1465 629 513 482 123 99 85 16160 15858 15458 13486 12904 12480 10743 32537 108060 129913 147146 020000400006000080000100000120000140000160000 ■图2各条线部门开放的数据容量(单位:万) 图3和图4分别是各省域开放的交通运输领域有效数据集总数与数据容量的空间分布,颜色越深的省域所对应的数据数量也越多。从图中可见,开放交通运输领域数据数量较多的省域集中在东部地区(山东、浙江、广东)以及西部的部分地区(四川、贵州)。 ■图3省域有效数据集总数空间分布 ■图4省域数据容量空间分布 在数据数量方面,2022年全国开放的交通运输领域有效数据集总数比2021年增长约6%,无条件开放的总数据容量同比增长386%,呈现爆发式增长态势,单个数据集平均容量也有显著提升。而各地开放的交通运输领域数据集在总量与容量上仍然存在显著的地区间差距。这些交通运输领域的数据主要由各地政府部门提供,少部分地方能够开放来自国企、事业单位的交通数据。 在数据质量方面,各地开放的交通数据仍以静态数据为主,只有个别地方在数据开放平台上提供了少数实时动态数据。数据持续性有待提高,相比2021年,2022年各地开放的交通数据容量增长比例的中位数为10%,存量数据更新比例的中位数仅为18%,各地持续开放与更新数据集的程度仍然不足,多数数据停止更新或更新频率低,甚至存在碎片化与低容量等质量问题。各地开放的数据在标准规范上也不一致,缺少详细的数据字典描述说明,各地数据接口调用方式各不相同,复杂度较高,接口不能用、不易用的问题普遍存在。 在数据利用方面,少数地方在交通运输领域已开展了诸如开放数据创新利用比赛、项目案例试点等利用促进活动,产出了部分有效成果。但各地的利用促进活动类型仍较为单一,且利用主体主要为企业,个人、社会组织、高校等其他社会主体参与利用的程度不足,交通运输领域的开放数据利用尚处于起步阶段。 在法规政策方面,北京市、台州市等7个城市制定了专门针对交通运输领域数据开放的法规政策,对数据开放、全生命周期安全管理等方面作出了详细的规定。其他地方在有关“公共数据资源管理”“公共数据”的法规政策中,虽然在涉及数据开放范围和利用促进的相关内容中提及了“交通运输”领域,但未具体展开。 《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》明确提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用。”目前,北京、上海、广东、浙江、重庆、海南、深圳、成都等省市已经以地方法规形式,初步构建起公共数据授权运营的基本原则与机制,正式迈入实践落地与规范发展阶段。表1是目前已经公开上线的地方政府公共数据授权运营平台链接,福建省与海南省两个省级地方,以及成都市、南京市、青岛市三个副省级城市都已上线了公共数据授权运营平台,其中海南省、成都市与青岛市在平台上运营交通运输数据集并提供相应的交通运输领域的服务与产品。 ■表1地方政府公共数据授权运营平台 二、交运数林指标体系 开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与,组成"中国开放数林指数"评估专家委员会,以体现跨界、多学科、第三方的专业视角。专家委员会基于数据开放的基本理念和原则,立足我国政府数据开放的政策要求与地方实践,借鉴国际数据开放评估指标体系的经验,构建起一个系统、科学、可操作的地方政府数据开放评估指标体系,并为每项指标分配了权重,如图5所示。 ■图5开放数林指数评估指标体系的构建方法 基于开放数林指标体系,结合交通运输领域特点,报告重点从准备度、数据层和利用层三个维度及下属多级指标对交通运输领域开放的公共数据开展评估,如图6所示: 准备度是"数根",是数据开放的基础,包括开放要求和安全保护要求等两个一级指标。 数据层是"数叶",是数据开放的核心,包括数据数量、开放范围、关键数据集质量、关键数据集规范、关键数据集安全保护等五个一级指标。 利用层是"数果",是数据开放的成效,包括利用促进、利用多样性、成果数量、成果质量、成果价值等五个一级指标。 ■图6-1交通运输领域开放数林指数评估指标体系 ■图6-2交通运输领域开放数林指数评估指标体系 三、交运数林指数 2023交通运输领域开放数林省域指数如表2所示:浙江省与山东省的综合表现最优,进入A+等级; 广东省与贵州省也表现优异,进入A等级,其次是四川省、福建省等省 域; 在单项维度上,浙江省在数据层上表现最优,山东省在利用层上表现 最优,均进入A+等级。 2023交通运输领域开放数林城市指数(前三十)如表3所示:德州市与杭州市的综合表现最优,进入A+等级; 日照市、青岛市、上海市、金华市、烟台市与深圳市也表现优异,进入A等级,其次是贵阳市、台州市、威海市、济南市、丽水市等城市; 在单项维度上,德州市在数据层上表现最优,青岛市与杭州市在利用层上表现最优,均进入A+等级。 ■表2交通运输领域开放数林指数综合等级(省域) ■表3交通运输领域开放数林指数综合等级(城市前三十) 省域交通运输领域开放数林指数空间分布如图7所示,颜色越深代表指数综合等级越高。数据开放水平较高的省域主要集中在东南部沿海地区的浙江、山东、广东等省域以及位于西部的贵州、四川等省域,成为全国交通运输领域的优质“数木”。 ■图7交通运输领域开放数林指数空间分布(省域)