您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[复旦大学]:2022卫生健康公共数据开放报告 - 发现报告
当前位置:首页/行业研究/报告详情/

2022卫生健康公共数据开放报告

公用事业2022-11-07复旦大学墨***
2022卫生健康公共数据开放报告

1 卫生健康 公共数据开放报告 2 001 为什么要开放卫生健康公共数据? 政府将公共数据以可机读形式开放给社会进行开发利用,有利于释放公共数据的价值,促进数字化发展。 近年来,国家对公共数据开放工作高度重视。2021年3月13日,《中 华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中提出要“扩大基础公共信息数据安全有序开放,探索将公共数据服务纳入公共服务体系,构建统一的国家公共数据开放平台和开发利用端口,优先推动企业登记监管、卫生、交通、气象等高价值数据集向社会开放”。 目前,我国卫生健康领域开放了哪些公共数据?这些数据是否真正能用和好用?这些数据是如何被利用的?形成了哪些成果?全球其他国家和地区又是如何开放和利用卫生健康类公共数据的?继《交通运输公共数据开放报告》之后,作为开放数林系列报告中的又一部行业领域类报告,《卫生健康公共数据开放报告》对以上问题开展了研究。 002 哪些地方开放了卫生健康类公共数据? 截至2021年11月,我国已有12个省级和115个城市平台开放了卫 生健康领域数据13808个,数据容量达到2.68亿。 图1是全国各省域开放的卫生健康领域有效数据容量的空间分布,颜色越深代表该省域所开放的数据容量越多。数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数)后得出的数量。从图1中可见,总体上来看,卫生健康领域数据开放容量较多的省域集中在东部沿海地区的山东省、广东省、浙江省以及中西部的四川省等地。 ■图1省域卫生健康数据容量空间分布(不包括直辖市、港澳台) 003 相比省本级平台,城市平台开放的卫生健康数据容量更大、内容丰富性程度更高。图2是全国各城市开放的卫生健康领域有效数据容量的空间分布,数据容量较高的城市集中在山东省、浙江省与四川省内,包括南充市、嘉兴市、滨州市、温州市、烟台市、台州市、济南市等。 004 卫生健康类公共数据开放在各行业中处于什么水平? 卫生健康领域的数据主要提供部门包括卫生健康部门、医疗保障部门以及药品监管主管部门等。与其他条线部门相比,在数据集数量上,卫生健康主管部门开放的数据集总数仅次于文化旅游,在各部门中居于前列,如图3所示。 ■图3各政府部门开放的有效数据集总数 005 数据容量比数据集总数更能体现一个行业领域的数据开放总量,在数据容量方面,市场监管部门开放的数据容量最高,达到4.52亿,而医疗保 容量达到0.58亿,与其他部门相比整体上处于中上水平,如图4所示。 障部门开放的数据容量排第七位,达到1.36亿,卫生健康部门开放的数据 ■图4各政府部门开放的数据容量 006 哪些地方的卫生健康数据开放水平最高? 基于开放数林指标体系,结合卫生健康领域特点,报告重点从准备度、数据层和利用层三个维度及下属多级指标对卫生健康领域开放的公共数据开展评估(如图5所示): 准备度是“数根”,是数据开放的基础,包括开放利用要求、安全保护要求、保障机制三个一级指标。 数据层是“数叶”,是数据开放的核心,包括数据数量、开放范围、数据质量、数据规范、安全保护五个一级指标。 利用层是“数果”,是数据开放的成效,包括利用促进、利用多样性、成果数量、成果质量、成果价值五个一级指标。 007 ■图5-1卫生健康领域开放数林指数评估指标体系 008 ■图5-2卫生健康领域开放数林指数评估指标体系 009 ■表1卫生健康领域开放数林指数综合等级(省域) 2022卫生健康领域开放数林省域指数如表1所示。山东省的综合表现最优,进入第一等级“A+”;浙江省也表现优异,进入第二等级“A”,其次是四川省、广东省、贵州省、广西壮族自治区、福建省等省域。在单项维度上,山东省在数据层表现最优,进入A+等级;浙江省在利用层上表现最优,进入A+等级。 010 2022卫生健康领域开放数林城市指数(前三十)如表2所示。青岛市和济南市的综合表现最优,进入第一等级“A+”;深圳市、嘉兴市、上海市、武汉市和滨州市也表现优异,进入第二等级“A”。在单项维度上,嘉兴市在数据层上表现最优,进入A+等级;上海市、青岛市和深圳市在利用层上表现最优,进入A+等级。 ■表2卫生健康领域开放数林指数综合等级(城市前三十) 011 各地开放了哪些高容量的卫生健康类数据集? 表3和表4是省本级与城市平台开放的数据容量最高的前10个卫生健康领域数据集。总体上,城市平台开放的卫生健康数据集在容量与质量上都高于省本级平台开放的数据。省本级平台开放的高容量数据集主要集中于从业人员执业许可、医疗机构注册登记、药品医疗器械等方面。城市平台开放的高容量数据集主要集中于医保参保人员信息、就医人数、医保药品目录、医保缴费等方面。 ■表3省本级平台开放的高容量数据集(前十) 012 ■表4城市平台开放的高容量数据集(前十) 例如,四川省南充市开放的“药品目录信息”中,详细提供了药品的名称、目录编码、收费等级、使用范围、分类、国药准字号、生产厂家、开始与结束日期等信息,如图6所示。 ■图6南充市开放的药品目录基本信息 013 山东省开放的“电子证照-山东省医师执业证”,详细提供了全省范围内具有从业资格的医师基本信息,包含执业机构名称、姓名、性别、职业类别、医师执业范围、注册审批机关名称、资格证书编号、执业证书批准日期等信息,如图7所示。 ■图7山东省开放的执业医师资格证信息 014 各地开放了哪些疫情相关数据? 新冠疫情发生以来,全国有7个省级和41个城市级政府数据开放平台 开放了248个新冠疫情相关数据集,数据容量约141万,可分为三种类型:疫情情况数据、疫情防控数据以及社会运行保障数据。 图8是各类新冠疫情有效数据集总数、数据容量与单个数据集平均容量比较,疫情防控数据的有效数据集总数与总容量最高,疫情情况数据的单个数据集平均容量最高,社会运行保障数据在全国范围内开放的数据集总数与容量都较低。 ■图8各类新冠疫情有效数据集总数、数据容量与单个数据集平均容量比较 015 疫情情况数据:指和疫情情况相关的统计数据、确诊病例数据、病例治疗情况数据等; 疫情防控数据:指与疫情防控措施相关的数据,如发热门诊、核酸检测机构等; 社会运行保障数据:指疫情期间与地方运行保障相关的交通、超市、菜场、便民设施等数据。 表5是各地开放的新冠疫情数据集类型。 ■表5各地开放的疫情数据集 016 深圳市、厦门市政府数据开放平台为疫情数据开设了专题栏目,集中提供种类丰富的疫情数据,且更新及时,方便用户查找与获取,如图9所示。 017 例如,深圳市在2020年上半年最早开放了病例逗留场所位置坐标数据集,涉及场所经纬度坐标数据,并在数据集简介中说明了所使用的坐标数据出处,便于用户开发利用,如图10所示。 ■图10深圳市开放的“‘新冠肺炎’确诊患者逗留场所位置坐标” 018 青岛市平台在2020年上半年开放了新型冠状病毒感染的肺炎确诊患者行程信息——“新型冠状病毒感染的肺炎确诊患者行程信息”,该数据集包含三千多名确诊病例的行程信息,字段非常丰富,包含了交通类型、日期、车次、车厢、出发与到达站等数据项,数据容量较大,如图11所示。 019 深圳市平台及时开放了“便民核酸采样点位置及服务信息”数据,该数据集包含一万条数据核酸采样点数据,包含采样点名称、市区、街道、地址、拥堵状态等17个字段,数据容量较大,社会关注度高,如图12所示。 ■图12深圳市开放的“深圳市便民核酸采样点位置及服务信息” 020 疫情数据开放之后,产生了哪些利用成果? 部分疫情数据开放后被市场和社会进行利用,开发出了服务应用和数据可视化产品,主要用于查询病例与疫情场所信息、查询周边核酸检测点、展示疫情态势与病毒传播链条、为疫情防控提供政策建议等方面。 查询周边有无病例与疫情场所 开发者在2020年上半年就利用深圳市疫情专题开放数据制作了“城市 疫情场所地图”,在地图上标注出现疫情的场所,如图13所示。市民可以在地图中查询周边区域是否有涉及疫情的场所,以做好出行安排,加强个人防护。 ■图13深圳市“城市疫情场所地图” 021 查询周边有无核酸检测点 地图导航类应用开发者利用深圳市核酸检测机构数据制作了“核酸检测地图”,如图14所示。市民可以在应用中查询附近的核酸检测点,获取开放时间、排队情况等信息。 ■图14高德地图开发的深圳市"核酸检测地图" 022 展示病毒传播链条 有志愿者团队制作了“深圳疫情报告”,通过利用疫情专题数据,对病毒的传播链条、地区分布、年龄分布和疫情态势演变等方面做了可视化展示,便于公众理解,如图15、图16所示。 ■图15、图16志愿者团队开发的数据可视化产品:”深圳疫情报告“ 023 发布研究报告,分析数据提出建议 ■图17山东省齐鲁大数据研究院发布的 《新型冠状病毒感染的肺炎疫情数据分析报告》 山东省齐鲁大数据研究院发布的研究报告利用公共数据开放平台发布的省内疫情数据,并结合国家卫健委、其他各省卫健委发布的疫情数据进行分析,为疫情防控提出针对性政策建议,如图17所示。 024 基于信息发布,而非数据开放所开发的应用 报告还发现了一些企业与公众利用政府公开发布的信息制作的防疫应用。例如,“高德地图”应用将封控区、管控区与防范区的分布情况展示在地图上,便于社会查询使用;“上海小区疫情速查”小程序可以查询特定小区的病例出现日期与三区划分情况,如图18和图19所示。然而,这些疫情防控相关应用并未利用到真正的开放数据,而是通过抓取整理各地卫健委等部门公开发布的信息所开发,这种信息大多通过在文字中夹杂数字的形式发布,数据利用者在对这些数据进行分析利用前,需要先将数据从文字中提取出来,加工成结构化、可机读的格式,而无法被直接开发利用,因此这类信息发布形式并不等同于数据开放。 025 ■图19“上海小区疫情速查”小程序可查询三区划分情况 026 各地政府出台了哪些政策推进卫生健康数据开放? 为了推进卫生健康领域的公共数据开放工作,国务院办公厅、国家卫生健康委员会均出台了相关法规政策。在地方层面,山东省、福州市也出台了相关的管理办法对健康医疗数据开放作出规定,济南市还专门对疫情期间的数据开放工作作出了要求,如表6所示。 ■表6卫生健康领域涉及数据开放内容的法规政策列表 027 国外开放了哪些疫情数据? 自新冠疫情发生以来,面对公众对疫情数据的迫切需求,国外也出现了一些疫情数据开放的典型案例。 世界卫生组织(WHO)提供各国COVID-19疫情相关数据下载 世界卫生组织(WHO)网站(链接:https://covid19.who.int/data)以CSV格式提供全球各国COVID-19疫情原始数据下载,数据每周更新,并提供了数据采集方式、更新时间、元数据等说明。这些数据包括了自2020年1月以来各国提供的每天新增确诊与死亡病例,最新的累计确诊与死亡病例,以及各国疫苗接种情况等方面的数据。这些数据同时在网站上以空间可视化方式展示,如图20、图21所示。 ■图20世界卫生组织网站提供的全球COVID-19相关数据集下载 028 ■图21世界卫生组织网站提供的全球COVID-19感染人数可视化地图 美国约翰霍普金斯大学采集与开放COVID-19数据 约翰霍普金斯大学自2020年1月新冠病毒大流行开始采集各国以及美国国内各地方疫情相关数据,在新冠病毒资源中心网站(链接:https://coronavirus.jhu.edu/map.html)上以动态可视化形式展现(如图22所示),同时将采集到的原始数据在开源协作网站GIthub上开放(链接:https://coronavirus.jhu.edu/about/how-to-use-our-data),包括确诊病例、死