公共数据在金融领域规范应用研究 北京金融科技产业联盟 2024年3月 版权声明 本报告版权属于北京金融科技产业联盟,并受法律保护。转载、编摘或利用其他方式使用本报告文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。 编制委员会 编委会成员: 何军聂丽琴王立新常征 编写组成员: 赵亚敏 王 东 李聪 薛佳梅 郑平华 王雪 李武璐 陆 燕 徐宏杰 关乃迁 任帅 张浩瑀 汪翊琪 张文韬 张敬之 余沛玥 马福忠 金银玉 单进勇 黄翠婷 陈涛 卞阳 杨天雅 胡姣姣 李博编审: 郑华祥 艾龙 强锋 吴叶国 马利 黄本涛 郭栋 刘宝龙 王东 主编单位: 中国建设银行股份有限公司 参编单位: 建信金融科技有限责任公司 上海浦东发展银行股份有限公司中国银行股份有限公司 浙商银行股份有限公司北京数牍科技有限公司同盾科技有限公司 上海富数科技有限公司 联易融数字科技集团有限公司深圳市洞见智慧科技有限公司天融信科技集团股份有限公司深圳微言科技有限责任公司 目录 一、背景和意义1 (一)研究背景1 (二)研究意义2 二、公共数据市场情况7 (一)概念和分类7 (二)政策及法规11 (三)公共数据应用模式16 (四)公共数据产业发展情况18 三、问题与挑战23 (一)合法合规23 (二)数据安全24 (三)质量保障28 四、公共数据在金融领域应用情况31 (一)概况31 (二)数据接入能力32 (三)数据安全保障35 (四)数据质量保障46 (五)业务应用场景53 (六)业务应用事例58 五、发展与建议61 (一)法律政策趋势61 (二)技术发展趋势62 (三)发展建议64 引言:党中央、国务院高度重视公共数据体系建设,不断推进数字政府建设,加强公共数据汇聚融合、共享开放和开发利用。 2021年,发布《国务院办公厅关于建立健全政务及公共数据共享协调机制加快推进数据有序共享的意见》;2022年,党中央、国务院先后印发《国务院关于加强数字政府建设的指导意见》、 《全国一体化政务大数据体系建设指南》和《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》;2023年组建国家数据局标志着公共数据开放共享进入新阶段。金融行业属于数据密集型领域,具有天然数据禀赋,积极响应国家对于数据要素市场建设的要求,强化数据的创新利用,以数据为关键要素,以价值释放为核心,加速数据要素市场的流通,加强内、外部数据的融合应用,如何在合法合规的基础上引入与应用公共数据,发挥公共数据要素价值已成为当前焦点。本文通过对我国公共数据的现状、特点进行梳理和总结,重点对政务及公共数据建设情况、金融机构的应用情况进行了深入调查和分析,并结合公共数据应用实践,提出公共数据接入、共享及应用的关键点和技术要求,供参考借鉴。 一、背景和意义 (一)研究背景 公共数据作为社会数据资源的重要组成部分,具有高权威性、高准确率、高可信度,在金融服务、医疗健康、城市治理等场景中具有极高的价值和市场需求,其开放利用已成为国际上备受瞩目的数据治理新方向。公共数据价值释放既是推动经济发展、完善社会治理、提升政府服务和监管能力的需要,也是数字经济全球竞争背景下增强国家竞争力的重要抓手。中国政府积极推进公共数据开放应用,着力提升公共数据治理水平,在政策制定、平台系统建设、数据共享开放、数据开发应用等方面开展大量实践并取得积极进展。2020年,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》提出“推进政府数据开放共享”,将数据开放作为经济社会快速发展的重要因素;2021年, 《中华人民共和国国民经济和社会发展第十四个五年规划和 2035年远景目标纲要》将公共数据开放共享确定为“十四五”时期重点任务之一,明确提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用”。相关文件的出台,立足推动数据要素流通和市场化发展的价值目标,提出数据分级分类授权思路,强调要对各级党政机关、企事业单位依法履职或提供公共服务过程中产生的公共数据加强汇聚共享和开放开发,强化 统筹授权使用和管理,推进互联互通,明确公共数据的整体治理思路。 同时,各地各部门也都在加速公共数据开放进程,积极建设地方性公共数据开放平台,各地先后出台《上海市公共数据开放暂行办法》、《北京市公共数据管理办法》、《浙江省公共数据条例》、《广东省公共数据管理办法》等地方性法规和政府规章制度。据不完全统计,截至2021年,中国省级地方政府出台的 公共数据治理相关政策已达146项,年投入资金超过28亿元, 地市级及以上政府上线的公共数据开放平台达193个,为全面推动公共数据开放提供政策供给与制度安排。 从实践效果上看,政府依托数据采集打造公共数据资源库,数据存储方式向集约化存储深化推进,多层级数据流通框架初步构建,依托大数据平台围绕城市治理、环境保护、生态建设、交通运输、食品安全、金融服务、经济运行等应用场景开展数据分析应用,以服务场景为牵引推动数据融合,提供多样化共享服务。 (二)研究意义 目前,中国公共数据政策体系正在逐步搭建,在政务决策、治理、应用服务等各个环节发挥的作用日益凸显,但是从实际情况来看,公共数据开放度仍然较低,企业使用的公共数据占比不高,利用程度与市场需求之间仍存在较大缺口。目前存在的问题,主要包括以下方面: 1.公共数据开放的基础设施及生态建设有待完善 第一,开放的公共数据可用性较低,影响开发用效果。数据可用性是数据开发利用的前提条件,直接关系到数据开放后的使用效果。因此,国际上在推进公共数据开放时均会设置相应的开放标准,如2007年总部位于英国的开放知识基金会下设的开放政府工作组(OpenGovernmentWorkingGroup)首次提出了公共数据获取和开放的八项标准:完整性、原始性、及时性、可获得性、机器可读、非歧视、非财产性、免于许可。2015年,《国际开放数据宪章》进一步提出了公共数据开放的六大准则:默认开放、及时全面、可获取和可使用、可比较及客户操作、改善政府治理及扩大公民参与、包容性发展与创新,以此来为公共数据开放提供可用性保障。但从实际执行情况来看,目前各国开放情况均不理想,达标的开放数据总量几乎仍然处于停滞状态。目前,中国各地数据开放平台的数据普遍存在碎片化、低容量、更新慢或不更新、未使用开放许可、机器不可读等问题,严重影响了公共数据的开发和利用。 第二,支持公共数据高效率调用、深层次开发与利用的基础能力和平台尚不完善。目前,中国部分地区建立了省级、地市级数据开放平台,归集了部分公共数据并开放其统计数据集以供查询和下载,但受资源预算和技术能力掣肘,海量的原始数据的归集、加工与开发应用尚未形成规模。例如,浙江、上海、深圳等地的平台虽然提供了API接口,但是普遍存在接口调用难度高, 可调取的数据容量小、更新频率低等问题;海南、北京等地虽然已经在积极探索打造公共数据开发应用平台,但是绝大多数平台尚不具备足够的数据处理能力,在数据接入过程中,经常出现系统间调用容量受限、服务稳定性得不到有效保障、需要反复重试等问题。当前,中国不同地区的公共数据运营模式虽然各不相同,但是大多由于缺乏明确的路径指引而导致各地在深层次发展上面临着诸多困境,因此,对基础性平台和深度开发能力的建设很难取得实质性的进展。 第三,数据产品和数据服务丰富程度和定制化程度仍有待加强。目前,中国公共数据产品和服务模式单一,地方的公共数据开放门户网站更多是服务于公众对统计数据集的查询和下载,细颗粒度的数据开放不足。此外,通过数据开放平台开放的动态数据占比较低,开放的公共数据商业化应用有限。结合当前中国公共数据开放的实践来看,中国公共数据运营被归纳为“行业主导模式”、“区域一体化模式”、“场景牵引模式”,其中以前两者为代表,反映出当前中国公共数据产品中存在以“供给导向”为主、与产业需求匹配度不够高、缺少紧密结合产业需求的有针对性的产品设计和开发等问题。以金融场景为例,由于不同金融机构在对待同类数据的对客方式、使用场景、风控机制上各有不同,所以目前数据接口标准化难以快速适应金融市场的需求。开放银行模式为丰富数据服务类型提供了宝贵的模板,然而金融系 统之外的部门,囿于价值回馈方式的不同,这种数据共享机制很难被直接复制和借鉴。 2.公共数据开放面临数据安全挑战,掣肘数据开放进程 公共数据的开放在创造经济社会价值,提高政府治理能力的同时,还面临着数据安全风险与合规的挑战。2005年,美国某医疗机构因其员工违规操作导致患者信息大批量外泄;2017年,因美国健身软件发布用户定位的热力地图,导致美军军事基地及作战信息泄露;Facebook(现更名为Meta)继被指控利用数据操纵美国大选后再次暴露出风险隐患,超过5亿用户信息被泄露甚至被非法销售等等。上述事件在推动美国等国进行数据安全立法的同时,也为公共数据的开放利用敲响了警钟。《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》三大支柱性立法的出台,为中国数据的安全流通提供了制度保障。但在发展层面,配套的开放制度却尚未建立,这也导致公共数据开放缺乏安全可行的规则指引,数据安全和个人信息保护成为悬在各地政府头上的达摩克利斯之剑,在客观上限制了公共数据的开放。 3.公平有效的公共数据开放模式尚未形成影响利用效果 中国公共数据开放处于起步阶段,相关机构和企业对于公共数据开放持较为谨慎的态度,虽然我国基本构建公共数据授权开放的基础框架,各地政府也在不断探索开放利用机制,但是具体的实施措施仍然有待建立。目前,受限于数据安全要求、技术水 平等方面的因素,公共数据在利用上存在失衡的现象,部分地区对于公共数据的开放力度和影响有限,难以形成常态化、规模化、市场化的公共数据开放生态。此外,在公共数据开放过程中,由于欠缺规范的运营机制,数据资源提供方、数据开发服务商往往拥有优先获得开发利用的权利,且利用这一优势实现不当获利的情形也时有发生,破坏了数据的公共属性。另外,相关机构面对大量数据需求的服务能力仍有待提高。因此,公共数据开放的步伐较慢或者有选择性地开放数据,其中较明显的是更倾向向国资企业、大型机构开放,因此也造成公共数据开放利用过程中不同主体面临不同处境。这种数字鸿沟亦成为数据要素市场基础设施建设中的重要掣肘与重点关切。例如,电力等能源数据仅向大型银行开放,对中小微型金融机构准入设有限制,影响了实际利用效果,很难切实满足行业需求,中小微型金融机构难以实质性分享公共数据开放红利,不利于公共数据价值的充分释放。 本文重点针对上文所列的问题,并结合我国公共数据的现状、特点进行梳理和总结,重点对国家十余个部委及其各分支机构、各省市地方政府数据建设情况及各金融机构的应用进行深入调查和分析;并结合公共数据应用实践,提出公共数据成功接入、共享及应用的关键风险点和技术要求,供参考借鉴。 二、公共数据市场情况 (一)概念和分类 数据开放背景下的公共数据,最初指政府数据、政务数据,其内涵呈现出公共机构主体和行政职权行为属性。随着我国数据要素流通战略的深入推进,公共数据概念呈现出明显的扩张化态势,“公共数据”由原来所指的“公共的”数据,扩展为“具有公共价值的”数据,由此,企事业单位、社会团体的数据被纳入到公共数据开放制度的调整范围。 现阶段,相关地方政策和标准中已对公共数据进行初步的定义,本文挑选部分政策和标准进行示例,如表1所示。 表1:现阶段公共数据相关定义归纳 政策/标准文件名 定义内容 《广东省公共数据管理办法》 是指公共管理和服务机构依法履行职责、提供公共服务过程中制作或者获取的,以电子或者非电子形式对信息的记录 《江苏省公共数据管理办法》 是指本省各级行政机关、法律法规授权的具有管理公共事务职能的组织、公共企事业单位(以下统称公共管理和服务机构)为履行法定职责、提供公共服务收集、产生的,以电子或者其他方式对具有公共使用价值的信息的记录。 《浙江省公共数据开放与安全管理暂行办法》 是指各级行政机关以及具有公共管理和