金融业隐私计算安全验证技术研究报告 北京金融科技产业联盟 2023年12月 版权声明 本报告版权属于北京金融科技产业联盟,并受法律保护。转载、编摘或利用其他方式使用本报告文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。 编制委员会 编委会成员: 何军聂丽琴杨晓辉 编写组成员: 张翼飞石新蕾卞阳杨天雅王超胡静洁周建平毛娟黄司辉黄一珉王湾湾李博陈嘉俊张敬之曹旭涛王云河靳晨张嘉熙单进勇金银玉蔡超超陈浩栋宋雨筱刘尧张亚申黄翠婷陈涛康和意杨波邱晓慧胡师阳李克鹏陈明刘站奇高志民邵云峰李秉帅蒋美献顾逸晖昌文婷袁鹏程王磊周雍恺李定洲张远健杨柳张佳辰黄东庆于博 编审:黄本涛郭栋刘宝龙 参编单位: 中国银行股份有限公司上海富数科技有限公司 蓝象智联(杭州)科技有限公司中国工商银行股份有限公司 深圳市洞见智慧科技有限公司浙商银行股份有限公司 华控清交信息科技(北京)有限公司北京数牍科技有限公司 北京冲量在线科技有限公司同盾科技有限公司 北京银联金卡科技有限公司 腾讯云计算(北京)有限责任公司华为技术有限公司 蚂蚁集团股份有限公司中国银联股份有限公司深圳致星科技有限公司上海光之树科技有限公司 目录 一、概述1 (一)研究对象2 (二)研究目标与原则5 (三)研究内容与思路6 (四)研究意义7 二、应用现状8 (一)数据安全相关法律法规日趋严格8 (二)隐私计算国内外相关标准专项化11 (三)金融领域隐私计算应用痛点20 三、隐私计算系统及产品安全验证技术21 (一)安全风险21 (二)安全验证技术39 (三)验证方式46 四、未来发展趋势及建议49 参考文献56 摘要:隐私计算从技术角度上可以有效解决数据融合应用与数据隐私安全之间的矛盾,为数据安全保护提供了一种可行的技 术路径。隐私计算技术落地化、产品化后面临更复杂的产品、系统、应用层面的安全风险,目前金融领域的隐私计算通用安全验证技术尚未有统一的研究,因此,本报告对隐私计算安全性验证技术进行研究,分析多个层次的安全风险项,重点关注金融领域的隐私计算可实现工具化的安全验证技术,梳理可验证方式,验证隐私计算在金融应用中是否满足协议一致性要求、输入输出数据和中间数据是否满足加密要求、通信信道是否安全,并以可视化方式展示隐私计算内部流程,使得整个过程变得更加透明可控,保障金融领域隐私计算安全应用。 一、概述 多方数据融合利用能够发挥数据最大价值,释放数据作为数字经济时代关键生产要素的潜能,而多方数据融合总是涉及数据隐私安全问题,数据共享容易产生隐私数据和商业秘密泄露,诱发金融企业利益损失、个人财产盗窃等安全事件,相关责任主体面临违反隐私法律法规、遭受经济处罚的风险,严重时可能会影响社会公共安全甚至国家安全。 数据信息安全是金融领域数据要素安全融合、互联互通的关键所在,金融机构需在保证使用目的与方式可控前提下传递数据的金融使用价值。隐私计算技术能够实现数据要素安全流通中隐私安全、管控数据使用目的与方式,促进数据生态闭合。 隐私计算(Privacy-PreservingComputation),是指在提供隐私保护的前提下,通过协作对多方的数据进行机器学习和数据计算分析,实现数据价值挖掘的技术体系。隐私计算成为构建数据要素流通基础设施的关键技术,能够实现数据安全融合,使“数据可用不可见”“按用途用量使用”,从技术角度上可以根本解决数据融合利用和数据隐私安全之间的矛盾,为数据安全保护提供了一种可行解。但隐私计算自身不同算法协议能保证的安全程度不同,同时隐私计算技术落地化、产品化后也面临更复杂的产品、系统、应用层面的安全风险。包括:如何验证隐私计算协议本身是安全的,如何防止数据泄露;如何验证隐私计算的实 现与声明的计算协议是一致的,如何验证交互的数据未包含敏感信息且无法推测出原始数据;隐私计算需要参与方之间的多轮通信,在这期间通信信道是否安全;在有第三方的架构中,如何验证第三方是否可信;产品能否抵抗参与方进行数据投毒、模型投毒;隐私计算的结果数据是否泄露敏感信息等等。 隐私计算在金融领域应用的一大关键问题是应用方对其安全性的认同。隐私计算安全性不仅包括通用的网络层、主机层的安全性,还包括硬件安全、密码安全、算法安全、应用安全等系统/产品应用的安全性,涵盖隐私计算系统/产品整个生命周期,需要全方位考虑。目前金融领域的隐私计算通用安全验证技术尚未有统一的研究,因此,本报告对隐私计算系统/产品安全性验证技术进行研究,分析多个层次的安全风险项,梳理可验证技术,实践、论证可验证方式,验证隐私计算在金融应用中是否满足协议一致性要求、输入输出数据和中间数据是否满足加密要求、通信信道是否安全,并以可视化方式展示隐私计算内部流程,使得整个过程变得更加透明可控,推动隐私计算技术在多领域的广泛应用。 (一)研究对象 对现有学术成果、技术应用进行高度抽象,描述金融领域最大范围隐私计算通用系统/产品的工程安全性要素及其所包含的整体范围,形成具有通用性的隐私计算安全验证技术论证结果。 广义隐私计算是面向隐私信息全生命周期保护的计算理论和方法,涵盖信息所有者、信息转发者、信息接收者在信息采集、处理、发布(含交换)、销毁等全生命周期过程的所有计算操作,是实现隐私保护前提下数据安全共享的一系列技术,技术体系如图1所示,包括但不限于: 1.隐私计算技术 从技术应用方向来分,当前主流应用技术包括多方安全计算 (MPC)、联邦学习(FL)、可信计算(TEE),还包括同态加密、零知识证明等辅助技术。按技术层次来分,隐私计算技术划分为应用技术和安全保护技术。这些技术分离了数据的持有权和使用权,实现多方数据在保护隐私的前提下联合计算,使数据需求在不接触原始数据的情况下获得数据的增值价值,降低隐私泄露风险。 我们从技术特点、数据处理、安全基础三个角度对比分析隐私计算的三大主流技术在安全性能方面的不同应用形式,如表1。 表1隐私计算技术路径对比 对比项 MPC FL TEE 技术特点 侧重于基于特定规则的多方安全数据的通用安全数据加密计算分析,提供隐私求交、隐匿查询、联合统计等应用 侧重于多方数据的分布式机器学习模型训练和推理,提供特征工程、模型训练和推理预测的应用 侧重于多方数据的通用安全数据加密计算分析,提供可信信道、远程证明等功能 数据处理 各方数据在各方本地加密后交换,依 不交换原始数据,原始数据在本地模型训练, 通过硬件提供安全的执行环境,原始数据加密 赖纯密码学协议的实现 只交互模型的中间计算结果 后在“可信环境”中执行,依赖特定硬件环境实现 安全基础 密码学的安全证明 同态加密等安全机制 可信硬件 2.基于数据限制发布的技术 基于数据限制发布的技术,有选择地发布原始数据、不发布或者发布精度降低的敏感数据从而实现隐私保护,包括数据脱敏以及各类去标识化技术(如掩码、抑制、泛化、截断、混淆、k-匿名、l-多样性、t-贴近等)。这类技术保证对敏感数据及隐私的披露风险在可容忍范围内,但是需要考虑隐私披露和可用性之间的平衡,隐私保护的强度越强,丢失的信息就越多,数据的可用性越低。 3.基于数据失真的技术 基于数据失真的技术,通过添加噪音等方法,使敏感数据失真的同时并保持某些数据或数据属性不变,仍然可用保持某些统计方面的性质,包括随机扰动、合成数据技术等。数据失真是一种能够抵御背景知识攻击的隐私保护方法,这类方法不依赖复杂的密码技术,用户计算开销小,并可获得精准的查询结果。 4.辅助融合技术 隐私计算最核心的是计算,但整个数据共享过程以及完整的系统需要借助多个辅助技术支撑,包括区块链、可验证计算、内容跟真实性检验及溯源技术(如数字水印)和访问控制技术等。 4 这些技术虽不是完全实现数据的联合隐私计算,但能在数据共享过程中有效保护个人信息,实现全流程可记录、可验证、可审计、可控制的安全、可控的数据共享,为数据真实性、数据确权等问题提供可行解决方案,如图1所示。 图1广义隐私计算技术体系 (二)研究目标与原则 1.研究目标 重点关注金融领域的隐私计算系统/产品可工具化实现的安全验证技术,保障金融领域的隐私计算系统/产品应用、实施安全性,为形成自动化安全验证工具的实施奠定基础。 2.原则 本报告、制定过程遵循以下原则: 以现有大数据、数据安全、隐私保护相关的法律法规为准绳,与已有标准规范内容保持一致; 覆盖金融领域的隐私计算系统/产品生命周期全过程; 以金融应用为导向,描述粒度能够面向未来金融领域的隐私计算通用安全验证技术,指导工程实践和产品落地。 (三)研究内容与思路 本报告论证内容与思路包括如图2所示: 图2研究内容与思路 1.调研 对现有大数据、数据安全和隐私保护相关法律法规政策,国家、行业、团体标准进行调研,对隐私计算现有成熟学术成果、技术应用情况进行调研,梳理目前隐私计算存在的安全问题; 2.分析安全风险项 对金融领域的隐私计算技术系统/产品安全风险项进行分层分析,包括网络层风险、主机层风险、硬件安全风险、基础密码安全风险、协议密码安全风险、算法安全风险。 3.梳理安全验证技术 从基于TEE的计算安全、区块链、基础性检测、通信数据解析、日志分析、代码审计、可视化等多维度详细描述现有的安全验证技术。 4.提出验证方式 以覆盖金融领域的隐私计算系统/产品生命周期全过程的角度出发,提出一系列隐私计算安全可验证的方式。 5.实践安全验证项 对金融领域现有的隐私计算系统/产品的安全风险项进行安全验证,验证数据在存储、流转、处理中是否符合安全要求。 (四)研究意义 本报告通过对隐私计算技术应用安全现状进行调研,梳理出其安全体系方面的安全风险项和安全验证技术,提出在金融领域 隐私计算系统/产品的可验证项,对隐私计算在更多领域的应用安全探索具有指导意义,可解决客户存在的验证落地和声明是否一致的问题;有利于厂商业务拓展和场景落地,简化参与测评及认证工作;完善了隐私计算安全检测方法,提升测评机构测评能力;打通了多方数据存储、流转、处理中的安全性要素,推动金融领域的隐私计算系统/产品在安全验证技术法律法规的制定,规范隐私计算技术在金融领域的市场应用。 二、应用现状 (一)数据安全相关法律法规日趋完善 随着金融行业数字化的持续发展,金融机构往往持有大量的重要金融数据,数据的安全与风险防范一直是国家和相关监管部门关注的重点。近年来,国内外对于数据监管的法律法规日趋严格,我国数据立法进程不断加快,对金融数据的重视程度不断提高。 2016年11月7日十二届全国人大常委会第二十四次会议表 决通过《中华人民共和国网络安全法》,自2017年6月1日起施行,强调收集的用户信息应严格保密,维护网络数据的完整性、保密性和可用性,实行网络安全等级保护制度。2021年6月10日十三届全国人大常委会第二十九次会议通过《中华人民共和国数据安全法》,自2021年9月1日起施行,强调数据安全与开发利用并重,确立数据分类分级管理制度,多种手段保证数据交 易合法合规。2021年8月20日十三届全国人大常委会第三十次 会议表决通过《中华人民共和国个人信息保护法》,自2021年 11月1日起施行,强调个人信息在数据流通过程中的安全合规,明确了个人信息处理和跨境提供的规则、个人信息处理者的义务等内容。《网络安全法》、《数据安全法》《个人信息保护法》一起,构建了中国网络安全、数据安全、个人信息保护的基础性制度框架。2021年11月14日,国家互联网信息办公室公布《网络数据安全管理条例(征求意见稿)》,对我国的网络数据安全与个人信息保护进行了细化和补充。2022年9月,中央网信办会同相关部门起草了《关于修改〈中华人民共和国网络安全法〉的决定(征求意见稿)》,明显强化了网络安全违法行为的处罚力度。2022年2月15日起,国家互联网信息办公室等十三部门联合修订发布的《网络安全审查办法》正式施行,将数据安全作为网络安全审查的重点考量。 可以预见的是,我国网络安全监管框架正不断完善,国家各项法律法规对