您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[北京金融科技产业联盟]:2023金融业隐私计算联合建模技术与应用研究报告 - 发现报告

2023金融业隐私计算联合建模技术与应用研究报告

AI智能总结
查看更多
2023金融业隐私计算联合建模技术与应用研究报告

北京金融科技产业联盟2023年11月 版权声明 本报告版权属于北京金融科技产业联盟,并受法律保护。转载、编摘或利用其他方式使用本报告文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。 编制委员会 编委会成员: 何军聂丽琴薛勇 编写组成员: 王润元张翼飞袁鹏程王云河王礼斌曹伟昌文婷果伦陈琨单进勇黄翠婷王湾湾黄文邱晓慧李晶晶金银玉张育涵田江王鹏卢春曦洪爵靳晨张垚王健宗胡师阳叶展豪黄一珉时代朱礼李武璐卞阳何浩蔡超超陈浩张志慧统审:黄本涛郭栋刘宝龙 参编单位: 中国银行股份有限公司华控清交信息科技(北京)有限公司蚂蚁科技集团股份有限公司深圳市腾讯计算机系统有限公司北京数牍科技有限公司深圳市洞见智慧科技有限公司光大科技有限公司上海富数科技有限公司网联清算有限公司北京银联金卡科技有限公司中国工商银行股份有限公司中国农业银行股份有限公司中国建设银行股份有限公司中国民生银行股份有限公司深圳前海微众银行股份有限公司建信金融科技有限责任公司北京百度网讯科技有限公司深圳壹账通智能科技有限公司北京融数联智科技有限公司上海光之树科技有限公司华为技术有限公司 百行征信有限公司深圳长亮科技股份有限公司 目录 一、发展综述..............................................................................................................................................1 (一)联合建模概念探讨............................................................................................................................1(二)技术发展历程及驱动力....................................................................................................................6 二、国内外实践情况................................................................................................................................13 (一)国外应用情况..................................................................................................................................13(二)国内应用情况..................................................................................................................................21 三、支撑联合建模应用的隐私计算技术体系..........................................................................................42 (一)隐私计算技术体系简述..................................................................................................................43(二)隐私安全技术当前面临的主要问题及参考解决方案..................................................................56(三)主要建模技术对比分析..................................................................................................................61 四、联合建模通用技术平台参考框架......................................................................................................65 (一)联合建模通用技术平台建设的目的与意义..................................................................................65(二)联合建模通用技术平台的技术架构参考......................................................................................66(三)联合建模通用技术平台非功能指标与设计参考..........................................................................79(四)联合建模通用技术平台关键机制..................................................................................................91 五、联合建模应用分析..........................................................................................................................100 (一)联合建模应用场景分类与特征细分.....................................................................................100(二)联合建模的应用场景的其他分类方式.................................................................................119 六、发展与建议......................................................................................................................................122 (一)当前技术与平台挑战....................................................................................................................122(二)未来技术与平台的发展趋势........................................................................................................125(三)未来应用场景展望与建议............................................................................................................127 参考文献.......................................................................................................................................129 一、发展综述 (一)联合建模概念探讨 1.联合建模的含义 近年来,“联合建模”伴随“数据要素化”“隐私安全”、多方计算等热点领域的研究与应用,不断涌现在各类媒体和大众面前,然而,“联合建模”作为一个专业词汇至今尚无一致的、明确的标准定义。 从字面观其内涵,“联合建模”由“联合”和“建模”两个关键词有机组合而成。 “联合”意指多方共同参与,是完成“建模”的环境和条件。“多方参与”既表示“多方数据”的参与,又表示“建模”过程有不同角色的多个构建方(包括:数据供给方、数据加工方、数据消费方和收益方、数据联邦运营方及管理部门等)。其中,“多方数据”的参与是“联合建模”的前提约束,是“联合建模”的核心要素。如果没有“多方数据”的参与,即使存在多个构建实施方,也多是为了解决资源缺口、专业能力缺口、效率不足与合作伙伴契约关系等项目实施与管理过程问题而采取的分工协作方式。这里的“多方数据”是指“建模”过程的数据集必须由属于多个不同“数据所有权”的数据集组成。同一数据所有权范围内的不同领域数据的集成与加工,应纳入常规“大数据应用”或“机器学习建模”范畴讨论,非本报告主要的研究和论述对象。 (注:文中如不特别指出,“多方数据”均指多方不同数据所有权的数据) “建模”意指构建“模型”的行为,是数据“联合”的目的和价值体现。其中,模型泛指对于某个实际问题或客观事物、规律进行抽象后的一种形式化表达方式。这种形式化的“抽象”表达主要包括“数学模型”“程序模型”“数据模型”和“系统模型”等。通常构建上述“模型”的行为都属于“建模”过程。 综上,本报告将“联合建模”概念明确定义为:基于多方数据所有权的数据集合,由一家或多家数据模型构建方联合构建模型的过程。同时强调: (1)强调“建模”所需数据必须由多方提供的所有权数据组成,而不强调“建模”过程是否一定存在多家构建方。例如,多家数据供给方将所有权数据(加密或未加密)交付给某个数据加工方,由该数据加工方独立完成全部建模工作,此类集中建模的过程同样属于联合建模。 (2)强调“模型”的广义范畴,而非特指机器学习或深度学习的“模型”,也非特指某一种“隐私安全计算”技术。例如,简单的统计分析算法(可以选择使用某种多方计算技术)与较为复杂的“机器学习”“神经网络”(可以选择使用联邦学习技术)都可以算作“联合建模”的模型对象。 (3)强调数据和加工的联合,而未限制必须符合“隐私安全要求”或必须采用某项隐私计算技术。从不加限定的基本概念 上讲,即没有“隐私安全与合规性”要求的前提下,只要能达成业务目标,所有实现“联合建模”的技术手段均可选择。 但是,当前联合建模的应用市场一方面要求数据要素加快实现“共享”与“流通”,而另一方面又面临“数据无限复制”“数据无限供给”“侵犯隐私”“数据确权难”等“数据滥用”、“难以监管”等难题,因此,在明确多方数据“责权利”的基础上,专注研究面向“隐私安全”的联合建模的关键技术、基础设施平台及应用场景,以“可用而不可见”的方式实现多方数据“共享”和多方价值“流通”,更有价值和意义。本报告的研究范围将主要聚焦于面向“隐私安全”的联合建模场景。在展开相关论述之前,下面先就基于“多方数据隐私安全”下的联合建模与“传统”的联合建模作简要对比分析。 2.隐私安全联合建模与传统联合建模的对比分析 传统的联合建模方式是将所有数据汇聚到一处进行建模,并未特别考虑数据所有权因素,因此,从技术上看,这种基于数据汇聚式的联合建模和传统的单方集中数据建模,在技术上并没有本质上的区别。 目前主流的联合建模是通过隐私计算技术,在保证各方数据隐私安全的基础上进行模型训练。也就是说,基于隐私计算技术的联合建模与传统方式的本质区别在于强调了各方数据的隐私安全,具体通过多方协同计算来实现,在数据对齐、特征工程、模型训练等