您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[北京金融科技产业联盟]:FATE隐私计算开源框架金融行业技术应用报告 - 发现报告
当前位置:首页/行业研究/报告详情/

FATE隐私计算开源框架金融行业技术应用报告

FATE隐私计算开源框架金融行业技术应用报告

FATE隐私计算开源框架金融行业技术应用报告 TheApplicationandDevelopmentReportofOpenSourcePrivacyComputingFramework(FATE)inFinancialIndustry 北京金融科技产业联盟 2023年1月 前言 本报告由北京金融科技产业联盟开源专业委员会组织编写并拥有相关版权。凡转载、引用、摘录或以其他方式利用本报告观点、内容、图表的,都应注明“引用来源:北京金融科技产业联盟”。 编制委员会 主任: 潘润红 编委会成员(按姓氏笔画排序):杨强涂晓军聂丽琴鲁金彪编写组成员: 夏知渊 丁文定 苗天麒 范涛 葛娴 高鹏飞 陈东熠 周雍恺 张远健 丁锐 徐梓丞 周柚池 李艳 黄安埠 梁晔华 胡玉杰 刘微 王鹏 霍昱光 樊昕晔 李钰 申超波 张国庆 刘文懋 徐安滢 张宏 高翔 胡达川 李寻 耿航 程勇 李克鹏 杨扬 统稿:丁文定参编单位: 北京金融科技产业联盟、中国工商银行股份有限公司、深圳致 星科技有限公司、深圳前海微众银行股份有限公司、中国银联股份有限公司、中国银行股份有限公司、建信金融科技有限责任公司、光大科技有限公司、广发银行股份有限公司、北京神州绿盟科技有限公司、中国农业银行股份有限公司、腾讯云计算(北京)有限责任公司 另有以下单位也为本次报告编制分析提供了行业案例参考: 中国邮政储蓄银行股份有限公司、交通银行股份有限公司、平安银行股份有限公司、上海浦东发展银行股份有限公司、兴业银行股份有限公司、华夏银行股份有限公司、泰康保险集团股份有限公司、星环信息科技(上海)股份有限公司、同盾科技有限公司、上海同态信息科技有限责任公司、神谱科技(上海)有限公司、神州融安数字科技(北京)有限公司 感谢以上机构及人员对本报告编写的大力支持! 目录 概述5 一、研究背景7 (一)数据需求推动发展8 (二)开源成为重要途径9 (三)政策环境提供支持10 二、主流开源隐私计算框架介绍12 (一)特点概况12 (二)应用情况16 三、金融业隐私计算开源生态建设现状21 (一)发展历程21 (二)路径及形式22 (三)痛点和需求25 (四)隐私计算开源生态位全景图27 四、FATE开源框架技术分析30 (一)框架特点30 (二)一站式解决方案32 (三)灵活适配36 (四)云原生36 五、未来展望38 (一)技术发展展望38 (二)生态建设展望40 参考文献43 附录:FATE开源框架的典型应用案例44 (一)应用概况44 (二)应用场景44 概述 近年来,我国《数据安全法》《网络数据安全管理条例》《个人信息保护法》陆续出台,数据安全已经迈入了重要发展阶段。在充分保护数据和隐私安全的前提下,隐私计算技术实现不泄露数据本身的情况下,对数据进行分析与计算,满足数据“可用不可见”的要求,促进数据价值的转化和释放。2022年,隐私计算技术体系不断完善,行业标准日趋统一,应用场景逐渐丰富,实践案例不断增加,隐私计算技术蓬勃发展。 金融行业是隐私计算技术应用落地的最重要领域,金融机构在数字化转型升级中有着强烈的数据流通需求,迫切需要打破数据流通的壁垒,实现数据融合运用。金融机构通过开源共建方式能够解决互信协作难的问题,但如何在保障用户隐私安全同时,释放数据要素价值,成为金融机构必须面对的挑战。 回顾隐私计算技术的发展历程,开源模式已经成为隐私计算技术创新及产业协同发展的重要驱动力,极大促进了隐私计算技术的进步与融合。开发者们通过大量的落地案例及场景应用实践,对开源隐私计算框架进行持续的技术验证与创新,不断推进开源隐私计算技术快速发展与完善。同时,我国形成了以FATE为代表的隐私计算开源社区,各大院校、科技企业、科研机构、协会团体、金融机构等积极参与其中,共建隐私计算开源生态,为隐私计算产学研用的深度融合起到了良好的示范及推动作用。 从长期来看,开源是促进隐私计算技术互联互通的重要模式,也是隐私计算技术规模化发展的必要途径。在政策层面,国家和金融行业积极鼓励开源创新;在技术层面,开源有效加速构建隐 私计算生态,降低技术开发门槛,促进行业标准统一及互联互通,并推动隐私计算技术朝着更安全、更可信、更普惠的方向稳步发 展;在行业应用层面,开源隐私计算技术已经在金融、政务、医 疗等领域中具备丰富的成功案例,并通过大量的实践案例持续反哺技术的不断成熟。 本报告对主流隐私计算开源框架和金融业隐私计算开源生态建设现状进行研究,结合金融业对隐私计算技术的实际场景需求,以业界影响力较大的FATE隐私计算开源框架为研究对象,通过丰富的实践案例,探索金融业对隐私计算开源框架的通用技术能力要求,为隐私计算开源框架更好地适配金融业数据流通需求提供指导和建议,从而实现金融业隐私计算技术需求与开源技术框架供给的双向循环和良性互动。 一、研究背景 随着大数据时代的到来,数据的价值得到越来越深的发掘,数据的应用方式更加多样化,数据正和土地、劳动力、资本等生产要素一样,成为促进经济增长和社会发展的基本要素。在数据要素的经济价值和战略价值愈发重要的同时,数据安全、隐私保护引发的“数据孤岛”问题也愈发凸显。隐私计算技术因具有“数据可用不可见”的特性,能够充分发挥数据要素价值,促进数据要素安全流通。开源能够降低隐私计算技术的应用门槛、增强软件安全性、打破“计算孤岛”,是隐私计算技术规模化的重要途径,对数据要素市场的建设有着积极推进作用。 金融行业是最早应用信息技术的产业之一,从上世纪80年代的ATM机到近年的开放银行,金融行业已经产生、收集、积累了大量的数据[1]。同时,金融行业也是可以最大化利用数据价值的行业之一,从个人征信到公司估值,从价值投资到技术分析,金融行业想提供高效服务、赋能实体经济,离不开对数据的合理使用。随着金融行业对多维度数据需求的增加,和数据安全、隐私保护重要性的提升,全行业亟需安全、易用、普适的数据要素流通解决方案。在金融数据要素流通需求的推动下,金融机构开始逐渐参与开源隐私计算框架的开发与共建,促进机构数字化转型升级工作。 (一)数据需求推动发展 数据作为战略性和基础性资源,是数字经济体系中技术创新、需求挖掘、效率提升的重要动能[2]。数据虽然在不断地创造价值,但其存在的隐私泄漏、安全合规等潜在问题,引起了社会各界的广泛关注。金融行业作为数据密集型行业,天然具备数据流通的大规模应用场景和更严格的管理要求,因此,数据的安全合规流通需求推动了隐私计算技术在金融行业的发展。 1.金融行业隐私计算的必要性 在新的数据监管要求下,金融机构认真做好用户隐私保护和数据安全,但也出现了“不敢、不愿、不得”共享数据和数据流通不畅的情况,金融机构无法通过便捷引入互联网公司的行为数据,丰富自身数据项及数据维度,解决数据存在片面、单一等问题,提升金融服务的质量和效益。金融机构难以获取外部数据,导致智能化程度受限,如何保障用户隐私,同时保障数据权属问题成为挑战。而隐私计算技术可以实现金融机构内部、同业之间、甚至跨行业的数据合作与共享,满足金融机构迫切打破数据流通壁垒的需求,实现金融数据融合运用的解决方案。 2.隐私计算在金融行业的应用场景 金融行业存在大量的多维度、高价值的数据,这一类数据通常具备极强的金融属性,但缺少行为数据、场景数据等。而大型互联网公司、运营商等机构通常有大量的行为数据与场景数据,金融机构可通过联邦学习、多方安全计算、可信执行环境、同态加密等隐私计算技术,在保证原始数据不泄露的情况下,与之进 行联合建模,提升金融业务效果。例如,在联合营销方面,联合 各方数据构建营销模型,进一步丰富用户画像,制订更加精准的营销策略,实现多赢的联合营销效果[3]。在联合风控方面,一方面通过融合多个金融机构数据,可以解决单一机构数据量有限的 问题,形成全局风控模型,提升模型精准度;另一方面,综合利用金融机构同其他行业数据,可以在各方原始特征不出域的前提下建立风控模型,形成对业务的多维度认识,提升风控质量。 (二)开源成为重要途径 随着数据要素流通体量的增长,隐私计算技术面临规模化、产业化的重要挑战。开源隐私计算技术通过开放、连接、协作、共创等方式,有效重塑隐私计算生态,加速行业标准统一,促进行业互联互通,并推动隐私计算技术朝着更安全、更可信、更普惠的方向稳步发展。 1.开源促进数据流通融合进程 近年来,闭源隐私计算厂商技术百花齐放,但因彼此技术理念、技术框架、技术路径及数据连接生态不同,导致在解决“数据孤岛”问题之后,出现了不同厂商产品无法协作的问题。而开源隐私计算社区则通过打造通用开放的隐私计算技术框架,统一计算、存储、通信、流程编排、任务调度、运维部署等标准,实现不同计算节点之间数据、算法、模型、算力等层面的互动和协同,让隐私计算开发者向一个共同的标准靠拢,以达到系统互联互通的效果,成为加速隐私计算行业发展的重要路径。同时,社区通过统一运营的方式整合多方资源,重塑隐私计算数据参与方之间及数据参与方与技术提供方之间的生态关系,使生态中的数据节点彼此资源共享、优势互补,最大化释放数据要素价值。 2.开源实现隐私计算技术安全可证明 当前,我国隐私计算技术面临着安全证明难、模型监管难等问题。一是近年来数据流通过程中存在大量的用户隐私及用户原始数据泄漏案例,加剧了用户对企业数据使用的不信任感;但闭源隐私计算技术及第三方机构安全认证难以彻底解决安全可证明、模型可监管等问题。二是我国现有监管法律制度,对数据流 通的监管全过程,尚未提出明确的参考指引和实操指南,数据流通合规性难以把控。 开源隐私计算框架由于其开放共享、公开透明、共创迭代等特性,可以有效解决隐私计算技术提供方本身潜在的作恶风险,以及技术平台与数据源合谋作恶等问题,从而满足安全可证明,模型可监管等要求。并且,算法的设计离不开新的场景应用,开源可以让广大用户在不同应用场景下对系统进行监督和贡献,使得安全性不断在场景训练中持续提升。 3.开源助力隐私计算技术普惠 隐私计算技术复杂度较高,研发和部署存在一定门槛。开源社区具备天然的知识共享土壤与多方协同机制,能够加速隐私计算技术持续升级和商业化发展,高效提升产品版本迭代效率,进而不断增强隐私计算的场景适配性,从而降低隐私计算行业进入门槛和企业隐私计算资源重复建设成本,助力技术普及加速。 近年来,国内外许多机构积极拥抱开源,并投入大量资源到开源项目的研发与贡献中。特别是以联邦学习为核心的开源项目,在隐私计算产业化落地进程中贡献了巨大力量。目前55%的国内隐私计算产品是基于或参考开源项目开发的,其中,开源项目以FATE为主1,很多联邦学习类产品或多或少吸收和借鉴了FATE供给的营养。 (三)政策环境提供支持 2021年3月,《中华人民共和国国民经济和社会发展第十四 个五年规划和2035年远景目标纲要》(以下简称《目标》)提出“支持数字技术开源社区等创新联合体发展”,开源被首次写入国家战略规划。《目标》还将数据和技术与土地、劳动力、资本一并纳入要素市场化改革范畴。同年,央行等五部门发布《关 1数据来源:中国信通院《隐私计算白皮书(2021)》 于规范金融业开源技术应用与发展的意见》(以下简称《意见》),鼓励金融机构将开源技术应用作为提高核心技术自主可控能力的重要手段。2021年央行印发的《金融科技发展规划(2022-2025年)》(以下简称《发展规划》)将“充分释放数据要素潜能”列为未来四年八项重点任务之一,要求“推动数据有序共享”。 基于“统一大市场”和“数据要素潜能”两方面代表性政策态势,为开源隐私计算框架应用于金融行业营造了良好互促的条件和氛围。 首先,统一大市场建设客观上加速了隐私计算技术应用。中 共中央国务院于2022年发布的《关于加快建设全国统一大市场的意见》明确界定了统一大市场的要义,即“促进商品要素资源在更大范围内畅通流动……为建设高标准市场体系、构建高水平社会主义市场经济体制提供坚强支撑”。各行业积极响应国家、部委层面关于数据要

你可能感兴趣

hot

2021隐私计算金融应用调研报告

北京金融科技产业联盟2021-10-28
hot

金融行业:金融业隐私计算安全验证技术研究报告

金融
北京金融科技产业联盟2024-01-02
hot

2023金融业隐私计算联合建模技术与应用研究报告

信息技术
北京金融科技产业联盟2023-12-10
hot

隐私计算金融应用白皮书

金融信息化研究所2023-03-15