您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[翼方健数]:隐私安全计算平台翼数坊,落地应用实践 - 发现报告
当前位置:首页/其他报告/报告详情/

隐私安全计算平台翼数坊,落地应用实践

2021-11-18曹华翼方健数持***
隐私安全计算平台翼数坊,落地应用实践

翼方健数 联合创始人& 首席产品官 曹华隐私安全计算平台翼数坊XDP落地应用实践2021|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 01隐私安全计算技术不是单一技术,而是系统工程|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 数据是智能时代最活跃的生产要素农业时代最活跃的要素是土地工业时代最活跃的要素是资本智能时代最活跃的要素是 数据最活跃要素是生产率提高最快、对经济增长边际贡献最大的要素,是社会资源配置围绕的中心、国家竞争力的要害。谁能把握和管理好最活跃要素,谁就能更好地推动经济社会发展和人类进步。难以预计价值增值有限自然资源自然资源过渡到人造虚拟资源人造虚拟资源|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 数据作为一项新的生产要素 信息时代的遗留物• 质量参差、收集目的不同、非标准化的、非结构化的、相互隔离 独特的经济学特征• 虚拟的• 非竞争性的• 高昂的固定成本,低廉的可变成本• 外在性:时间、环境、应用程序、网络效应• 可再用的 数据的非经济学维度• 隐私、合规、机密、安全DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 数据需要保护和隔离 vs 数据产生的价值在于联合计算和分析数据本质上不能安全流通数据不流通流通的是数据价值计算价值协同作用数据与模型的共生性“数据即知识”权责不清可复制性外部依赖性隐私与机密需求数据流通的障碍|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 010203传统的IT架构面向单一实体存储:文件系统,数据库计算:私有服务器应用:报表,账单......信任假设:由系统管理员控制云时代的IT架构将储存和计算外包给公有云信任假设:信任自己,信任云服务商在数据成为一种生产要素的时代,IT怎么办?需要利用其他公开或私有的数据,产生更多的价值需要尝试各种算法在数据上抽取模型和预测趋势需要利用多种计算资源降低成本,提高生产力需要将从数据中得到的洞察提供给更多应用,服务更多客户信任假设:不信任众多的数据和算力提供商,不信任应用,不能泄露自己的原始数据和客户隐私 数据计算和处理数据存储和管理应用应用应用应用数据的价值:从传统IT、云计算、到数据要素时代|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 输出:灵敏度90%特异性95%筛查评估模型查询原始数据返回原始数据传统医疗数据平台输出:灵敏度90%、特异性95%A医院数据B医院数据...数据查询原始数据返回原始数据医学统计公司A医院数据B医院数据...数据查询筛查有效性隐私安全计算平台医学统计公司筛查评估模型传统方式:原始数据离开数据平台,失去对于隐私和安全的保护隐私安全计算方式:原始数据从不离开数据平台,数据在平台内授权使用,平台只输出数据的价值数据分享和协作理念:隐私安全计算|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 能够在特定的信任假设下在保护数据所隐含的隐私和机密,避免数据资产的流失、转移和失控的前提下,实现和分享数据价值的技术、产品和方法,即为「隐私安全计算」。隐私安全计算|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 多方安全计算MPC/同态加密联邦学习HOW:1)横向:每个参与者在本地训练计算自己样本,只分享模型训练的梯度2)纵向:各参与者训练各自的embedding,共同训练上层模型安全沙箱计算/TEE差分隐私区块链...对抗神经网络不分享原始数据,分享数据价值HOW:1)采用秘密分享、混淆电路、遗忘传输等方法将软件转化为逻辑阵列后进行安全计算2)密文计算HOW:1)利用可信任执行环境TEE防止操作系统恶意地查看应用执行环境的内容2)利用安全沙箱防止恶意应用通过特殊调用控制操作系统 如果没有一个可信的第三方,如何让多个数据所有者共同参与,安全地完成协同计算 如何让多个相互不信任的数据拥有方不必共享数据的基础上联合进行模型训练 如果有一个,或者可通硬件建立一个可信任的第三方,让多个相互不信任的数据所有者共享数据进行计算云计算Privacy Computing隐私安全计算包含前沿计算机科学技术|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 隐私安全计算场景 Privacy Computing Technology, PCT输出:灵敏度90%特异性95%筛查评估模型查询原始数据返回原始数据传统数据平台输出:灵敏度90%、特异性95%A机构数据B机构数据...数据查询原始数据返回原始数据医学统计公司A机构数据B机构数据...数据查询有效性隐私安全计算平台医学统计公司筛查评估模型应用传统方式:原始数据离开数据平台 ,失去对于隐私和安全的保护隐私安全计算方式:原始数据从不离开数据平台,平台只输出数据的价值隐私安全计算的挑战应用方如何发现数据?应用方如何获得数据的使用权?应用方在看不到原始数据之前,如何决定是否愿意(付费)获取授权?各个机构数据可能有不同的格式和字段,应用方如何有效使用这些数据?应用方如何保证自己的模型IP不被平台管理员盗用?数据提供者如何信任数据在平台上存储安全?数据提供者如何保证模型应用不将数据传出平台?如何衡量各个数据源对模型的贡献?如何保证模型产生的价值的分配?如何在训练好的模型不断对外输出服务的过程中保证没有数据隐私泄露?......隐私安全计算解决数据开放共享和隐私安全保护的矛盾|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 数据和计算互联网提供的是数据从产生到价值体现的全流程解决方案,是一项复杂的系统工程常见的误区是数据产生即可使用,而现实是数据通常要经过漫长的数据加工链路才能达到可使用的状态数据加工链路中需要多方的数据及算法贡献每个计算环节有着各自的安全信任假设及计算环境需求,平台必须为不同场景提供相应的安全计算环境数据价值体现的终极形式是数据资产化,而数据资产化必须依赖平台提供的全套确权、定价、交易、以及价值分配的能力全流程快速应用互联互通计算环境数据资产化隐私安全计算的挑战——系统工程|DataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummitDataFunSummit 02发现、实现、分享数据价值从单体平台到联盟的实现及案例分享|DataFunSu