您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:大数据协同中的隐私与可靠性保护 - 发现报告
当前位置:首页/行业研究/报告详情/

大数据协同中的隐私与可靠性保护

信息技术2022-08-24-腾讯别***
大数据协同中的隐私与可靠性保护

| 大数据协同中的隐私与可靠性保护 腾讯计费平台部张韬 03 目录CONTENT 01 04 数据协同中的安全问题 TEE上的分布式计算 02 可信执行环境 (TEE)简介 区块链协调的数据协同 01 数据协同中的安全问题 数据安全与实用性的两难 数据不能明文跨域互通 可用性 •分布式计算 •数据成为资产、生产资料 •个人信息保护法、GDPR 单一平台无法获得全面的数据 •特征缺失 •样本偏差 密码学算法性能开销较大 •MPC •FL •硬件加速(GPU等) •算法调优 •数据清洗 计算逻辑正确性难以保障 •同态加密 •分布式计算、外包计算机密性可靠性 02 可信执行环境(TEE)简介 可信执行环境(TEE)的安全特性 可用性 数据隐私 数据、计算逻辑、结果完整性 •除启动耗时外,与非TEE环境性能相当 性能 •加密内存 •内存隔离 •加密落盘 •安全信道 •远程证明 •内存隔离防篡改 •结果认证 机密性可靠性 TEE硬件 IntelSGX •配套基础设施完善:远程证明(IAS、DCAP)、开发者接入 •产品普及 ARMTrustZone •过强的信任假设:需要信任固件预置的TrustedOS •缺乏远程证明等基础设施(华为鲲鹏服务器上搭载了华为自研远程证明机制) RISC-VKeystone/Sanctum、蓬莱 •暂未有成熟服务器推出 •设计类似SGX AMDSEV •专注于虚拟机隔离场景 •远程证明存在安全漏洞,且不具备逻辑完整性的保护[BWS,CCS’19] •寄存器、IO存在数据泄露的漏洞[HB2017,SIGPLANNotices2017][LZL+,Security’19] •资源调度仍然依赖Hypervisor | TEE的接入方式对比 TEESDK •应用级别接入,对业务有侵入式改造 •攻击面最小 libOS •基础设施级别接入,业务少量感知 虚拟化:WebAssembly、Docker、VM •基础设施级别接入,业务可无感知 | 03 TEE上的分布式计算 多节点协同 一般步骤 •节点间两两互验远程证明 •每两个节点间通信密钥不同 缺点 𝑛2 •交互复杂度为� •需要维护其他节点信息 多节点协同 节点间密钥管理 1.数据拥有者通过远程证明验证KeyServer,向KeyServer注册一对加密公私钥对。 2.数据拥有者向Worker提供签名授权使用数据。 3.Worker向Guard展示签名,并请求对应解密私钥。 4.若Guard本地没有对应私钥,则向KeyServer查询。 5.Guard发送解密私钥给Worker。 6.Worker在运行中,可使用查询到的解密私钥解密 来自对应数据拥有者的入参数据。 •KeyServer集中管理密钥和授权 •KeyGuard为同一个物理节点或CVM上的Worker提供密钥查询和授权的常驻服务 •Worker为执行业务逻辑的协同计算节点 •以上3个组件均运行在TEE可信域内 | TEE上的分布式计算 适配TEE硬件 •Spark、TensorFlow等计算框架适配 计算节点间密钥同步 •KeyServer验证节点远程证明 •KeyServer-Guard密钥管理 •使用者授权密钥使用 计算集群对接密文数据库 合约执行时间 链下辅助执行时间 全同态加密 6ms 无 Bulletproofs 零知识证明 2.48ms 19.87ms Paillier 同态加密 0.7ms 无 SGX隐私合约 0.34ms 无 性能对比 区块链隐私交易场景 •全同态加密:性能较低 •零知识证明、同态加密:支持场景有限 •其他MPC:性能、泛用性有提升空间 隐私求交集(PSI)场景 •密码学算法:性能、泛用性有提升空间 TEE BlindRSA OT 512RSA 1024RSA 512RSA 512RSA+SM4 20executor*4G 1亿X1亿 8min26s 26min21s 112min34s 15min44s 40executor*4G 5min26s 17min21s 75min8s 10min35s 15min59s 20executor*4G 10亿X10亿 40min 153min 40executor*4G 25min 127min 552min 83min 隐私交易性能对比 PSI性能对比128MB内存旧机型 单TEE节点 | 04 区块链协调的数据协同 数据协同中的监控与协调 数据用途 •存证计算逻辑(模型) •存证数据提供方 数据用量 •存证数据哈希或签名 •TEE统计数据量 任务状态及结果 •TEE更新任务状态、结果上链 •TEE的输出均由TEE签名认证 腾讯云数链通 政务 各部门、各地区数据共享 金融 征信、风控等 非常感谢您的观看 |