数据要素流通与隐私增强计算的结合实践 ——数据链接、流转、共享与使用的价值最大化 蚂蚁集团-数字科技-夏建树 2022-08-27 企业/政府越来越意识到数据是生产力与重要资产,但在其商品化流通开放共享中存在多种问题 数据要素 土地技术 要素要素 市场化配置 劳动资本 力要要素 素 数据不可信 缺乏数据开放流转的统一管控体系 数据难共享 协作效率低 管控成本高 经营分析类 从“定价效果评估,促销广告策略 公共服务类 服务 围绕“商圈信息、区域信息、天气情况、站边路网、车辆信息、农业信息、价格信息、省内经济、基建工程、客运信息、物流信息、车辆ETC消费”等公共服务类相关信息分析。 竞争对手类 评估分析,促销策略与节假日关联经营 分析,油品价格和相关商业热点分 析,消费群体进行分析,消费者的消费行为趋势分析,消费者的心态分析”7大核心维度分析。 对手竞争对手资源、生产、运行及经营等方面情况分析。 产能资源类 炼厂的产能产量以及市场价格和库存的相关性分析,省外资源流 入量等因子分析。 产能需求 需求情况类 从市场供需状况、政策变化对成品油经营分析,洞察其对商品的营销和相关因素变化。 “2022年1月,法国数据监管机构CNIL对于谷歌和FACEBOOK分别处以1.5亿欧元与6000万欧元 罚款,未能让法国用户拒绝cookie跟踪技术” 服务覆盖数据要素流通全生命周期 业务环节 数据采集数据源接入 数据存储数据资产管理 数据分析数据处理 数据流转 数据使用 数据融合 数据审计 区块链存证 可视化 日志监控 合规报告 数据风险审计 ………… 数据导入 数据调度 数据使用授权 数据编排引擎 隐私计算 工作台引擎 智能合约 ………… 数据加密 数据溯源 数据目录 安全流转通道 密态计算 流转存证 跨境合规管理 ………… 数据安全策略 用户行为分析 数据脱敏 数据水印 防泄漏防篡改 风险识别预警 风险事件处置 ………… 数据标准化 数据可视化 数据质量管理 数据分类分级 敏感数据识别 数据资产地图 数据血缘 ………… 数据采集合规 合规文本解析 数据源确权 数据合规检测 …………… 能力服务框架 定位:以数据安全+合规咨询+区块链+隐私计算技术为核心,从域内数据安全流转到跨域数据可信流转,提供 可梯度选择的数据全生命周期安全管控方案,支持国内、跨国、地方、行业标准落地建设,支持数据要素合规流通与使用 客户分类需求: 顶层设计能力 安全合规能力 数据治理能力 数据处理能力 数据流通全链路能力 数据场景落地 数据流通体系数据质量体系数据安全体系 法律合规检测行业标准配置跨境合规检测 数据标准梳理主数据质量管理数据资产地图 敏感数据发现数据使用风险识别 数据脱敏数据溯源数据审计 跨域数据安全通道保障跨境数据安全通道保障数据共享 隐私数据使用 公共数据开放数据协作建模用户画像 联合风控征信 数据交易 数据资产管理 行业应用用户群体 石油工业 生产制造业 能源行业 银行业务 智慧交通 电子政务 … 数据科学家 数据分析师 数据管理员 数据操作员 业务用户 决策者 … 数据质量共享交换隐私计算 主数据元数据数据迁移… 业务咨询 现状调研问题诊断 框架顶设 流程优化 业务分析场景开发 特征工程策略开发 能力评估制度设计 基础数据治理 实施规划 数据安全治理 建模服务 数据共享服务 服务能力 项目管理项目删除审核 项目维护数据资源统计 数据标准梳理 导入电子表格数据库数据提取数据模型查询数据模型对比 数据模型管理 页面管理数据流程管理存储过程管理 存储过程可视化调度 存储过程可视化 数据质量检测数据质量检查报告数据质量任务检查 数据质量项目管理 数据质量管理 敏感数据识别数据分类分级数据脱敏 数据风险识别 域内数据安全 数据共享加密数据使用控制数据加密转移数据使用审计 跨域数据安全 数据跨境自评估数据风险检测数据风险审计合规报告生成 跨境数据安全 数据导入数据融合数据确权 数据授权 数据发布监测风控引擎调度 隐私计算 数据治理基础平台 可信协作底座平台 调度算法 中心库 数据源管理 建模插件日志 设计管理管理 协作节点(软件/一体机) 流通岛(软件) 组网管控 平台支撑 元数据智能管理计算引擎 用户管理 基础服务 数据协作工具箱 数据开放管控 数据流通管控 如何合理管控? 是否存在风险? 谁在用敏感数据? 敏感数据在哪? 解决的问题 数据安全防护 数据动态脱敏网关 数据静态脱敏 数据水印溯源 数据操作行为审计 数据生产血缘图谱 数据使用血缘图谱 数据资产自动发现 敏感数据识别 数据分类分级 业务流程数据资产梳理数据流转监测产品功能 可持续安全运营 数据资产嗅探 语言模型 数据库协议解析 分布式任务调度引擎匿名化技术数据水印算法 行为关联分析 图计算 UEBA 风险检测引擎 数据脱敏服务OCR识别 元数据识别模型 行为基线异常检测 风险监测与预警 数据安全风险处置 技术能力 算法模型 数据引擎 EMR MaxCompute CD H API、应用操作日志 表、字段创建语句 文件服务器 传统数据库 数据接入 可信协作平台:区块链+隐私增强计算,内外部数据资产的流动与变现 应用场景 重点人群监控企业信用评估数据保险箱数据安全回流 客户价值 更方便/安全/合规使用多方数据构建原有/创新商业应用更安全/合规的开放闲散数据,创造新价值 流通岛(软件) 协作节点(软件/一体机) 产品 产品功能 基础服务 数据连接器数据管理 授权管理 用户管理 计算引擎调度管理 数据协作工具箱 IDE 密文计算 隐匿查询 可信流转 多方统计 多方建模 安全求交 应用场景模板 数据开放管控 开放监测与风险管控 数据开放策略引擎 数据开放合规检测 数据流通管控 应用目录链 数据目录链 组网管控 计算引擎调度管理 组网管理 区块链 可信存证智能合约 隐私计算与密码学 MPCFLTEEHEDPZKP可搜索加密 数据安全 内容识别匿名化数据血缘 技术能力 咨询规划 合规治理层 数据跨境风险治理框架数据跨境合规制度治理数据跨境合规业务执行 数据接入层 APPIOT非结构化DB应用 核心功能层 合规管理风险监测合规治理 合规平台 合规管理服务 风险检测引擎合规治理工具箱 PIADSR跨境自评估隐私政策授权管理行为记录风险监测尽责管理数据存证数据泄露事件响应评估 法律合规层 敏感数据识别数据加密数据分级分类数据脱敏安全策略数据水印 隐私计算差分隐私 法律咨询 法律法规图谱法律法规解读法律咨询和培训 需求分析 相关委办:大数据局、行业委办局数据中心、城市大脑 业务需求:基层数据共享难、大数据赋能支撑基层管理使用场景: •省(市)-市(区县)两级回流 •省(市)-市(区县)-街道(部门)三级回流 如浙江省在全国率先进行“数据回流”工作,基于“数字政府”概念,实现关于“加强政务数据回流,支持基层治理现代化”的建设需求。 需要将归集于省市级公共数据平台的数据,回流至区县、街道两级,实现整合数据资源,发挥治理效能,提供更优质的公共服务的目标。 建设一体化智能化公共数据平台,保障数据归集与使用,实现数据实时汇集、开放共享的大数据生态体系 在此基础上寻找数据开放的落地业务场景,如拉动银政企,通过试点政府侧和银行侧联合建模,打造面向小微普惠、绿色助农的综合金融服务平台 需求分析: 金融普惠 溯源分析 政务数据审批 产业融资 招商引资 数据业务流程安全 数据安全标准规范体系 “N”个数据应用 安全风控 安全共享 授权审批 审批数据链上存证 数据操作链上审批 数据加密计算能力 数据加密流转能力 数据使用限制策略 数据使用鉴权 数据智能分级分类 行为上链存证 隐私计算 密文流转 全生命周期安全管控 数据资源目录 平台 数据开放 平台 数据共享交换平台 数据治理平台 隐私数据库(重要数据) 专题数据库 基础数据库 “1”个隐私数据中台 账号模型 区块链基础能力 智能合约服务 隐私保护 区块链存储 区块链共识 虚拟机服务 隐私计算基础能力 可信计算环境 同态加密 端点系统数据安全 智能合约工作流 秘密组网 多方安全计算 秘密分享 “1”个基础能力平台 政务云平台 基础设施 •依据部门职责确定部门数据责任,实现职责-目录-数据的强关联、严绑定,解决数据缺位、越位的问题; •建立健全“职责-目录-数据”三位一体的目录体系,利用区块链的分布式存储、不可篡改、合约机制等特点,将共享关系和流程上链,解决数据流转随意、业务协同无序等问题; •所有的数据共享、业务协同行为在“链”上共建共管,建立部门业务、数据、履职的全新“闭环”,解决应用与数据脱节、技术与管理失控等问题。 场景需求: 如不动产登记,通过目录链系统,链上实时调用公安、民政等多个部门的户籍人口、社会组织等标准数据接口,进行证书的交易、缴费、颁发等 如电子证照互认,身份证、结婚证、银行还款流水证明、营业执照等,核验异地电子证照、跨地区异议处理 在国内征信、个人数据安全等法律法规基线上,运用隐私计算能力(多方安全计算/多方安全建模),满足数商的合规要求, 提升数据融合运用的效率效果,同时将隐私计算能力扩充至数据智能应用生态中。 需求分析: 隐私求交 提升数据质量,保障数据的完整性、准确性、一致性、时效性; 使得数据体系稳定,面向新需求可扩充;数据资源可维护、易应用。 数据常见问题 •结合ISV能力,与产品结合,形成域内—跨 域—多边视角的数据治理能力 序号 问题 问题表现 问题分类 常用解决方法 1 数据缺失 ①缺少记录②缺少内容 业务问题 ①数据建设②资源规划 2 数据质量 ①完整性②冲突性③一致性 业务问题 ①质量检查②数据修正 3 数据选择 ①一数多源②记录重复 用户问题 ①消除数据冗余 4 数据发现 ①资源不清②难于检索 用户问题 ①数据资产管理②数据资产目录 5 数据应用 ①重复建设②理解困难③集成困难④开发困难⑤维护困难 系统问题 ①数据源点采集②数据统一管理③数据分层建设 数据管理制度 数据架构管理数据质量管理 数据存储与计算 数据确源 元数据 数据集成 资产管理 业务分析 主数据 数据建模 数据服务能力 数据治理 •行业属性以工业、能源、金融为主 数据资产发现 数据资产识别 识别规则补充 数据分类分级 数据使用/ 交易 规则库 个人信息 企业信息 位置信息 设备信息 密码凭证 自定义规则 合规分类 安全分级 一级 二级三级 ... 其他数据 重要数据 核心数据 数据资产定价 数据资产画像 ………… 认证 审查审计 代运营 数据运维 数据建模 链接全球数据价值 LinkGlobalDataandApplications