企业数据安全治理实践分享 苏振波OPPO数据安全专家 2023年5月 Contents 1.背景 2.数据安全总体框架 3.数据安全关键技术和流程 4.总结 机密 性 可用 性 1.数据:任何以电子或者其他方式对信息的记录。从承载形态上可分为电子数据和非电子数据,从服务对象上可分为个人信息和企业数据等。 2.安全:构建信息系统保护能力,使得信息系统免受偶然或恶意原因而遭到破坏、更改、泄露,确保系统连续可靠正常地运行。 3.数据安全:通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。 数据 安全 数据安全 重要 数据 个人 信息 电子 数据 数据 企业 数据 完整 性 收 集 使 用 存 储 加 工 提 供 公 开 传 输 1.员工权限过大,有意无意的删除企业重要业务数据而导致的业务中断、客户投诉和客户丢失带来损失成本。 2.缺乏有效的数据安全保护措施而导致外部恶意攻击撞库、拖库、获取大量敏感数据带来的合规和业务损失成本。 3.不合规、不合法的个人数据处理和利用导致的合规风险和巨大的监管处罚成本和业务损失成本。 数据泄露 平均成本 •435/392万美金 •单条数据成本150美金 •识别和遏制用时:277/279天 数据泄露 事件原因 •恶意或犯罪攻击(51%) •人为操作失误(24%) •系统设计缺陷(25%) 《关键信息基础设施安全保护条例》 2015.7.1 《国家安全法》 2017.4.11 《个人信息和重要数据出境安全评估办法(征求意见稿》 2017.6.1 《网络安全法》 2022.7.7 2019.6.13 《个人信息出境安全评 估办法(征求意见稿)》 2021.9.1 《数据安全法》 2021.10.29 《数据出境安全评估办 法(征求意见稿)》 2019.5.28 《数据安全管理办 法(征求意见稿)》 数据 2021.10.1 《汽车数据安全管理若干规定(试行)》 2017.10.13 《数据出境安全评估指南(征求意见稿)》 2021.11.1 《个人信息保护法》 《据出境安全评估办法》 2022.2.10 《工业和信息化领域数据安全管理办 法(试行)》(征求意见稿) 2021.11.14 《网络数据安全管理条例(征求意见稿)》 欧盟GDPR第32条处理的安全1.控制者和处理者应当适当技术与保障措施,以便具备应对安全风险的安全能力:(a)个人数据的匿名化和加密; (b)保持处理系统与服务的保密性、公正性、有效性以及重新恢复的能力; (c)在遭受物理性或技术性事件的情形中,有能力恢复对个人数据的获取与访问; (d)具有为保证处理安全而常规性地测试、评估与评价技术性与组织性手段有效性的流程。2.安全评估和保障措施需要覆盖如个人数据传输、储存或处理过程中的意外或非法销毁、丢失、篡改、未经授权的披露或访问。 3.控制者和处理者应当采取措施,除非接到控制着的指示或欧盟+法律要求进行处理,任何有权访问个人数据的其他人员都不能够处理个人数据。 美国CCPA&CPRA1798.100(e) 收集消费者个人信息的企业应根据按照个人信息的性质实施合理的安全程序和做法,以保护个人信息免遭未经授权或非法访问、破坏、使用、修改或披露。 新加坡PDPA 企业应该制定必要的安全措施,以保护个人数据控制是在安全范围内的。安全措施需要可以阻止任何未经授权的访问导致的个人数据被收集、使用或披露。如果企业需要将个人数据转移到海外,例如将数据存储在云盘中,需确保数据传送至的国家可以提供与PDPA同等级别的数据保护。 数据资产治理 数据资源梳理 企业数据识别 数据分类分级 数据密级变更流程 数据密级同步应用 个人信息识别 重要数据识别 数据资产视图 数据共享管理 数据安全制度、标准、规范 总纲 二级 三级 四级 数据处理安全技术保障 数据删除 数据删除 匿名化数据销毁 数据提供/公开 去标识化处理匿名化 安全风险评估 数据加工/使用 账号权限管理 数据脱敏安全审计 数据存储 数据分类分级 存储加密容灾备份 数据传输 传输加密敏感数据加密 数据收集 数据收集合规数据引入合规 数据安全风险审计 数据安全运营 … 数据安全事件管理 内部安全审计 安全事件处置及应急响应 数据安全风险运营 三方风险评估 数据安全培训 数据安全人才培养 数据安全教育宣传 数据安全培训 数据安全建设参考框架 数据安全组织保障数据安全负责人 隐私合规/审计团队 数据安全技术团队 业务/部门责任人 安全委员会 数据安全方针、考核、度量数据分类分级规范数据处理安全规范加密及密钥管理规范数据脱敏规范权限管控和访问控制要求 软件设计数据安全合规要求 安全测试 发布安全 安全运营 研发合规 设计合规 需求分析 数据数据收集存储 数据数据 加工使用 数据数据数据 传输提供公开 移动端采集 公开获取 引入 手机端 匿名化数据销毁 数据删除 匿名化 安全风险评估 去标识化处理 数据脱敏安全审计 账号权限管理 存储加密容灾备份 数据分类分级 外部引入外部获取 终端采集 跨境风险识别 敏感数据加密 传输加密 云端 根据企业业务实际情况,制定数据分类分级规范,落实分级管控策略。 敏感个人信息:包括生物识别、宗教信仰、特定身份、医疗健康、金融账户、行踪轨迹等信息,以及不满十四周岁未成年人的个人信息,例如个人电话号、邮箱地址、详细地址、精确定位信息、未成年人的个人信息、支付账号、银行卡号、金融账户用户名等个人金融信息、个人健康生理信息、个人生物识别信息(指纹、人脸信息、声纹、虹膜、掌纹、步态等); 绝密公司业务数据-:包括可能导致重大经济损失的业务策略数据,如风控策略、定价策略等; -4经营管理数据-:员工工资、绩效奖金、工资单等信息,未发布的产品信息、战略规划、重要谈判、涉密项目、核心算法等。 机密 一般个人信息-:生日、性别、民族、IP地址、职业、职位、身高、体重、运动信息以及软件安装列表、IMEI、MAC地址等数据;公司业务数据-:业务策略、产品定价、产品统计分析数据、产品运营指标、算法效果等统计信息; -3经营管理数据-:员工个人电话、个人邮箱、籍贯等员工一般个人信息,以及产品通用运营方案、产品运营信息系-核心项目、产品技术方案、 营销活动信息、普通谈判类信息、部分法务类信息、从外部购买用于模型训练的数据、数据标签、自主研发的敏感代码数据等。 秘密 一般个人信息-:部分个人常用设备信息OpenID体系中的DUID、OUID、AUID,以及IDFV、UUID等; 公司业务数据-:如产品技术信息(发热、耗电、日志等)、产品售前售后服务产生的数据、产品级群体的用户画像与标签; 一般个人信息:主动公开的个人信息,如:用户社区发表帖子与图片、用户社区评论回复内容等;公司业务数据-:产品基本信息如APP功能、界面、机型信息;非涉密的业务规则信息,如监控规则; 经营管理数据-:员工姓名、英文名、身高等一般信息;商业联系人信息,如供应商、商户、加盟商信息等。 -2经营管理数据-:员工国际、性别证件类型等一般信息;产品运营信息-非核心项目、部分财务汇总类信息、非涉密项目信息、流程记录类信息、法律合规库等法务相关信息。 公开 -1 三方数据共享管理 数据处理风险评估 平台研发/运维数据安全审计 运营业务数据安全审计 风险管 部门数据资产 全局敏感数据资产地图 理 分类分级结果同步应用 分类分级结果复核 数据分类分级结果展示 自定义数据识别标签 自定义业务/部门标签模板 业务自助使用 敏感资产 自动化扫描(数据库/数仓) 分类 分个人信息标签 样例数据获取 业务数据标签 识别分析打标 经营管理数据标签 业务应用数据操作审计 级 国 内 对象存储 其他 半结构化 大数据 结构化 东 南 亚 半结构化 其他 对象存储 大数据 结构化 欧 盟 + 半结构化 其他 对象存储 大数据 结构化 数据平台 基础设施 数据源 大数据对象存储 结构化半结构化 数据分类分级 自定义标签 (灵活配置) 手动梳理元数据标密 内置算法标签 数据获取 按需获取 (API) 按业务/项目梳理 实时扫描定时扫描 识别规则 内容识别 属性规则 表名称字段名称字段备注字段值上下文 规则/算法 正则关键字字典校验算法 业务数据处理管控 内部使用 下载/共享 外部共享 发布/展示 权限分级管控 平台分级管控 算法识别用户姓名:张三婚姻状况:离异 规则识别 数据分析场景 IAM 身份证号:690121197612348888 就职单位:XX外汇管理局 业务开发场景 数据库表 健康状况:高血压、糖尿病血氧数据:98 业务管理系统 业务人员 心率数据:75 入睡时间:2022-09-19-01:23 数据传输安全,是指通过采取必要措施,确保数据在传输阶段,处于有效保护和合法利用状态,以及具备保障持续安全状态的能力。 1.利用加密技术对数据进行加密,保护传输的数据安全; 2.利用身份鉴别技术确认传输节点身份,保证传输的节点安全; 3.使用成熟的安全传输协议,保证传输的通道安全;建议用户敏感信息需要通道/内容双加密传输 Application Data Platform Data Infrastructure Data Data Hardware Data Data Services Databaseandfilestorage Distributedfilesystem Blockstorage Storagedevices 应用服务 数据加密 加解密SDK 加密服务 加密函数 确定性/非确定性 KMS 原始数据集 标识符 准标识符 敏感数据 常用的数据脱敏和去标识化方法 卡号 全名 手机号 年龄 生日 薪水 健康状况 74662 张三 18098121212 29 12.22 10k II型糖尿病 65221 赵四 13598114123 26 06.17 12k II型糖尿病 07512 王五 13698125987 44 08.19 30k 肝癌 33912 李六 13398116125 22 02.11 5k 肥胖 99523 周七 17798117235 25 11.11 6k 心脏病 算法描述适用数据类型 密码或需要通过对比进行 哈希脱敏常见的哈希算法如MD5/SH256,支持偏移量(加盐值) 遮盖脱敏通过使用特殊字符(*或者#),对部分内容进行遮盖实现 敏感数据的脱敏 替换脱敏使用替换码表进行映射替换,或使用随机区间进行随机替换,实现字段整体或部分内容脱敏 提供对数字或日期等进行取整操作(不可逆)和对文字进 敏感数据确认的场景 适用于前端展示或敏感数 据分享的场景 适用于证件号等构成规则固定的字段脱敏 用于对敏感数据集进行分 变换脱敏 行位移操作(可逆)变换脱敏 析和统计类场景 加密脱敏支持常见的对称加密算法适用于对需要回源的字段进行加密的场景 适用于对需要回源的字段 去标识化数据集 数据解密支持常见的对称加密算法 卡号 全名 邮编 年龄 生日 薪水 健康状况 74*** 张** 180***12 (25,30] *** 8-10 心脏病 65*** 赵** 135***23 (25,30] 06** 10-15 II型糖尿病 07*** 王** 136***74 (40,45] 08** 30-40 肝癌 33*** 李** 133***25 (20,25] *** 5-10 心脏病 99*** 周** 177***35 (20,25] 11** 5-10 心脏病 洗牌脱敏在源数据表抽取数据并确认数值范围后,对该字段(在范围内)进行列级别的打散重排和混淆 K匿名指定标识符(标识符或准标识符)属性值相同的每一等价类至少包含K个记录