COLLECTIONOF2024 CASESTUDIESONTYPICALDATASECURITYSCENARIOS 2024 数据安全典型场景 案例集 编辑委员会 指导单位: 杭州市数据资源管理局 发布单位: 杭州数据安全联盟 杭州数据安全联合创新实验室 专家指导组: 张斌、孙茂阳、胡琼达、曾露、李嘉明、徐舟、吴铤、寇亮、刘金飞、薛峰、周俊 审核组: 方橙蔚、李聪辉、常凯新、卜嘉文 案例提供单位: 杭州市上城区数据资源管理局杭州安恒信息技术股份有限公司杭州市拱墅区数据资源管理局杭州城市大脑技术与服务有限公司杭州市西湖区数据资源管理局杭州虎符网络有限公司 杭州高新区(滨江)大数据治理中心杭州美创科技股份有限公司杭州市萧山区数据资源管理局杭州孝道科技有限公司 杭州市余杭区数据资源管理局杭州中尔网络科技有限公司 杭州市临平区数据资源管理局全知科技(杭州)有限责任公司杭州市富阳区数据资源管理局闪捷信息科技有限公司 杭州市临安区数据资源管理局上海凯馨信息科技有限公司 建德市数据资源服务中心深信服科技股份有限公司 杭州市经济信息中心深圳市洞见智慧科技公司浙江省北大信息技术高等研究院网宿科技股份有限公司 南湖实验室星环信息科技(上海)股份有限公司国网浙江省电力有限公司信息通信分公司中国电信股份有限公司重庆分公司 I 前言 随着以数据为关键要素的数字经济的蓬勃发展,数据已经逐渐成为基础性、战略性、先导性资源,对社会发展、国家治理产生着革命性影响。如今,数字中国建设已成为国家发展战略的重要组成部分,保障数据安全、促进数字经济发展是事关人民福祉、社会稳定和国家安全的重大问题。《中华人民共和国数据安全法》的出台和实施预示着我国数据安全管理工作步入全新的法制化阶段。在此背景下,数据安全不仅是数字经济稳健运行不可或缺的基础环节,更是推动产业实现高水平、高质量发展的核心要务。 各政府部门、企事业单位、行业机构等多元主体,在实践运作中亟需建立和完善全面的数据安全治理体系,持续提升数据安全保障能力和管理水平。先进的数据管理体系通常涵盖数据共享、互联互通、开放利用及安全保障等多个维度,而数据安全则是支撑这些功能有效运行的基石。 本案例集广泛汲取了数据细粒度治理、数据授权运营安全、接口使用安全、政务系统接入安全、批量数据共享安全、数据使用侧监管、安全风险监测、账号安全管控、第三方人员管理、密码应用等领域内的实际应用实例,深度剖析了数据安全在各典型场景下的挑战与应对策略,整理并呈现了一系列具有代表性的案例研究。同时,案例集囊括了诸多保障数据安全的核心技术和管理措施,如数据分类分级管理、账户权限控制、安全的数据开发环境构建、批量数据共享接口的安全使用、软件开发全生命周期的安全管控等。 最后,衷心感谢您选择阅读本案例集。我们期望此案例集能为社会各界提供实用、有价值的参考依据,助力各行各业有效应对数据安全领域的各种挑战。在编写时尽管我们不敢有丝毫懈怠,但由于时间和能力有限,内容和编排上难免有不足之处,敬请读者批评指正。 III 目录 第一章数据细粒度治理场景1 1基于AI识别的数据资产管理系统建设2 2数据使用安全—敏感数据的精细化管控5 第二章数据授权运营安全场景7 3全流程安全管控方案下的公共数据授权运营平台建设实践8 第三章接口使用安全场景11 4接口使用安全12 5政务应用API接口二次封装的自动化监测与发现解决方案14 6API接口风险监测及处置方案15 7基于API接口的能源数据安全建设实践18 8针对API共享接口的精细化风险监测实践20 第四章系统接入安全场景22 9基于零信任的政务外网安全接入平台23 10政务应用“上线即安全”解决方案25 11基于零信任打造政务外网终端的可信访问体系27 第五章批量数据共享安全场景29 12基于芯片级隐私计算的数据共享平台方案30 13基于云沙箱的数据隔离访问方案32 14基于隐私计算的省级政务数据开放平台34 15基于SophonP²C的隐私计算平台应用方案—以政务民生为例36 16基于隐私计算的政务数据计算价值共享38 第六章数据使用侧监管场景40 17数据交换场景中的API多重监管交叉审计41 18数据使用侧统一授权管理与监管43 19数据使用侧监管45 IV 第七章安全风险监测场景47 20基于全流量的流动数据风险监测方案48 21基于公共数据平台的开放数据中个人信息检查情况分析50 22基于可视化技术的数据访问监管系统设计与实现52 第八章账号安全管控场景54 23账号复用滥用发现方案55 第九章第三方人员管理场景57 24数字操作间系统58 25信息化建设第三方人员数据安全闭环管理60 26第三方人员管理63 第十章密码应用场景66 27密态数据流通解决方案67 28保护数字社会系统中的数据安全:商用密码技术的实践与应用70 第十一章综合场景72 29数据多节点泄露发现方案73 V 第一章 数据细粒度治理场景 1基于AI识别的数据资产管理系统建设 一、场景描述 作为新型生产资料,数据资产在流通和使用过程中能不断创造新的价值。然而,由于数据价值提升、流动性加剧、防护边界模糊,以及数据自身海量无序、类型繁杂、场景多样等复杂因素的影响,数据安全风险变得异常突出,传统的以边界防护为主的网络安全手段已经难以有效应对这种挑战。因此,亟需从资产的视角对域内数据进行摸底盘点、分级分类、关联分析、风险评估等综合安全治理,实现数据全生命周期安全管理,确保数据来源可信、访问可控、操作可查和责任可追。 本方案结合行业数据的本地化管理与直观可视、可查、可判、可用的实际需求,并结合相关工作机制,实现行业数据的更新维护,提高行业常态风险管理能力;进一步开展关键要素分类辨识应用,实现针对重点防护对象的判识、评估,并以一张图的形式分类分级显示成果;提供防护策略建议、专项评估报告动态更新等内容,为安全监管部门提供支撑。 二、风险分析 痛点主要包括如下四个方面: 1.组织机构尚不具备数据分类分级能力 组织机构对数据资产的规模、存放位置、敏感数据构成与使用情况等信息尚未掌握,无法根据数据的重要程度制定安全保护策略,直接影响了后续的数据安全体系化建设。 2.可用数据分类分级信息滞后 组织机构掌握的可用数据分类分级信息滞后,这些信息不能反映数据资产的真实情况,对数据安全能力建设效果的提升作用有限。 3.内容识别技术准确度低当前的内容识别技术一方面需要大量的人工干预,另一方面会产生错误的数据分类分级结果。这会导致制定的数据安全保护策略不合理,从而对数据安全产生危害。 4.缺乏数据安全风险监测能力 组织机构对环境中敏感数据是否存在泄露、是否存在违规访问、是否有系统漏洞等情况不了解,导致数据安全工作的针对性不强。 三、解决方案 (一)数据安全分类分级服务 数据安全分类分级起承上启下的作用。承上:从运维制度、保障措施、岗位职责等多个方面的管理体系都需依托数据分类分级进行针对性编制(管理体系与分类分级的结合,可强化体系落地执行性)。启下:根据不同数据级别,实现不同安全防护,如高级数据需要实现细粒度规则管控和数据加密,低级别数据实现单向审计即可。所以,数据分类分级是管理体系合理规划、数据安全合理管控、人员精力及力度合理利用的基础,是迈向数据安全精细化管理的重要一步。 数据分类分级工作流程包含分类分级方案预研、分类分级方案确定、分类分级方案评审3个环节。流程如图: 分类分级方案预研主要包含预研准备、数据资产梳理、方案设计等工作;分类分级方案确定主要包含方案预审、方案汇报评审和方案发布工作;分类分级实施主要是分类分级标 识和安全策略规划工作。图1.数据分类分级工作流程图 (二)数据安全资产管理系统 数据分类分级方案确定后,下一步数据安全分级分类专员根据分类分级方案对数据进行分类分级标识,数据分级分类标识采用“工具”+“人工”的方式,通过自动化工具(数据安全资产管理系统)引入数据分类分级过程,加速项目实施速度,降低人力成本,降低错误率,提高输出成果的质量。 2 1.系统概述 通过对全域数据扫描和深度挖掘,对组织内的数据资产(例如数据源、数据表、字段、文档等)进行梳理,绘制数据地图,建立数据资产台账,帮助用户摸清数据资产家底,直观呈现核心数据资产的分布、状态、使用、流转等详细信息。同时,数据安全资产管理系统能够利用Ai算法、机器学习等技术,结合数据特征、元数据等信息,发现和定位敏感数据资产,并基于法律法规和行业标准,自动化完成数据资产的分类分级,为企业或组织构建数据安全运营体系打下坚实的基础。 2.产品架构 数据安全资产管理系统可以分为数据资产探测、数据资产梳理、敏感数据识别、数据分类分级、数据资产多维分析等功能模块。数据资产探测功能帮助客户发现组织内的未知数据源;数据资产梳理功能帮助组织掌握内部数据资产现状,构建数据资产地图;敏感数据识别功能通过平台内置的个人敏感特征库,发现和定位组织内的敏感数据;数据分类分级功能通过数据特征、资产属性、环境信息等多维度,对数据资产进行自动化的分类分级打标签,为后续数据安全管控策略提供基础;数据资产多维分析从多个维度呈现资产现状,让组织管理 层能够直观、全面了解数据资产现状,确保数据资产“可见、可懂、 数据安全资产管理系统充分考虑了自身安全性、易操作、易维护等多方面设计要求,采用SOA架构将复杂的业务逻辑、流程控制逻辑和数据存取逻辑通过在不同技术层实现,使得技术实现与平台业务相分离,确保自身数据安全和业务效能最大化。 可控、可用”。图2.数据资产管理系统逻辑架构图 同时,采用AI技术提升内容识别的准确性与识别工具的实用性和应用范围,支持结构化和非结构化数据。 具体而言,本方案在关键字技术的基础上引入中文分词、模糊匹配和权重匹配技术,优化普通关键字的误报率;针对正则表达式,加入数据标识符,精确匹配身份证、银行卡号、社会保障号等有技术规范的内容;对非结构化文档的识别,支持为内容提取指纹,实现敏感内容分段保存,降低干扰内容影响,提升识别敏感信息和内容来源的水平;机器学习方面基于深度神经网络,用双向门控循环单元(GRU)网络进行中文分词,用深度卷积 (DCNN)网络进行文本深度特征提取,采用集成支持向量机(SVM) 的方法进行文本分类。图3.系统部分技术功能展示(演示环境系统截图) 数据分类分级识别中针对诸如通讯记录、征信信息、房产信息等较难通过规则配置实现自动识别打标的数据,通过个性化建模方式构建模糊规则集实现数据智能打标。 标签推荐技术实践中,主要采用经验知识与事实知识结合的理念。经验知识即标签信息可能包含的语料库或描述,如既往病史、住院记录等关键词汇;事实知识即实际的数据样本,通过多种模型的关联构建。通过机器学习技术,对待打标的数据进行预处理,如中文分词、关键词提取、词向量转换等,并利用TF-IDF算法进行关键词提取并结合word2vec算法进行词向量转换,最后计算待预测数据与每种标签对应数据的相似度得分,并依据该得分进行标签推荐。 图4.标签推荐功能展示(演示环境系统截图) 3 (三)与现有数据安全产品联动 将分类分级信息与现有数据安全产品联动,实现敏感数据信息与安全风险等内容的实时同步,形成有针对性的数据安全防护策略,实现加密、脱敏、审计、访问控制等的策略协同与联防联动。 (四)根据分类分级结果,自动监测敏感数据的流动和访问情况,在风险识别模型的基础上,采用AI技术提升风险识别能力 (五)支持广泛的数据源类型 本方案包括但不限于支持Oracle、SQLServer、MySQL、DB2、SyBase、Postgres、Informix等国际主流商用数据库,达梦、人大金仓、南大通用、金仓等国产主流商用数据库,HBASE、HIVE、HDFS、MongoDB等主流开源大数据存储组件,华三、华为等国内主流大数据平台的数据资产识别。支持对常见非结构化数据资产识别,包括doc、docx、xls、xlsx、ppt、pptx、pdf、txt