行业研究公司研究宏观策略财报招股书会议纪要海南封关低空经济 DeepSeek AIGC 大模型

数字银行场景安全技术解决方案研究报告（2023年）

信息技术2024-09-26-北京金融科技产业联盟小***

AI智能总结

数字银行场景安全技术解决方案研究报告（2023年）

一、研究背景

中央金融工作会议强调优化金融服务，防范化解风险，坚定不移走中国特色金融发展之路，推动金融高质量发展。数字银行通过数据和服务的共享促进跨界协作与场景互联，具有广泛的服务优势，但同时也面临API安全和数据安全风险。具体风险包括：

API安全风险：随着API数量增加，银行API成为攻击者的重点关注对象。
数据安全风险：应用方通常不是持牌金融机构，缺乏金融级数据安全防护能力，可能导致数据泄露。

二、总体研究框架

本研究课题旨在通过技术创新保障数字银行的API安全和数据安全，主要包含：

API异常行为检测
数据分类分级
数据脱敏
数字水印
安全前哨

三、API异常行为检测

（一）研究背景

全球银行业通过API实现数据共享，但现有安全控制手段难以应对未知攻击模式。为此，提出基于自动编码器和注意力机制的API异常检测方法。

（二）技术实现方案

API异常内容检测模型：
- 使用自动编码器模型，通过数据重构思想自动学习日志参数的压缩表征。
- 采用Drain算法生成结构化的日志数据文件和模板文件。
- 通过滑动窗口策略和自注意力机制，提高异常检测准确性。
API异常序列检测模型：
- 使用双层LSTM网络模型，通过滑动窗口策略和高维表征生成策略，实时检测异常序列。
- 利用自注意力机制，自动聚焦重点信息，提高长距离依赖信息的捕捉能力。

（三）测试结果

自动编码器模型测试准确率99.52%，召回率99.28%，F1-score99.40%。
双层LSTM模型测试准确率91.045%，召回率88.4%，F1-score89.706%。

四、场景安全前哨

（一）研究背景

为解决数字银行业务中数据安全合规问题，提出数字银行场景安全前哨概念，通过技术手段配合管理制度，降低数据安全风险。

（二）技术解决方案

整体技术框架：
- 数据接收端：关闭物理外发通道，记录操作日志。
- 数据存储端：记录具体的数据操作日志。
- 数据处理端：实施终端分级管理，安装防泄漏插件和文件沙箱。
应用方数据处理流程：
- 数据接收端：配置白名单，监控物理通道使用情况。
- 数据存储端：收集终端IP及授权安全等级。
- 数据处理端：通过应用网关接入数据库，添加数据水印，保存数据在文件沙箱。

五、智能化数据分类分级算法

（一）研究背景

通过金融数据分类分级技术底座，针对不同数据类别配置精细化的管控策略，实现对数字银行数据在接收、存储、处理过程中的全面防护。

（二）技术实现方案

数据分类分级：依据《金融数据安全数据安全分级指南》进行标准化分类分级。
数据脱敏：根据安全管理策略，对数据进行智能脱敏。
数字水印：为银行数据添加数字水印，便于追溯追责。
流量分析：检测网络通道和对端系统是否符合业务配置。
日志审计：全面收集操作日志并进行存储、审计、分析。
行为检测：基于用户行为画像发现异常访问。
文件沙箱/防泄露插件：安装插件监控数据行为，安装文件沙箱隔离敏感数据。

六、数据脱敏效果综合评估体系

（一）研究背景

评估数据脱敏效果，确保数据在传输和处理过程中的安全。

（二）技术实现方案

数据脱敏：根据不同场景进行数据脱敏处理。
综合评估：通过测试验证数据脱敏效果，确保符合安全要求。

七、基于语义分析的开放文档格式隐式水印算法

（一）研究背景

通过语义分析技术，实现对开放文档格式中的隐式水印识别。

（二）技术实现方案

语义分析：基于语义分析技术，识别开放文档格式中的隐式水印。
隐式水印：通过特定算法生成隐式水印，提高数据安全性。

八、总结和建议

继续深入数据安全相关技术及标准研究：深化技术研究，制定和完善相关标准。
**数字银行

北京金融科技产业联盟2024年9月版权声明本报告版权属于北京金融科技产业联盟，并受法律保护。转载、编摘或利用其他方式使用本白皮书文字或观点的，应注明来源。违反上述声明者，将被追究相关法律责任。编制委员会编委会成员：聂丽琴傅宜生祖立军编写组成员：张弛薛文哲门小骅陈思文赵晓夏方宇伦宋鑫晶张明虎卢凯李勇攀杜彪卞凯董涛夏雯君张游施生燊张宏勾志营王炳辉陈兴吴小平王银燕黄海燕李树尉彭俊宏陈波官小波谢世杰龚孟旭王李彧董杨瑞孙乐廖敏飞吴孟晴解敏李裕鹏施妍萍郭俊刚廖静雅崔正玮严青伟陆绍益丁伟强李浩邹长龙战扬张艺李东竺铁生袁捷白慧方绍全曾明华李金银卢科兵肖昊周丹秦旭果焦伟哲牟健君薛涛张嘉伟杨增宇张宪铎沈超陈俊杜锦文吴杰吴承荣叶家炜张亮谢于明包德伟魏启坤曹雅琳岐文钰周楠杨学治冯国强编审：黄本涛刘昌娟统稿：薛文哲参编单位：北京金融科技产业联盟秘书处中国银联股份有限公司中国工商银行股份有限公司中国农业银行股份有限公司中国银行股份有限公司中国建设银行股份有限公司中国邮政储蓄银行股份有限公司中国民生银行股份有限公司上海浦东发展银行股份有限公司兴业银行股份有限公司华夏银行股份有限公司中国光大银行股份有限公司渤海银行股份有限公司广东省农村信用社联合社复旦大学华为技术有限公司深圳市联软科技股份有限公司目录一、研究背景............................................1 二、总体研究框架.........................................2 三、API异常行为检测......................................3 （一）研究背景.....................................................3（二）技术实现方案.................................................3（三）测试结果.....................................................5 四、场景安全前哨.........................................7 （一）研究背景.....................................................7（二）技术解决方案.................................................8 五、智能化数据分类分级算法..............................14 （一）研究背景....................................................15（二）技术实现方案................................................15（三）测试结果....................................................19 六、数据脱敏效果综合评估体系............................21 （一）研究背景....................................................21（二）技术实现方案................................................22（三）测试结果....................................................28 七、基于语义分析的开放文档格式隐式水印算法...............29 （一）研究背景....................................................29（二）技术实现方案................................................31（三）测试结果....................................................33 （一）继续深入数据安全相关技术及标准研究..........................34（二）数字银行场景安全需要加强管理................................36（三）加强自律管理完善标准体系....................................37 附录：数据安全法律规范..................................38 一、研究背景中央金融工作会议指出做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章，强调优化金融服务，防范化解风险，坚定不移走中国特色金融发展之路，推动我国金融高质量发展。数字银行是基于数字技术的金融创新发展模式，通过数据和服务的共享促进跨界协作与场景互联，已成为数字金融发展的重要支撑。在拓宽金融服务渠道、丰富金融服务场景、加速数据要素流动等方面具有得天独厚的优势。既能通过更全面的“数字足迹”为科创企业、绿色企业、小微企业等降低融资门槛、提升融资效率，也能借助无处不在的“全渠道”服务能力将金融服务延伸到老年人、残障人士、农村居民等普惠群体身边，有望在数字经济时代助力金融服务更广泛、更深入地融入经济社会的方方面面。但数字银行在广泛连接服务提供主体、场景建设主体、交易发起主体等，客观上增加了网络攻击、数据泄露风险点，扩大了风险传导范围，链条上任何一方保护存在薄弱环节都可能危及金融资金安全、信息安全。风险主要体现在以下两个方面。一是银行侧API安全风险。API是目前数字银行各方互联的主要形式，随着银行对外开放的API数量增多、传输的数据价值越来越高，银行API已成为攻击者的重点关注对象。如何准确识别API攻击、有效开展API安全防护以规避以上风险，已经成为数字银行安全合规发展亟待研究的课题。二是应用侧数据安全风险。在数字银行业务中，银行需在用户授权下与应用方进行敏感数据交互，但通常情况下应用方并不是持牌金融机构，不具备金融级的数据安全防护、合规处理能力，无法确保数据处理过程符合监管要求。少数情况下，部分应用方甚至将数据分享给其他第三方而造成银行数据泄露，为数字银行业务开展带来挑战、为银行声誉带来负面影响。二、总体研究框架面对上述问题，亟需凝聚行业合力共同构建数字银行安全“防火墙”，护航数字银行发展行稳致远。本研究课题旨在研究一系列创新技术能力，保障数字银行的API安全、数据安全，主要包含银行侧的API异常行为检测等安全技术，应用侧的数据分类分级、数据脱敏、数字水印、安全前哨等数据保护技术（如图1所示）。截至发稿，本研究报告涉及的API异常行为检测（内容异常、序列异常）、数据分类分级、数据脱敏、数字水印均已完成原型实现和验证，安全前哨完成技术方案。配合技术研究成果，目前课题组正同步开展相关技术的标准规范研制（截止本研究报告发稿，已完成《金融API安全防护体系评估指南》初稿）。以标准为基础，银联既可以为相关技术提供检测认证服务，也可以作为数字银行业务的转接方，为行业各方提供可靠的安全技术能力，保证整个交易链路的安全性。三、应用程序接口异常行为检测（一）研究背景从全球银行业数字化转型发展来看，应用程序接口（API）是商业银行探索新金融服务模式的主要方式，第三方通过银行开放的API实现数据共享，基于银行的基础设施、产品和服务，在自身应用和场景中嵌入金融服务，以更好地满足客户需求。然而，银行现有的WAF和API网关等传统安全控制手段由于不了解API上下文并且不以正常的API使用为基准，通常难以对未知的、不可预测的攻击模式提供安全防护。针对上述挑战，本章节提出基于自动编码器模型的API异常内容检测方法，以及基于注意力机制的双层长短期记忆（LongShort-Term MemoryLSTM）网络模型对API的调用序列进行异常检测方法，商业银行可从原始的用户访问日志中提取用户会话内容与API调用序列，利用下述技术方案训练可靠的异常检测模型，检测用户会话行为是否存在异常，以提升银行开放网关的安全能力。（二）技术实现方案 1．API异常内容检测模型使用深度学习模型可以更好地处理复杂的、非线性的数据模式，并能够自动地、自适应地学习数据中的特征，不需要人工预设规则或特征。因此，课题组提出了一种基于自动编码器的API异常内容检测方法。方法利用数据重构的思想设计模型，能自动学习日志参数的压缩表征，并通过正负样本的验证进行分界点的动态划分，最后根据分界值进行异常日志参数的识别。此外，对于半结构化的日志，本方案采用基于Drain1的日志分析算法生成结构化的日志数据文件和模板文件。方案能有效解决包括但不限于以下异常事件：影子参数、请求方法异常、过度数据暴露等，从多维度保证了系统的稳定性、安全性，帮助提高性能降低风险。模型构建要点如下：一是基于Drain的日志模板抽取：通过日志切分、分词、序列化、频繁项集挖掘算法、模板合并、日志映射，从大量的原始日志事件中识别出共同的结构，将半结构化日志文件转换为结构化的模板文件。二是类型粒度的多模态数据表征策略：按照数据的种类对字段进行划分，将连续数值型、离散数值型、文本型的异构字段值统一转换为向量形式。三是基于自动编码器的自动化压缩表征学习：通过编码器（Encoder）和解码器（Decoder）将样本数据先映射到低维空间再还原到高维空间，最小化重构误差使模型学习到准确的压缩表征以便更好地捕捉数据的特征和结构。四是动态分界点划分：构建正负样本验证集，进行模型校验，并根据正负样本的重构误差中间值动态生成误差分界值，从而实现对不同日志定制化的阈值学习。五是支持流水线自动运行，方案可复用性高：流程全自动化，无需配置，输入日志即可生成模型。支持对流数据的准实时判断，可以在不同行业不同业务的日志中迁移复用。 2．API异常序列检测模型课题组提出了一种基于自注意力机制的双层LSTM序列异常检测方法。通过对历史日志中API接口调用顺序的学习，模型可以实时检测出日志流中的异常序列调用，有效规避了开发过程中可能存在的未授权访问漏洞危害，让攻击者无法不遵循业务逻辑的调用顺序访问应用，从而降低了调用路径异常的业务逻辑风险。模型构建要点如下：一是滑动窗口式序列生成策略：将序列按设定的时间窗口划分形成多个子序列，依次输入包含门结构和记忆单元的网络，对序列的长短期信息进行自适应学习。二是高维表征生成策略，长短期依赖信息动态平衡：将序列按时间步划分，映射到高维空间，通过包含门结构和记忆单元的网络双层叠加效果，高度抽象序列中的深层次特征信息。三是重点信息自动聚焦：对序列的高维表示采用自注意力机制，即每个接口都需要计算与前后接口的关联度，在一定时间只关注与当前接口更相关的接口，大大增加了捕捉长距离依赖信息的能力。四是支持手动配置异常容忍度，方案可复用性高：通过配置预测候选集大小可以手动调节异常的容忍度，以上流程程序化，支持不同业务日志的迁移复用。（三）测试结果课题组根据以上技术方案开发了原型程序，并在银联沙箱环境中测试验证。首先，选取100028条网关应用系统上正常的用户访问日志，经过特征提取和会话汇聚后共得到17609个有效的会话记录进行评估，作为正常样本。为了进一步开发和验证模型，使用Postman2对API进行手动攻击测试，模拟包括爬虫、鉴权、SQL注入、API Ddos攻击等API攻击检测场景，将网关上记录到的日志作为异常样本。在这些样本中随机挑选80%的正常样本数据作为训练集，各10%的正常样本和50%异常样本作为验证集、测试集。根据实际场景需求，基于自动编码器的API异常内容检测模型对单API进行模板挖掘和关键参数阈值学习，从http方

点击免费查看完整报告