金融业数据应用发展报告 (2021-2022) 北京金融科技产业联盟 2022年9月 版权声明 本报告版权属于北京金融科技产业联盟,并受法律保护。转载、编摘或利用其他方式使用本报告文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。 编制委员会 主编 潘润红 编委会成员 何军左燕蒙永明聂丽琴 编写组成员 蔡 睿 李 鑫 滕 竹 刘一阳 薛 羽 魏博言 詹明星 王跃东 孟庆昕 白羽羲 王礼斌 陈 明 戴 蕾 任 妍 张 宁 刘 远 勾朝臣 朱 凯 杨相一 李昀辉 赵 莹 邢 栋 赵 伟 张艺慧 何东杰 张彦超 魏文术 李伟男 尹 海 庄媛媛 隗 樊 时 代 张 明 彭宇翔 陈 涛 刘 喆 郭胜基 刘筠璨 吴博峰 王铀之 郭 超 裴 超 李春阳主审黄本涛统稿郝洁 郭栋刘宝龙 李鑫 支持单位 北京金融科技产业联盟秘书处成方金融信息技术服务有限公司中国农业银行股份有限公司 中国工商银行股份有限公司中国银行股份有限公司 中国建设银行股份有限公司 腾讯云计算(北京)有限责任公司阿里云计算有限公司 上海浦东发展银行股份有限公司平安科技(深圳)有限公司 中国银联股份有限公司华夏银行股份有限公司 北京金融资产交易所有限公司 华控清交信息科技(北京)有限公司华为技术有限公司 同盾科技有限公司百行征信有限公司 深圳前海微众银行股份有限公司北京瑞莱智慧科技有限公司 蓝象智联(杭州)科技有限公司北京数牍科技有限公司 北京冲量在线科技有限公司 目录 第一章概述4 1.1.数据的兴起与应用4 1.2.政策与标准7 1.3.金融业数据应用发展特点11 第二章数据要素价值体系20 2.1.数据资产体系21 2.2.数据治理体系42 第三章数据能力建设与运营47 3.1.金融业数据服务建设47 3.2.金融业数据产品创新50 3.3.金融业数据运营管理52 第四章技术现状与安全防护69 4.1.数据采集与存储69 4.2.数据计算77 4.3.数据分析挖掘89 4.4.数据可视化99 4.5.数据安全技术104 第五章风险挑战与应对120 5.1.顶层设计和政策120 5.2.法律法规与标准122 5.3.业、技、数的融合124 5.4.数据资产管理126 5.5.数据安全与合规127 第六章发展展望与保障体系130 6.1.市场主体发展多元化130 6.2.数据应用新业态132 6.3.数据应用保障体系135 第七章典型案例153 7.1.数据要素价值案例153 7.2.数据能力建设案例165 7.3.技术现状与安全防护案例190 前言 据国际数据公司IDC预测,2025中国数据量将高达48.6ZB,占全球数据总量175ZB的27.8%,数字化时代已然到来。数据已发展成为当今社会重要的生产要素和战略资产,以数据为核心的数字技术成为驱动技术革命和经济社会发展的新动能。早在2013年,习近平总书记就曾指出:“大数据是工业社会的‘自由’资源,谁掌握了数据,谁就掌握了主动权”。2021年3月,十三届全国人大四次会议通过的《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中明确提出,要迎接数字时代,激活数据要素潜能,打造数字经济新优势、加快数字社会建设步伐、提高数字政府建设水平、营造良好数字生态,以数字化转型整体驱动生产方式、生活方式和治理方式变革。2021年12月,中国人民银行印发《金融科技发展规划(2022-2025年)》,指出以深化金融数据要素应用为基础,以支撑金融供给侧结构性改革为目标,以加快推进金融机构数字化转型为主线,将数字元素注入金融服务全流程,将数字思维贯穿业务运营全链条,注重金融创新的科技驱动和数据赋能。 为实现数字化转型,金融业采取和落实了一系列措施, 主要包括:优化组织架构、打造数据文化与创新基因、强化产学研合作、打造数字化能力等。本次编制的金融业数据应用发展报告即在此背景下展开,一方面介绍近年金融业在数 据应用方面的主要工作和成果,另一方面希望通过本报告为金融业后续的数据应用发展提供参考和支撑。 本报告基于大数据、云计算、人工智能技术与金融业务深度融合的金融科技时代背景,从金融业数据要素价值体系、数据能力建设运营、技术现状与安全防护、风险挑战和发展展望等视角出发,结合金融行业先进实践对大数据应用提升金融业务效能、优化资源配置效率、强化风险控制能力、促进金融创新发展等角度进行了阐述。 本报告在北京金融科技产业联盟数据专委会组织下,由中国农业银行股份有限公司牵头,中国工商银行股份有限公司、中国银行股份有限公司、中国建设银行股份有限公司、上海浦东发展银行股份有限公司、深圳前海微众银行股份有限公司、华夏银行股份有限公司、中国银联股份有限公司、成方金融信息技术服务有限公司、北京金融资产交易所、百行征信有限公司、华控清交信息科技(北京)有限公司、平安科技(深圳)有限公司、阿里云计算有限公司、腾讯云计算(北京)有限责任公司、同盾科技有限公司、北京瑞莱智慧科技有限公司、蓝象智联(杭州)科技有限公司、北京数牍科技有限公司、北京冲量在线科技有限公司等机构参与共同编写完成。 本报告编写过程中,北京金融科技产业联盟数据专委会 成员单位的相关专家对本报告进行了审阅,并提出宝贵建议,在此一并表示衷心感谢。因编写组理论水平和实践经验有限, 本报告中难免有疏漏和不足,欢迎各单位、专家学者提出宝贵意见和建议。 第一章概述 1.1.数据的兴起与应用 随着大数据、云计算、人工智能等新技术的快速发展,这些技术与金融业务深度融合,形成金融大数据,并逐步在金融业务中得到深入应用,推动我国金融业数字化和智能化的转型升级,助力金融更好地服务实体与社会。金融大数据的应用水平已经成为金融企业竞争力的一个核心要素。 金融大数据的应用能够有效提升金融业务效能、优化资源配置、强化金融风险控制能力、促进金融业务的创新发展,在银行业、证券行业、保险行业、支付清算行业和互联网金融行业都得到广泛的应用。具体落地应用场景包括信贷风险评估、交易欺诈识别、精准营销、供应链金融、运营优化、智能投顾、量化投研、风险定价、金融反欺诈、反洗钱等不同金融行业的多种具体业务场景。 金融数据的来源主要分为三种:一是金融机构业务经营过程中收集和产生的数据,包括金融机构的用户基本信息、用户在机构内金融行为数据等,例如银行中的用户资产负债情况、资金交易记录、信用数据等;二是金融机构通过外部采购或共享获取到的数据,包括来自第三方机构的数据,例如电商、运营商、支付、设备等,以及政务开放数据等;三是金融机构通过互联网获取到的公开数据,例如企业的舆情数据等。这些不同来源的金融大数据通过整合、分析、挖掘等发挥出重要的数据价值。 金融大数据的主要应用包括金融用户画像、金融统计分析、金融建模等。通过对金融大数据进行分析,可以为金融机构实现精准的客户画像,使得金融机构可以从具体业务角度出发对用户进行分析,更好地了解用户的需求,或更精准地寻找目标用户,此外也可以基于用户画像的深度分析,为开发出适合目标客群的产品提高数据支撑,或是指导开展适合的营销活动。例如在银行中,可以基于银行丰富的交易数据、个人属性数据、消费数据、信用数据、客户数据等,提取出客户的消费特征、兴趣爱好、社交需求、信用等级等大数据客户画像标签,基于这些客户画像可有效地通过实时营销、交叉营销、个性化推荐等来寻找信贷分期客户、高端资产客户、理财客户等不同业务产品的潜在用户,也可以实现客户生命周期管理,包括新客获取、客户流失预防、客户挽回等。 通过基于金融大数据的精细分析,可以优化运营。例如 通过金融大数据分析可监控不同市场推广渠道,进而调整渠道和优化推广策略;通过对客户行为进行分析,分析出客户的个性特征和风险偏好,智能化分析和预测客户需求,对产品进行创新和服务优化等。 此外,金融大数据与人工智能技术深入融合实现智能金融,贯穿金融机构服务的全流程,包括使得金融机构可以优化业务,例如应用生物识别等技术在手机银行、智能柜台等方面,使得业务流程更为精简高效,同时为人们提供更多样性的优质金融服务,应用智能客服提高与客户的沟通效率、 降低运营成本、提升用户体验。在金融风控场景,通过人工智能系统快速、准确识别金融活动的异常行为;通过量化分析和机器学习模型、深度学习模型等人工智能技术,构建用户信用模型与欺诈风险模型,快速预测用户风险,提升金融机构的风险识别能力与效能;通过人工智能技术学习以往数据规则,利用模型和算法,发现业务数据中潜在漏洞,优化金融风控策略等。在金融精准营销场景,针对不同场景通过人工智能技术构建用户分群模型、个性化推荐模型等,降低金融机构的营销成本,提升营销的效益。 在这些金融大数据的应用中,金融行业数据的共享、开 放逐步成为趋势,通过跨机构间的数据安全共享,挖掘出更大的金融数据价值。与此同时,对这些跨机构间合作的数据的隐私性、安全性的需求也日渐强烈,数据安全已成为当前金融数据应用的一个重要议题。被认为解决隐私保护、数据安全问题,实现金融数据“可用不可见”的隐私计算技术也逐步运用到金融数据应用中。 金融数据广泛分布在不同银行、互联网公司、政府部门等不同机构间,单机构间的数据价值挖掘已经逐渐难以满足多样性金融业务场景的需求,跨机构之间的金融数据共享与价值挖掘已被验证能更好满足多种金融业务场景需求。但近年来国内外各种法律法规的制定与实施,以及人们对于用户隐私和数据安全的关注度的提高,迫使金融机构需要考虑采用新的技术来解决金融数据的跨机构间的合作。目前,学术界和企业界都已经在研究大数据与人工智能、密码学技术的 融合,探索多方安全计算、联邦学习、可信执行环境等不同隐私计算技术路线的落地应用,在敏感数据或隐私数据不出域的基础下完成跨机构之间的联合计算、联合建模、联合查询等,打破数据孤岛,实现数据的可用不可见,并有效保护数据控制权,挖掘数据价值的同时避免数据的流失与滥用。 金融行业作为数字化基础设施最完善、跨机构数据协同需求最高、合规要求最严格的一个行业,必然成为隐私计算技术落地应用的天然场景,也是目前隐私计算技术应用最广泛的领域。金融联合风控、联合营销、存客运营、反欺诈、反洗钱等多种金融应用场景均已开展基于隐私计算技术的应用示范,并获得显著成果,实现了跨机构跨界的金融数据流通,提高了金融机构的风险防范能力和金融业务效能。 1.2.政策与标准 金融数据的技术融合应用目前处于加速探索阶段,各种政策、法令法规、标准在近年来相继制定。 2019年8月,中国人民银行发布了金融科技领域首份顶层文件《金融科技(FinTech)发展规划(2019-2021年)》,明确了六大重点任务,包括加强金融科技战略部署、强化金融科技合理应用、赋能金融服务提质增效、增强金融风险技防能力、加大金融审慎监管力度、夯实金融科技基础支撑,为金融科技发展指明道路。其中强调要科学规划运用大数据,打通金融业数据融合应用通道,破除不同金融业态的数据壁垒,化解金融信息孤岛,制定数据融合应用的相关标准规范, 发挥金融大数据的集聚和增值作用,推动形成金融业数据融合应用新格局。 2020年4月,中共中央、国务院正式发布《关于构建更加完善的要素市场化配置体制机制的意见》,首次把数据作为一种新型生产要素写入文件,与土地、劳动力、资本、技术等传统要素并列为五大生产要素,明确了完善要素市场化配置的具体方向与举措。文件中强调要加快培育数据要素市场,推进政府数据开放共享,提升社会数据资源价值,加强数据资源整合和安全保护,以及制定数据隐私保护机制和安全审查制度。数据作为数字经济和信息技术时代的核心基础,其重要性日益凸显。而金融业作为数据密集型行业,在数据要素时代能够起到很好的行业示范作用,在推动金融科技水平与数字化水平发展的同时可以深入地探索数据要素化的实践经验。2020年5月,中国人民银行与国家市场监督管理总局签署的《数据共享合作备忘录》,旨在加强跨地区、跨部门数据要素有序流转与融合应用,为加快建立现代中央银行制度、推动金融数字化转型、优化营商环境打