数据智能赋能金融数字化白皮书 北京金融科技产业联盟2023年12月 编委会成员: 编制委员会 赵韵东周天虹龚伟华聂丽琴赵焕芳俞吴杰闫晓林 编写组成员: 赵存超 贡佳炜 马晓煦 耿 博 代 铁 梁生吉 刘一阳 刘 妍 李义萍 焦 峰 钟新斌 许 翠 朱红伟 陈炜钊 李蓉娴 郭佳敏 石文鹏 卢金环 张少敏 董琦 张博 杜银翔 李金龙 贺瑶函 曹伯翰 李娟 牵头单位: 中国农业银行股份有限公司 参编单位: 中国银行股份有限公司招商银行股份有限公司北京银行股份有限公司 前言 随着移动互联网的普及和数字技术的强势崛起,我国正加速迈入数字经济时代,推动数字化转型成为金融机构面临的必要趋势。中国人民银行《金融科技发展规划(2022—2025年)》为新时期金融数字化转型谋定方向、明晰路线,金融机构需深入贯彻规划理念,高质量推进金融数字化转型工作。在大模型、生成式人工智能等技术加持下,数据智能技术正爆发出蓬勃的生命力,为金融机构推进数字化转型、依托创新释放数字生产力提供了重要抓手。在北京金融科技产业联盟人工智能专委会组织下,由中国农业银行研发中心牵头,联合中国银行、招商银行、北京银行相关部门共同开展数据智能金融应用研究,编制形成《数据智能赋能金融数字化白皮书》。 本文立足数据智能前沿技术,聚焦数据智能赋能金融数 字化,介绍数据智能基本情况,包括概念解析、国内外发展情况及顶层设计;从AI、BI等先进技术出发,深度解析数据智能技术演进趋势;结合银行业务场景阐述数据智能助力银行业智能化升级的可行路径,并给出典型案例;总结数据智能面临的挑战及发展展望。希望以此展示金融数据智能整体视图,为金融业应用数据智能提供有效借鉴和参考。 目录 一、数据智能发展情况概述1 (一)数据智能概念1 (二)国外数据智能发展形势3 (三)国内数据智能发展形势4 (四)�位一体数据智能顶层设计6 1.战略规划——谋6 2.组织架构——体7 3.制度建设——规8 4.标准规范——尺10 5.团队建设——群12 二、数据智能技术演进趋势12 (一)强化基础支撑,推进数据互联共享13 1.湖仓一体,夯实企业级数据底座13 2.实时数仓,高效应对实时场景15 3.数据编织,推动智能化数据管理16 4.隐私计算,赋能金融数据安全19 (二)打磨AI利器,推动金融智能化升级21 1.知识图谱,深化关联数据分析21 2.可信AI,提升模型可靠与可解释性22 3.大小模型协同,推进端云全方位协同进化24 4.大模型,聚焦NLP任务统一和多模态模型支持25 5.自适应AI,强化主动学习进化能力27 6.人工智能生成内容(AIGC),推动数字化内容创造28 (三)深入BI应用,持续释放数据价值30 1.极速引擎,支撑海量数据秒级分析30 2.SaaSBI,提供云原生BI能力32 (四)研发运营一体化,加速数据智能应用落地34 1.DataOps,敏捷响应业务需求34 2.MLOps,快速交付AI应用服务36 三、数据智能助力银行业智能化升级38 (一)数据智能企业级平台能力建设39 1.数据湖仓平台39 2.实时流计算平台40 3.AI平台42 4.BI平台45 5.隐私计算平台47 6.知识图谱平台49 (二)银行业数据智能典型应用案例51 1.智能营销51 2.智能决策60 3.智能运营65 4.智能风控72 5.智能监管75 四、金融数据智能面临的挑战与展望77 (一)面临的挑战77 1.数据安全问题77 2.伦理道德问题77 3.数据共享与流通78 4.算法可靠性及可解释性78 (二)展望与建议78 1.大模型助推高质量建模78 2.多模态整合数据统筹能力79 3.创造性AI释放数据潜力79 4.技术融合推动协同创新79 5.安全管理构筑防护体系80 6.政策标准引领数据治理80 五、结语80 一、数据智能发展情况概述 数据智能的概念范畴超越于人工智能,是涵盖算法、算力及应用的一整套体系。金融机构践行数据智能需完善自上而下的顶层设计,从数据获取、数据处理、数据使用的整个生命周期,充分运用金融机构海量数据优势,借助金融科技,极大化释放数据要素生产力,驱动金融机构智能化升级。 (一)数据智能概念 数据智能的历史可追溯到上世纪五十年代人工智能及大数据技术的兴起。目前业界对数据智能涵盖的技术及范围的定义和理解各不相同,但普遍认为数据智能与AI及大数据等技术密不可分。数据智能的典型特征是以海量大数据为基础,通过AI、大数据等技术手段,对数据进行采集、处理、分析和预测,充分捕捉数据特征及联系,挖掘潜在数据信息和模式,充分全面释放数据价值,服务于场景化业务应用。 本文尝试从金融业应用的角度出发,从以下几个维度去阐述 数据智能内涵和应用体系,如图1所示。 数据要素:数字经济意味着高度的数据化,金融机构作为数据密集型行业,在业务经营过程中积累了海量数据,数据要素成为金融业高质量发展的重要内驱。 生产力:金融科技为打磨数据要素提供了利器,成为推动金融业数字化转型的重要生产力。通过人工智能技术发掘数据价值,通过大数据技术沉淀数据底座,通过创新释放数据活力,提 升资源配置效率。 图1金融业数据智能架构 生产关系:作为面向商业应用的解决方案,商业智能 (BusinessIntelligence,BI)帮助企业梳理生产关系,系统化地整合及分析数据,助力于金融业务智能决策。 上层应用:数据智能技术可有效作用于金融业市场营销、运营管理、风险控制、监管合规等各环节,推动业务智能化、自动化,拓展金融服务领域。 组织保障:为充分应用数据智能,需从战略规划、组织架构、制度建设、标准规范、团队建设等完善数据智能的基础建设,落实组织保障。 整体而言,从数据要素、生产力、生产关系、上层应用、组织保障方面形成一整套数据智能管理闭环,金融业务经营过程中产生的各种数据,通过数据智能技术的加持服务于企业各应用场 景,不断沉淀数据资产,盘活数据价值,赋能企业数字化转型。 (二)国外数据智能发展形势 Gartner在近两年重要战略技术趋势中持续将数据智能相关技术作为重点方向,包括生成式人工智能(GenerativeArtificialIntelligence)、数据编织(DataFabric)、人工智能工程化(AIEngineering)、自适应人工智能(AdaptiveAI)、AITRiSM(人工智能信任、风险和安全管理,AITrust,RiskandSecurityManagement)等技术。 数据智能在全球的快速发展及创新热潮也促使人工智能相关监管政策排上了议程。欧盟在鼓励数据智能发展的同时,持续关注其存在的风险,审慎推进相关监管法案。2020年2月19日,欧洲委员会发布《人工智能白皮书》《数据战略报告》《数字未来报告》,谋求塑造欧洲数字未来,为数字领域的监管计划提供指引。2021年3月9日,欧盟委员会发布《2030数字指南针:欧洲数字十年之路》计划,为欧盟到2030年实现数字主权的数字化转型愿景指出方向,旨在构筑一个以人为本、可持续发展的数字社会。目前,欧盟正在推进一项《人工智能法案》,旨在确保投放到欧盟市场并在欧盟范围内使用的人工智能系统是安全的。但面临着如何判定哪些人工智能系统将被归为“高风险”、如何平衡保障数据隐私与阻碍创新的关系等难题。 美国对于数据智能技术的政策相比更为积极。美国政府一方 面将人工智能提升到国家战略的高度,致力于维持其在该领域的 全球领先地位,另一方面也高度关注人工智能风险,推动监管法规法案的落地。早在2021年1月,美国白宫就成立国家人工智能计划办公室,作为政府统筹与协调的中枢机构,负责监督和实施美国国家人工智能战略。并于2021年9月成立人工智能咨询委员会,就美国的人工智能竞争力、劳动力公平、资金、研究和开发、国际合作和法律问题提出建议,定期向总统及国会提交研究报告,为确保美国在人工领域的领先地位提供了组织保障。NSCAI(国家人工智能安全委员会)认为,美国在非国防人工智能研发领域的投资应该以2020财年的10亿美元为基准,在2026 财年到达320亿美元,使人工智能领域的研发投入与生物医药研 究持平。2020年,美国政府发布首份《人工智能应用监管指南》,针对人工智能应用提出十大监管原则,明确了人工智能重点监管方向。 (三)国内数据智能发展形势 在国内,国家相继出台和布局数据智能相关产业政策。2017年,国务院发布《新一代人工智能发展规划》(国发〔2017〕35号),明确将人工智能作为未来国家重要的发展战略,并部署三步走的战略目标。其中“第二步,到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济转型的主要动力,智能社会建设取得积极进展。”“第三步,到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能 经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。” 2021年11月,工信部正式发布《“十四五”大数据产业发 展规划》,要求到2025年,大数据产业测算规模突破3万亿元,年均复合增长率保持在25%左右,创新力强、附加值高、自主可控的现代化大数据产业体系基本形成。 2021年12月,中国人民银行印发《金融科技发展规划(2022 —2025年)》,提出“金融业数字化转型更深化”“数据要素潜能释放更充分”等总目标,并明确“强化数据能力建设”“推动数据有序共享”“深化数据综合应用”“做好数据安全保护”等重点任务。 2022年12月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》,形成我国关于数据基础制度的顶层规划。2023年3月7日,在第十四届全国人民代表大会第一次会议上,国务委员兼国务院秘书长肖捷就国务院机构改革方案向大会作说明,其中在数据管理领域,“组建国家数据局”成为国务院机构改革的一项重要内容。《关于国务院机构改革方案的说明》指出,在保持数据安全、行业数据监管、信息化发展、数字政府建设等现行工作格局整体稳定前提下,把数据资源整合共享和开发利用方面的有关职责相对集中。数据管理已经提升至国家战略高度。 当前数据资源已成为关键生产要素,中国数据量呈现指数级 增长,具有海量的数据规模和丰富的应用场景。根据IDC统计,中国数据规模将从2022年的23.88ZB(1ZB约十万亿亿字节)增长至2027年的76.6ZB,年均增长速度CAGR达到26.3%。对于金融业而言,在数据资产积累方面具有明显的优势,如何充分利用和管理数据,构建完备的数据资产基础设施,有效挖掘和利用数据价值,提升数据服务能力,成为金融业需深入探索的重要方向。 (四)�位一体数据智能顶层设计 为与中国数字化发展水平保持一致,银行业应坚持“数据”主线,在重点领域提供人工智能支持,为全行主体业务高质量发展提供有力的数字化赋能和支撑。提供基于数据的智能决策需要自顶向下发力,可从“谋(战略规划)、体(组织架构)、规(制度建设)、尺(标准规范)、群(团队建设)”五个方面着手开展顶层设计。 1.战略规划——谋 在数字时代下,数据战略已成为组织开展数据智能的基础,是数据智能长期发展的“方向标”。 一些银行在大数据上已具备较好的基础能力和服务能力,但在深化数智赋能所需的算力、数据、工具、保障相关能力支撑上,仍面临着诸多困难与挑战,主要体现为:数据基础能力有不足、数据供给能力待提升、数据研发工艺需完善、数据保障能力有缺失。 针对以上困难和挑战,可围绕“一个核心,两个保障,三个能力,四个转型”,支撑数据友好型系统建设,助力数字化转型战略落地。 “一个核心”是以数据应用五步闭环(筛选、布放、执行、回收、优化)为核心,持续推进各业务系统高水平用数,总结经验方法,提升业务经营能力。 “两个保障”指打磨数据工艺,建设一体化数据研发平台,落地数据服务流水线和流程规范,支撑数据服务快速交付;加强数据运营与安全,实现数据