人工智能在金融行业中的创新应用 杨青 度小满技术委员会执行主席,数据智能部总经理 2023.11.19 CONTENTS 1.人工智能与金融行业:正当其时,大有可为 2.开始的结束:厚积薄发,传统式人工智能驱动金融业务 3.开始的开始:另辟蹊径,生成式人工智能重塑金融业务 4.未来展望:传统与新兴融合,人工与AI协作 CONTENTS 1.人工智能与金融行业:正当其时,大有可为 2.开始的结束:厚积薄发,传统式人工智能驱动金融业务 3.开始的开始:另辟蹊径,生成式人工智能重塑金融业务 4.未来展望:传统与新兴融合,人工与AI协作 从业务支撑到创新驱动,技术助推金融进入数智化时代 信息化数字化数智化 IT+金融 2004 互联网金融 2016 AI+金融 技术作为基础设施形成业务支撑 •信贷系统 •线上保单管理 •理财信息化管理 科技转向前台 进入金融业务核心环节 •网上银行 •在线投保、查询、理赔 •在线理财咨询、投资规划 技术与业务融合 技术创新驱动业务变革 •智能承保、智能理赔 •智能投顾、智能投研 •智能获客、智能风控、智能运营 4 驱动后台驱动前台驱动创新与变革 金融数智化时代,机遇与挑战并存 把握机遇直面挑战 5 国家政策鼓励金融数字化和智能化的发展 隐私保护和数据安全等合规挑战 传统式人工智能厚积薄发,加速价值释放 生成式人工智能另辟蹊径,打开创新空间 技术变革对人才和组织形成挑战 机遇一:鼓励发展科技金融,以数智化增加金融的科技含量 2023/102023年中央金融工作会议 •把更多金融资源用于促进科技创新,做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大 文章,推动金融高质量发展。 2023/2《数字中国建设整体布局规划》 •做强做大数字经济,特别是推动产业数字化——在金融等重点领域,加快数字技术创新应用 2022/9中国人民银行、市场监管总局、银保监会、证监会印发《金融标准化“十四五”发展规划》 •强调发展数字金融产业、推动个人金融服务数字化转型…构建安全高效的金融服务生态、提高数字化风控能力 2022/1《金融科技发展规划〈2022-2025年》 •八个重点任务中。强调深化数字技术金融应用 2022/1 国务院《“十四五”数字经济发展规划》 •加快金融领域数字化转型,合理推动人工智能、区块链、大数据在银行等领域的应用 2017/7 国务院《新一代人工智能发展规划》 •创新智能金融产品和服务,发展金融新业态;鼓励金融行业应用智能客服、智能监控等技术和装备;建立 6 金融风险智能预警与防控系统 7 机遇二:数据、算力、算法共同推动AI技术进步 算法 推动AI技术进步 三驾马车 数据算力 数据规模更丰富、利用更深入,为AI技术进步提供充足燃料 宏观层面, 市场数据规模不断增长,数据不断丰富,流通制度更加清晰 微观层面,随着数字化转型不断深入 加速金融场景下的数据生产和使用,数据飞轮加速转动 8 •随着数字化转型的加速推进,中国的数据规模呈现出爆炸性增长的趋势。截至2022年,中国的大数据市场规模已达5631亿元 •截止2022年底,我国已成立48家数据交易机构,年全国一体化政务数据共享枢纽发布各类数据资源1.5万类,累计支撑共享调用超过5000亿次 •2023年10/25,国家数据局正式揭牌,标志着全国“一 盘棋”宏观统筹数据发展和安全,对构建数据流通体系,激活数据生产力有重大意义 数据来源:赛迪《2022-2023年中国大数据市场研究年度报告》 更多数据 行为数据,自证数据,… 更多用户 使用,推荐,… 更多用户反馈 匹配需求,精准offer,… 满意度,风险,… 更好产品 理解,修正,… 更准确模型 算力稳定增长,为AI技术进步提供坚实支撑 政策支持下,中国算力将进入新一轮发展期 ——2023/10工信部等六部门联合印发《算力基础设施高质量发展行动计划》 •算力基础设施高质量发展,规划明确 我国算力持续稳定增长,加速AI能力提升与应用进程 •我国算力总规模近五年年均增速近30%。处理复杂任务的速度、大规模并行计算的能力、解决复杂问题的能力均有提升 数据来源:工信部、中国信通院 目标——到2025年, 计算力方面,算力规模超过300EFLOPS,智能算力占比达到35%, 东西部算力平衡协调发展。 运载力方面,国家枢纽节点数据中心集群间基本实现不高于理论时延1.5倍的直连网络传输,重点应用场所光传送网(OTN)覆盖率达 到80%,骨干网、城域网全面支持IPv6,SRv6等创新技术使用占比达到40%。 存储力方面,存储总量超过1800EB,先进存储容量占比达到30%以 上,重点行业核心数据、重要数据灾备覆盖率达100%。 应用赋能方面,打造一批算力新业务、新模式、新业态,工业、金融等领域算力渗透率显著提升,医疗、交通等领域应用实现规模化复 制推广,能源、教育等领域应用范围进一步扩大。每个重点领域打造 30个以上应用标杆。 9 4个方面保障措施:加强统筹联动,加大金融支持,深化交流协作,强化平台支撑。 算法持续创新,为AI技术进步提供强劲动能 因果推断 提升 经营效率 时序网络 +W2+W3 +W1需求需求需求 流失流失流失提升 序列模型t+W3用户留存 t+W2 t+W1 0txt+W1xt+W2xt+W3 算法持续创新,为业务带来新可能应用场景和业务需求加速算法创新 模型区分度显著提升 深度学习 高模能力,和评 KS (数据处理、特征处理能力更强) 剥离变量全集 机器学习 归模量化 决策精度相对提升,判断未知风险能力弱 模型区分度大幅提升 通过多层非线性变换, 算法&业务 混淆因子 因果因子 因果效应 人工规则 线性回归 据和总结式,险. 处理时间长、无法自动更新,决策误判高 通过分析历史数风险案例,专家出一些规则和模用于识别和预测风 通过建立线性回型,对风险进行评估和预测 通过机器学习提型的性能和泛化更加准确地识别估风险。 深度学习可以从数据中学习到更加抽象和高级的特征表示,进一步提高风控的精度和性能 互相驱动持续创新 结果变量 10 以大数据风控为例 11 2017 2018 2021 2022 2023 机遇三:生成式人工智能迅速演进,打开金融创新空间 赋能领 域 金融+AI,赋能金融业务 t o企业内部 价值 提高生产效率to用户 提升决策精度 推动产品创新研发办公 趋势1:模型技术升级与产品发布更迭速度加快趋势2:模型模态逐步丰富 2018年6月2021年5月2022年3月2022年5月2023年2月2023年3月2023年3月2023年5月2023年10月 OpenAI发布GPT谷歌发LaMDAMidjourney内测Google发LAMDA2Meta开源LlamaopenAI发布百度发布StabilityAI发布百度发布 GPT4文心一言视频生成大模型Comate编程助手 至今 2017年6月2018年10月2022年2月2022年4月2022年11月2023年2月2023年3月2023年4月2023年9月 Transformer谷歌发布DeepMind推出编码OpenAI发布文生图openAI发布清华智谱发布Google发布具多模百川智能发布腾讯发布架构发布BERT引擎AlphaCode模型DALL-E2ChatGPTChatGLM模型态大模型PaLM-E百川大模型混元大模型 图例大模型架构对话大模型代码生成模型视觉大模型具身大模型 营销服务运营风控… 生成式AI技术爆发 12 挑战:金融数智化时代,需坚持以合规为基础、以人为中心 合规发展 数据合规与隐私保护 ▪数据合规:如何适配快速变化的数据收集、处理和存储相关合规要求 以人为本 人才重塑▪技术变革下的技能匹配:如何做好业务+AI人才培养与留存 ▪技术变革下的人机协作:如何更好的利用AI提升生产力,提升工作效率 组织变革▪技术变革下的文化建设:人和机器如何协同共进,创造更大价值,员工要能适应技术发展趋势 ▪技术变革下的组织优化:Copilot,Agent智能体将不断涌现,也会将重溯整个组织形式 ▪隐私保护:如何应对好金融行业严格监管要求下的数据泄露、数据滥用等数据隐私问题 CONTENTS 1.人工智能与金融行业:正当其时,大有可为 2.开始的结束:厚积薄发,传统式人工智能驱动金融业务 3.开始的开始:另辟蹊径,生成式人工智能重塑金融业务 4.未来展望:传统与新兴融合,人工与AI协作 目前金融已深度集成AI,AI创新可对业务形成巨大驱动 身份核验客户服务营销获客投研投顾合规风控 业务发展 金融业务 + AI技术 金融已深 度驱动 AI+金融集成 AI 14 计算机视觉智能语音自然语言处理机器学习 ……知识图谱 AI技术进步 以信贷为例,传统人工智能驱动信贷全价值链升级 全流程的决策优化全方位的降本增效 提升获客决策精度,实现有效率的增长 智精准客户定位 能个性化推荐 信智能营销策略 贷… 提升风控决策精度,降低信贷风险 征信数据解读大数据风控智能信审 ...... 模型辅助运营,提升经营效果 差异化定额个性化定价 多样化还款方式 ...... 传统人工智能 理 传 自然语言处 因果推断 机器学习计算机视觉智能语音… 统 信 模式:推广人员广撒网覆盖主流流量渠道,投放策略多基于经验,效果强依赖平台流量供给 问题:不确定性强,效率低成本高 贷 获客 模式:大量信审人员,依靠有限的结构化数据,基于规则与经验做出风险判断 问题:风险隐患大、效率低成本高 风控 模式:运营人员只关注群体用户的关键指标,依靠经验和少量实验判断用户偏好,做出经营决策问题:运营决策偏主观,重视群体忽视个体 15 经营 信贷风控:NLP技术演进,提升文本解析和风控决策精度 业务问题 借助自然语言处理技术迭代发展,实现风险区分能力大幅提升 风险区分能力提升 业务场景 文本信息解读风险 信贷风控用户大量的风险信息以文本形式存在,如客户征信、合同、社交媒体信息等,依赖精准高效的文本解读能力 KS12% 15% 18% 26% 29% 词袋模型 注意力机制 Bert微调 分片式序列模型 预训练 人工经验 根据专家经验,利用简单规则或者关键词库,从文本中提取信息,难以充分提取用户相关文本数据中蕴含的信息,风控效果差强人意 关键词表 人工 传统解决方案 Case:谁是坏人? 用户A 急用 花呗套现 应用于智能风控业务 用户B 带鱼大狮 羊毛 怎么回血 欠信用卡15万3年没 还 现 人在撸口子圈 砍头息 买马缅甸腾龙 面单四件套 16 文本 传统、可人工统计黑话、文本 更有效的新词发精准的语义表示 信贷风控:图机器学习,提升征信解读和风险区分能力 力 业务问题结合图机器学习,实现征信报告智能解读,显著提升风险区分能 业务场景 深度解读征信 征信报告信息丰富,是信贷风控主要数据来源之一 个人信息 身份信息 地址信息 工作信息 度小满智能化征信解读中台获 40万+ 风险变量 吴文俊人工智能科学技术奖 征信解读的五个发展阶段 人工经验人工特征衍生机器自动衍生 深度学习 信贷风险降低 25% 图机器学习 摘要信息 提示信息 账户信息 逾期信息 查询信息 记录1 记录2 记录3 个人信贷记录 传统 贷款记录 •组织、额度等 •过去60个月还款记录 (准)贷记卡记录 •组织、额度等 •过去60个月还款记录 人工解读 同数据集下效果KSBaseline22%24%26%27% 记录1记录2 记录1记录2 以查询/借还款行为和机构为节点构图,捕捉同样 利用工作单位、居住地址信息,结合股权关系等外 图算法进展和效果 阶段1:单报告内部关系图阶段2:多个报告之间关系图阶段3+动态图、时序图 动态预测节点之间的关系, 解 决依赖解读征信的人员专业方知识和经验——风险挖掘案能力不佳 •难以捕获其他人对用户的风 险影响 •难以处理用户风险随时间动态漂移的问题 行为在不同关系场景下的不