您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[极客传媒]:大模型增强下的图智能在金融场景的应用 - 发现报告
当前位置:首页/行业研究/报告详情/

大模型增强下的图智能在金融场景的应用

金融2024-07-16贾志鹏极客传媒米***
大模型增强下的图智能在金融场景的应用

大模型增强下的图智能在金融场景的应用 Fabarta图智能解决方案架构师/贾志鹏 目录 •图智能技术在金融领域典型应用 •图智能技术当前遇到的挑战 •如何结合大模型技术和图智能技术应对挑战 •案例分享 图智能技术 什么是图? 一图观万物,一图胜千言 基于图论以点(实体)和边(关系)描述现实世界中个体和个体之间网络关系的数据结构。 有哪些图技术? 图数据库、图计算引擎、图可视化、图分析 什么是图数据库? 图数据库是基于实体和关系建模的数据库系统。以点、边为基础存储单元,以高效存储、查询图数据为第一设计原理的数据管理系统。 图智能技术的发展趋势和典型应用 10%->80% 图数据库/图分析平台 •到2025年,图技术将用于80%的数据和分析创新 •而2021年只有10%,将促进 30% 组织中使用 •到2023年,图技术会在全世界30%的组织中促进快速的场景化决策 •它将帮助找到数据中未知的关系,找到传统分析方法中不易发现的价值 参与数据和分析比例 •图构筑了现代数据以及分析能力的 50%/44%基础 •50%的Gartner客户咨询过围绕图技术的AI应用相关的话题 AI•44%的全球ML的研究都与图神经网络相关 来源:Gartner 整个企业的快速决策 非结构化数据 (word,pdf,text,image,video..) 知识图谱 知识图谱 问答 知识库 半结构化数据 基础图谱 集团图谱 实控人图谱 客户关联图谱 (Json,xml..) 结构化数据(MySQL,Oracle等关系型数据库,csv..) 图智能分析应用 反洗钱 风控 反诈骗 图智能技术当前在金融行业的应用 产交 图数据库 以图结构存储 图数据库存储 算法支撑 图计算引擎 基础图谱 图智能分析应用 图数据+AI分析 图神经网络/图卷积网络(GNN/GCN) 图算法支撑 知识图谱 基于图的知识存储/计算 基于AI的知识抽取加工融合 基于AI的知识获取/建模 数据获取 图智能服务 智能营销 私人银行潜在高净值客户挖掘 私人银行客户生态圈分析 对公客户生态圈分析 信用卡高价值成长路径分析 智能风控 贷款流向异常分析 贷款还款异常分析 企业状态异常分析 企业违约风险分析 反洗钱 构建面向反洗钱的图谱 分析建模发掘可疑个体 关联数据进行团伙发现 模型固化后自动化预警 反欺诈 资金环路、回流检测 欺诈交易发现 信贷申请欺诈团伙发现 对公信贷申请欺诈发现 知识库服务 智能搜索 智能问答 虚拟助手 半 结 构 化 数 据 非 关 系 型 数 据 库 结构化数据 业务前端用户 业务系统 生互 数应 据用 本体抽取 计算 知识推理 实体链接 实体对齐 属性抽取 结构化数据 知识图谱构建过程 知识图谱 存储 质量评估 实体消歧 指代消解 关系抽取 实体抽取 半结构化数据 非结构化数据 知识融合 第三方知识库 步骤1:数据获取 步骤2:知识建模与知识获取 步骤3:知识融合 步骤4:知识加工 步骤5:知识存储与计算 基础图谱构建过程 源数据 …. 执行事务合伙人表 高管任职表 上市公司表 股权表 实体基本信息 实控关系 实控人识别算法 实际控制人图谱 集团龙头识别 真实持股关系 股权穿透算法 企业图谱 集团成员关系 集团识别算法 集团图谱 图智能分析流程 业务理解 建立图谱 图探查 图模式&图计算 数据融通 •业务主题 •面向主题,构建 •针对图谱数据 •图算法分析 •通过数据/API/ •图谱类型•数据来源 图谱 •实体/关系识别•数据映射•数据加工 进行业务/数据分析发现 •结构性探查 •图模式识别 可视化的方式将分析结果集成到现有系统 图智能分析应用流程 发起业务诉求 业务校验 业务应用 图模型设计 数据来源即加工方式梳理 可视化分析探查 全量图算法/规则投放 图数据接入配置 图数据折叠 (关系加工) 已有算法/规则参数调整或定制算法/规则执行分析 全量图算法/规则执行和管理 多轮调整验证 数据同步 结果集成 图实例新建 数据全量/增量接入 加工逻辑验证 加工逻辑批量执行调度 执行结果批量回写入图 数据查询管理及计算资源调度 知识图谱 基础图谱 图智能分析应用 图智能技术当前遇到的挑战 如何加速图谱的使用 2.1如何理解业务需求并选择模式 2.2.如何将图数据结果更友好的呈现 1.图谱构建成本高 非结构化数据 (word,pdf,text,image,video..) 半结构化数据 (Json,xml..) 结构化数据(MySQL,Oracle等关系型数据库,csv..) 大模型辅助图谱构建 建图方式 建图场景 建图思路 大模型如何辅助 自动建图 •元数据之间的关系 •根据元数据利用大模型进行自动建图推荐,人工校验 •通过大模型进行元数据的补齐 •结构化数据的图构建 •根据元数据梳理的关系,自动构图,比如社交网络、供应链等 •通过大模型进行自动映射的发现 •非结构化数据:文档段落之间的关系- -粗粒度的图结构 •根据段落抽取对应的图•包括分级目录结构•切片前后关系•文档片段与标签的关系 •通过大模型对文档进行初步切分整理•通过大模型进行实体关系提取 •结构化数据与非结构化数据之间的关系 (企业内典型的关系场景) •组织机构关系•作者与文档、代码、工作项的关系•文档引用关系•根据关系自动构建 •通过大模型进行自动映射的发现 半自动建图 •非结构化数据:(word/pdf等)实体、关系抽取•需要进行细粒度的图谱构建•进行知识的抽取、积累 •大模型进行实体关系抽取;•根据抽取的反馈,大模型微调;•基于微调大模型做实体关系抽取•人工校验并入图 •根据需求可支撑不同场场景•可用于图谱辅助大模型问答;•可利用图和向量融合方式结合智能体进行问答 元数据构图-大模型辅助元数据补齐 字段中文名为空:大模型无法使用,需补齐 对公客户基础信息表 集团成员表 主合同_业务合同基本信息表 统一社会信用代码 TYSHXYDM 主要担保方式 MAIN_GUAR_MTHD GUAR_CUST_NO 字段中文名 字段名 担保合同信息表 Fine-tunedLLMwithDomainKnowledge (调优典型模式:常见行业术语、拼音首字母缩写、英文简写、英文简写与中文拼音混合) GUAR_SERIAL_NO 对公客户基础信息表 集团成员表 主合同_业务合同基本信息表 原 字段名 字段中文名 KHBH 客户编号 KHMCJYFWTYSHXYDM 字段名 字段中文名 jtcykhbhjtkhbhjtkhgx 集团客户关系 etl_dt 数据日期 字段名 字段中文名 cont_serial_no 合同流水号 cust_no 客户编号 main_guar_mthdguar_serial_no 始 元 据 数 展示示例 大模型智能元数据补齐 补齐的元数据 字段名 字段中文名 KHBH 客户编号 KHMC 客户名称 JYFW 经营范围 TYSHXYDM 统一社会信用代码 字段名 字段中文名 jtcykhbh 集团成员客户编号 jtkhbh 集团客户编号 jtkhgx 集团客户关系 etl_dt 数据日期 字段名 字段中文名 cont_serial_no 合同流水号 cust_no 客户编号 main_guar_mthd 主要担保方式 guar_serial_no 担保合同流水号 担保合同信息表 字段名 字段中文名 GUAR_SERIAL_NO 担保合同流水号 GUAR_CUST_NO 担保人客户编号 MAIN_GUAR_MTHD 主要担保方式 TYSHXYDM 统一社会信用代码 智能化补齐结果 补齐的元数据 字段名 字段中文名 KHBH 客户编号 KHMC 客户名称 JYFW 经营范围 TYSHXYDM 统一社会信用代码 字段名 字段中文名 jtcykhbh 集团成员客户编号 jtkhbh 集团客户编号 jtkhgx 集团客户关系 etl_dt 数据日期 字段名 字段中文名 cont_serial_no 合同流水号 cust_no 客户编号 main_guar_mthd 主要担保方式 guar_serial_no 担保合同流水号 担保合同信息表 字段名 字段中文名 GUAR_SERIAL_NO 担保合同流水号 GUAR_CUST_NO 担保人客户编号 MAIN_GUAR_MTHD 主要担保方式 TYSHXYDM 统一社会信用代码 合同: •合同号 •作者 •创建日期 •审核日期合同: •...•合同号 •作者 •创建日期 •审核日期 •... KHBH (客户编号) jtcykhbh (集团成员客户编号) cust_no (客户编号) cont_serial_no (合同流水号) GUAR_CUST_NO (担保人客户编号) 合同: •合同号 •作者 •创建日期合同: •审核•日合期同号 •... 表间关系 表内关系 结构化数据和非结构数据的元数据 •作者 •创建日期 •审核日期 •... guar_serial_no (担保合同流水号) jtkhbh(集团客户编号) GUAR_SERIAL_NO (担保合同流水号) Fine-tunedLLMwithDomainKnowledge+Vectorsearch (向量相似度TopN+LLM处理) 对公客户基础信息表 集团成员表 主合同_业务合同基本信息表 元数据关联关系发现 元数据构图-大模型辅助元数据关联关系发现和构建 企业数据源 ... 代码 组织结构 视频 图片 非结构化文档 结构化数据 图智能结合大模型在营销场景下的应用 Fine-tunedLLM MultimodalDatabase GraphEngine VectorEngine 请给出贷款企业公司A的风险分析报告 分析报告生成 贷款企业公司A持有的账户2024年是否存在关联交易? 图分析结果查询 贷款企业公司A和公司实际控制人三度关系以内的交易中,有哪些企业是房地产行业相关的? 图数据查询 Text2Cypher 智能体串联编排 Text2API 大模型增强图谱使用 Fine-tunedLLMwithDomainKnowledge 图分析任务结果 报告模版 图Schema信息 模式名称:关联交易 业务释义:三角计数模式指的是在一个金融交易网络中,三个节点(通常代表市场参与者或交易实体)互相之间存在交易关系,从而形成一个闭合的三角形结构。这种模式反映了市场参与者之间的高度互动和复杂的交易关系。 图智能结合大模型在金融风控下的应用 系统自动生成风险分析报告 知识问答 资金交易网络分析 资金来源去向 政策解读 实体关联分析 交易对手类型 图智能分析 图谱模型分析 多维分析 大模型 政策知识库 专家/历史经验库 图数据存储 客户关系图谱 交易图谱 企业工商图谱 机构内部数据信息第三方数据信息 ...... 资金来源信息 历史可疑报告 历史风险评级 外部协查信息 证照信息 工商信息 交易明细信息 客户变更信息 客户基本信息 元数据知识化 元数据管理 元数据补齐 元数据关系 数据血缘 数据知识化 解析/切片 向量化 内容解析 关系抽取 回答 图+向量多模态智能 引擎 图查询结果|多路召回|rerank Prompt拼接 答案生成 答案后处理 图增强RAG Fine-tunedLLM 用户问题 Agent任务调度 前处理(元数据筛选|敏感词过滤) 混合查询 向量相似度搜索 图查询与分析 图智能结合大模型在金融知识库下的应用 多模态智能引擎 企业内部私域数据 查询计划生成 代码 ArcVector隐式关系 组织 1.元数据知识化 2.数据转换为知识 (文档-人员、结构关系等) 3.文档、提交记录