大数据、大模型、大风控 01 大合作、大创新、大共存 02 关注问题:后发劣势、可解释性、社会智能等 03 目录 金融机构眼中的大模型技术 0 CONTENTS 数字化转型助力大模型 05 数据信托助理大模型 506 大模型治理 大数据、大模型、大风控 数据概念辨析 3.1 大数据、大模型、大风控 大 模 型 定 义 大模型的“智能类型” •《自然-机器智能》将大模型定义为网络参数规模达到亿级以上的“预训练深度学习算法”•大模型通过海量数据的训练学习,具备了强大的语言理解和表达、思维链推理等能力,在文本图像理解、内容生成等AI任务表现出显著优势和巨大潜力 •大模型通过文本语言等训练的模型,是一种感知智能,不是决策智能,更不是计算智能•感知智能:基于Bayes公式•决策智能:基于先验概率•计算智能:基于计算公式 大模型是一种生产力的提升“电力——智力” 大模型与传统模型的未来趋势:由共存到超越 •先共存:受制于计算复杂度高、可解释性差等问题,大模型会与传统模型会共存;•共存方式:大模型为中控,可解释性模型为外围•后超越:随着大模型复杂度降低、可解释性增强,大模型将逐步替代传统模型 •我们必须跟随时代潮流,逆潮流必然被淘汰•敌对的人:不屑——坚决——限制——迷茫•友好的人:好奇——尝试——学习——使用 3.1 大数据、大模型、大风控 系统性:大尺度和小尺度之间存在关系复杂性:由小尺度数据特征的动态非线性和随机关联可解释性:传播因子(阻碍因子)、传播路径《SCIembAI—跨尺度系统智能》介尺度的多模态建模方 传统风控 •认为风险就是不确定性•用流程管控风险•用资本抵补来管理风险•模型、压力测试等均为工具 传统风控 智能风控: •能够精准计量风控•风险、利润、客户的最优化管理是一个体系,是为银行战略服务•客户主标尺•风险主标尺 大合作、大创新、大共存 大合作 大数据整合: •银行内部大数据的整合•银行外部大数据的补充 大合作 大算力合作: •非核心竞争力的专业能力一定要外包•云上大模型 •迁移大模型能力•结合行内大数据与知识库•以银行的小规模算力打造轻量级推理模型(精调模型) 大创新 智 能 客 服 机 器 人 责 任 客 服 V S 非 责 任 客 户保 险 公 司 的 产 品 推 荐提 升 客 户 粘 性 智 能 风 控 、 反 欺 诈 、 反 洗 钱 标 注 样 本写 代 码 写 算 法环 境 感 知 智 能 O A智 能 写 文 稿智 能 运 营 大共存 由 共 存 到 超 越 共存:大模型随通用能力增强,将逐步超越传统模型的能力,但受制于计算复杂度高、可解释性差等问题,短期内,大模型和传统模型会共存。共存方式:大模型可作为中控,将传统模型作为技能进行调用。超越:随着若大模型计算复杂度降低、可解释性增强,综合性价比来看,大模型将逐步替代传统模型 大共存 关注问题:1. 后发劣势2. 可解释性3. 社会智能4. “类征信” 避免“后发劣势陷阱” “后发劣势陷阱” 缺乏业务的实践经验对智能风控体系建设的要点理解并不充分选择性模仿表面、容易实现和出成果的部分 科技整合 算法研究 数据基础 要“横眉冷对千夫指”,要做革命性的、基础性的科技改造来实现业务全流程的互联互通,进而实现对业务的敏捷支持 要“俯首甘为孺子牛”,做大量的、耗时间的的数据工作,以实现对模型的效能的提升 要“甘做无名英雄”,逐步建立算法研究能力,进而“随风潜入夜,润物细无声”的实现智能风控对业务完美支持 其余问题 类 征 信 持 牌 ? 金融机构眼中的大模型技术 金融机构眼中的AI技术 知 识 图 谱 生 物 特 征 识 别 客 户 身 份 验 证 、 远 程 开 户 、 刷脸 支 付 等 场 景 对 贷 款 信 息 、 行 业 信 息 建 立 关 系 挖掘 模 型 , 通 过 机 器 学 习 进 行 模 型 训练 机 器 学 习 算 法 计 算 机 视 觉 深 度 学 习 、 强 化 学 习 、 自然 语 言处 理 人 脸 识 别 、 票 据 识 别 、 场 景 识 别 自 然 语 言 处 理 智 能 语 音 词 嵌 入 、 句 子 嵌 入 、 编 码- 解 码 、注 意 力 模 型 问 答 、 咨 询 、 理 财 、 查 询 ; 身 份 识别 、 智 能 客 服 、智 能 理 赔 等 金融机构眼中的大模型能力 人 机 交 互 能 力 覆 盖 审 计 、 财 务 、 客 服 、 营 销 、 承 保 理赔 等 多 个 保 险 领 域 业 场 景 一 岗 多 能 生 成 式 能 力 贯 穿 远 程 银 行 全 条 线 业 务 工 作 内 容 , 覆 盖事 前 运 营 、 事 中 辅 助 和 事 后 质 检 等 环 节 代 码 生 成内 容 生 成 金融机构眼中的大模型技术发展历程 金融机构眼中的大模型缺陷 数据安全缺陷:多个环节存在合规问题 智能缺陷:感知智能而非决策智能 技术缺陷:人工智能算法固有缺陷 •1.在个人信息收集阶段,当用户在使用ChatGPT时,会输入自己的个人数据,依据《个人信息保护法》强调单独授权。•2.在个人数据的加工使用阶段, •通过文本语言等训练的模型,其 智 能 类 型 是 受 限 的 , 可 见ChatGPT只不过是一种感知智能,不是决策智能,更不是计算智能。 •一是,算法黑箱。由于算法模型的黑箱运作机制,其运行规律和因果逻辑并不会显而易见的摆在研发者面前。 系统安全与稳定性 ChatGPT使用了RLHF的训练方法,用户使用过程中的输入和交互信息可能会用于其持续迭代训练,进一步被用于为其他用户提供服务,可能构成数据共享,这时已与用户初最初使用目的相悖,根据《个人信息保护法》需要重新授权。•3.训练数据的获取。ChatGPT •二是,算法鲁棒性。算法运行容易受到数据、模型、训练方法等因素干扰,出现非鲁棒特征。可能会有针对性的病毒产生。 感知智能:基于Bayes公式决策智能:基于先验概率计算智能:基于计算公式 网络安全风险 •智能缺陷就是ChatGPT的使用边界。 •三是,算法歧视。算法以数据为原料,如果初始使用的是有偏见的数据,无形中会导致生成的内容存在偏见或歧视,引发用户对于算法的公平性争议。歧视主要来自资本绑架,体现为训练样本数量。 通过抓取互联网上的信息,可能存在合规问题。•4.数据泄漏。用户在使用过程 •例 如 , 在 金 融 机 构 中 ,ChatGPT不是决策智能,用于风险决策受限;ChatGPT不是计算智能,用于资本计量受限;ChatGPT是语言领域的感知智能,可以以文字助手的身份嵌入大部分和文本相关的工作。 技术同质性风险 中输入个信息,以及企业用户输入的各类工作相关信息,可能导致公司敏感信息泄露。•5.算法缺陷导致数据主体行权 学习局限性性风险 困难。如更改权、删除权、访问权等行权困难。 •九博士:量化、风控试错 数字化转型助力大模型 生产关系适应生产力的发展 生 产 力 与 生 产 关 系 金 融 领 域 转 型 的 三 要 素 体 现 为 : 生 产 力 决 定 生 产 关 系生 产 关 系 要 适 应 生 产 力 的 发 展生 产 关 系 会 反 作 用 于 生 产 力经 济 基 础 决 定 上 层 建 筑 【 2 】 数 据 【 2 】 新 科 技 2021年国务院《关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据要素与土地、劳动力、资本、技术等市场要素相并列。 【 2 】 资 源 分 配 技术的转型、金融科技转型、银行的三次转型 数据信托助力大模型 数据驱动模型与算法发展的逻辑 智能风控领域模型算法的发展:专家评分卡→逻辑回归→集成学习、深度学习 数据要素化的发展逻辑 数据与生俱来的是: 数据与众不同的是: 数据与日俱增的是: 价值的特殊性:数据价值不在于数据本身,数据价值来源于数据的技术加工,体现于数据的权益支配。 具备三重属性:资源属性、技术属性、金融属性。 数据要素的外部性对促进数据价值交换的数据要素市场化的客观需求。 发展逻辑 数据的与生俱来、与众不同、与日俱增,共同决定了数据形态变化必将遵循: 1.由数据记录到数据资源、2.由数据资源到数据资产、3.由数据资产到数据要素、4.由数据要素到要素市场化 理解数据资产 资产的会计计量方法总结 历史成本法:获取资产时实际付出的成本公允价值法:交易双方自愿交易的价格现金流折现法: 资产未来产生的现金流量按照一定方法折成当前价值重置成本法:按照资产当前情况,重新获取同样资产所付出的代价可变现净值法: 预计售卖后得到的净值 数据资产的商业模式探讨 数据交易所 数据银行 数据信托 •信托财产“双重所有权”与数据资产所有权和控制权分离的特质具有契合性•信托业务创新可以为数据资产创设更广阔的应用场景•数据的正外部性与相关性,更多数量和维度数据的汇集会产生更有价值 •个人数据资产采用银行模式进行管理和运营•实现个人数据的增值和有序流通•个人大数据资产的管理与运营综合服务系统 •政府主导的数据交易所模式涌现•第三方专业技术和政府资质完成监管、加密等合规支持 信 托 ( T r u s t ) 是 指 委 托 人 基 于 对 受 托 人 的 信 任 , 将 其 财 产 权 利 委 托 给受 托 人 , 并 由 受 托 人 针 对 受 益 人 的 利 益 或 特 定 目 的 , 按 照 委 托 人 的 意 愿 ,对 信 托 财 产 进 行 独 立 的 管 理 、 处 分 和 风 险 隔 离 , 以 自 己 的 名 义 管 理 和 处分 信 托 财 产 的 行 为 。 当 上 述 “ 财 产 权 利 ” 变 为 “ 数 据 ” 时 , 就 形 成 了 数 据 信 托 。 目 前 对于 数 据 信 托 定 义 的 内 涵 和 外 延 还 在 不 断 变 化 , 但 基 本 形 成 如 下 共 识 : 数据 信 托 是 一 种 关 于 数 据 要 素 的 、 市 场 化 的 、 制 度 化 的 、 功 能 化 的 、 结 构化 的 、 形 成 共 识 的 数 据 生 态 框 架 。 在 数 据 要 素 市 场 化 阶 段 , 信 托 的 成 熟 框 架 , 叠 加 数 据 商 品 的 金 融 属性 增 强 , 有 助 于 市 场 化 地 促 进 数 据 要 素 的 合 理 配 置 , 发 挥 数 据 要 素 对 经济 社 会 发 展 的 乘 数 效 应 。 数据信托助力数据大市场 大模型治理 •人类画家的不同主要是风格•风格即模型•调整模型参数,可以得到这个画家一系列作品•基于大模型的原始能力基础上二次开发 从哲学角度:AI模糊了主体与客体的概念 从哲学角度:AI时代中,主体与客体的关系在潜移默化 1、潜移默化•搜索引擎•主动推荐 2、潜移默化 •我在利用AI扩展我的智能•AI在利用我展示他的智能 大模型的治理 01生产力 潜移默化 新技术形成新生产力 •搜索引擎•主动推荐 02生产关系 •我在利用AI扩展我的智能•AI在利用我展示他的智能 新生产力产生新生产关系 0 3科 林 格 里 奇 困 境C o l l i n g r i d g e ' sD i l e m m a 一项技术如果因为担心不良后果而过早实施控制,那么技术很可能就难以爆发,反之如果控制过晚,技术已经成为经济和社会结构的一部分,就可能走向失控,再来解决问题就会变得更加昂贵、更加困难 机 器 宣 传 从治理角度:人工智能的治理 03 02行业自律:伦理先行 相关法规:技术与内容并重01 企业治理:主体责任与社会责任 我