您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国银保传媒股份有限公司&腾讯研究院]:2023金融业大模型应用报告 - 发现报告
当前位置:首页/行业研究/报告详情/

2023金融业大模型应用报告

2023金融业大模型应用报告

2023金融业大模型应用报告 破除虚妄务实求效 中国银保传媒股份有限公司&腾讯研究院 2023年11月 ©2022KPMGHuazhenLLP,aPeople'sRepublicofChinapartnership,KPMGAdvisory(China)Limited,alimitedliabilitycompanyinMainlandChina,KPMG,aMacau(SAR)partnership,andKPMG,aHongKong(SAR)partnership,arememberfirmsoftheKPMGglobalorganisationofindependentmemberfirmsaffiliatedwithKPMGInternationalLimited,aprivateEnglishcompanylimitedbyguarantee.Allrightsreserved. *致谢:毕马威企业咨询提供全程技术支持 2 序言 司晓 腾讯研究院院长 大模型能力正逐步渗透至各行各业,催生新一轮创新浪潮和行业变革。在金融领域,行业大模型为金融市场带来了前所未有的机遇,从精准营销、客户服务、代码生成等多个场景,助力金融机构在服务和管理方面实现“效率革命”。展望未来,我们期待金融行业加速迈向AI驱动提质增效的新阶段。 胡利明 腾讯云副总裁 以大模型为代表的新一代人工智能技术,正在加速改变人们的生活方式,助力千行百业;在金融行业,借助领先的数字化基础,云基础架构和AI的深度结合,大模型的应用将比其他行业更加超前,更快速更深刻的重塑金融服务的体验,提升服务效率,洞悉市场和风险;相信在业界共同的探索创新之下,金融大模型高质量高价值的应用将不断涌现。 杜增良 中国银保传媒党委委员、总经理 近一年金融业对于大模型的探索和运用日益增多,我们感受到行业对于新技术学习和应用的强烈需求。期待通过本报告的发布,催化“科技+金融+产业”有机融合,营造理性的技术创新应用氛围,助力产业链价值跃迁。 黄艾舟 毕马威企业咨询金融科技主管合伙人 数字经济的蓬勃兴起为金融创新发展构筑广阔舞台,大模型的涌现促使金融科技行业范式变革。在风险防控的前提下,坚持以金融科技支撑金融本质,以审慎包容的心态探索大模型注入金融科技的新能力、新场景与新模式,金融科技必将朝着更加开放、创新、可持续的方向发展。 柳晓光 毕马威企业咨询 金融数字化转型咨询主管合伙人 伴随着金融机构数字化体系的演进,金融业数智建设正从“立柱架梁”逐步迈进“积厚成势”。面对以大模型为代表的新兴技术的颠覆式冲击,应理性剖析大模型技术态势,聚焦应用场景,夯实支撑保障体系,探明发展路径,构建安全高效、价值跃迁的金融运营新生态。 引言 大模型发展现状 •人工智能生成内容技术蓬勃发展,行业大模型与通用大模型竞相培育,伴随着生成内容的可控性增强,垂直场景的试点与探索不断加速,各产业纷纷探索适合自身发展的适配性场景。 技术培育 行业亟待破局 基于大模型的金融场景 •金融行业是大模型场景探索、应用落地的肥沃土壤,具备信息、数据、知识、人才密集型的特性,顶层政策与区域性规划持续推进前沿技术在金融业的实践与体系建设。 行业基础 ?多在试验性探索和点状尝试,金融产业链尚未 •大模型是未来金融的商业变革核心驱动之一,重点归集于三大方向:金融机构在服务客户方面的降本增效、场景变革和产品升级;用户获取金融服务入口的潜在迁移和变化;金融行业价值链条的重塑。 价值趋势 形成基于大模型的体系化应用共识和领先范式,尚未形成标准化的应用演进模式与明晰的场景ROI判断框架 本报告将结合腾讯研究院、银保传媒与毕马威在基础大模型的沉淀与洞察、在银行、券商、资管等数字化转型与落地的深度积累,破除虚妄,力求客观、准确地反映相关趋势,以务实求效的核心基准探明金融业大模型的应用场景。 3 目录 01全球大模型发展趋势研判—— 02破除虚妄:大模型在金融业的场景落地边界—— 03务实求效:大模型在金融业的价值与应用—— 04总结与展望—— 05页 10页 19页 29页 4 01全球大模型发展趋势研判 5 第四波AI浪潮核心驱动 大模型技术发展态势 近年来,通过在大规模语料库上对Transformer模型进行预训练,研究者们提出了在自然语言处理(NLP)任务中表现突出的预训练语言模型(PLM),并发现随着参数规模的扩大,模型会进化出上下文学习等新型特殊能力,为区分不同参数规模下的语言模型,大语言模型应运而生。 大语言模型 LargeLanguageModel 预训练语言模型 Pre-trainingLanguageModel Transformer模型 语料库预训练参数规模扩大 OpenAI所发布的ChatGPT和GPT-4是大模型发展的两大重要里程碑:ChatGPT通过将人类生成的对话引入训练数据,使AI具备了与人类同频顺畅交流的能力,而GPT-4则将文本输入扩展到多模态信号 Google:GPT-1OpenAI:GPT-2OpenAI:GPT-3 … 2021 “百行千模“ OpenAI:WebGPTGoogle:GLaM … 2022 OpenAI:ChatGPTMeta:OPT-IMLGoogle:GLaM 清华大学:GLM … 2023 OpenAI:GPT-4Meta:LLaMAGoogle:Bard 腾讯:混元 百度:文心一言 大模型能力催生场景变革 通过共性学习进行预训练提升模型水平,结合特性学习适配场景特性,并以“大模型+工具平台+生态”的协同模式完成应用场景的落地。 TransferLearning MANYTASKS ONEMODEL WORLD’SDATA 如今:文本(所有语言) TASK3 DATASET1MODEL1TASK1 大模型和预训练让人工智能完成跃迁,诱发了技术质变 … 范式变革 多模态模型提升决策与生成内容的精准性 多模态模型可以同时处理包括声音、文本、图像、信号、视频等在内的信息,处理内容更加多元,综合性决策与内容生成更加精准 超级海量数据,无需人工标注;具有跨领域知识的“基础模型”,可执行多类型任务 单一领域数据集;诸多数据集合诸多模型各成孤岛缺乏纵效;劳动密集型的数据标注 未来:多模态(图像、语音、视频、3D...) DATASET2MODEL2TASK2 迁移学习 FoundationModel 基础模型 Knowledge DATASET3MODEL3 … 6 国内外政策环境现状 从2020年开始,美国、欧洲和中国先后出台面向AI的监管政策,对泛AI应用提出了安全性、透明度、可解释性等方面的要求,人工智能步入监管时代。 美国:《人工智能应用监管指南》,2020年1月 欧盟:《人工智能白皮书》,2020年2月 中国:《新一代人工智能伦理规范》,2021年9月 中国:《互联网信息服务算法推荐管理规定》,2022年3月 美国:《人工智能风险管理框架》,2023年1月 中国:《互联网信息服务深度合成管理规定》,2023年1月 欧盟:《人工智能法案》,2023年6月 中国:《生成式人工智能服务管理暂行办法》,2023年7月 2023年,随着生成式AI应用的指数级爆发,全民AI的普及,中国率先发布了针对生成式AI的监管政策: 1.《互联网信息服务深度合成管理规定》正式将生成式AI纳入我国的监管范围,要求生成式AI服务提供者应当采取技术或者人工方式对输入数据和合成结果进行审核,并在合理、显著的位置向公众提供深度合成的情况。 2.《生成式人工智能服务管理暂行办法》标志着我国对生成式AI的治理监管进入体系化阶段,《办法》明确了对生成式AI实行分类分级监管的基调,涵盖从模型训练、应用运行到模型优化的全生命周期,并规定了服务开发者、提供者的算法备案义务,未来,算法安全监测、数据安全管理、个人数据保护将成为AIGC开发和使用过程中的合规要项。 •《数据保护法》(2021年6月):加强对消费者数据的保护,并对处理消费者数据的实体提出新的要求。处理消费者数据的实体将被要求制定和实施保护个人数据的安全计划,收集数据需要消费者同意,消费者有权访问、更正和删除其个人数据。 •《金融数据透明度法案》(2022年12月):要求联邦金融监管机构在格式、可搜索性和透明度方面采用特定的数据标准,以进一步推动监管技术和人工智能应用的发展。 回睽金融业,目前尚未有关于大模型的垂直监管政策出台,但各国家及地区关于金融数据的监管要求,将是大模型在金融业应用时务必要考虑的合规要求。 美国 7 -此处政策为典型示例,未全部列示 •《中华人民共和国数据安全法》(2021年6月):指引规范数据处理活动,保障数据安全,促进数据开发利用等方向的强监管法规 •《中国银保监会银行业金融机构监管数据标准化规范》(2022年1月):通过对报送数据的规范和要求,指导金融机构数据质量的提升,帮助建立标准化的数据规范,以满足银行各项生产经营流程中对数据要素的需求。 •《数据法案》(2022年2月):促进企业之间及企业与政府之间的数据共享,消费者和企业对其拥有的数据享有更多的控制权。 •《数据治理法案》(2022年5月):提出促进数据共享及再利用的框架和模式。 欧盟中国 !“为什么市场上出现了各类大模型公司,以往的AI方案都会说成基于大模型的更新/升级,为什么第四波浪潮为全自动智能化。” “某商业银行想要升级渠道交互能力,沟通过程中发现90%的方案都是基于大模型,各类方案都在强调大模型或生成式人工智能的优势” AI的第四波浪潮所带来的颠覆式创新 为什么是大模型?-第四波浪潮的颠覆式创新 *离不开算力、数据规模的增长 大模型的涌现能力 人工智能产业化新范式 大模型的涌现能力,即当规模达到一定水平时,性能显著提高,超出随机水平,定义为“在小型模型中不存在但在大型模型中产生的能力” 上下文学习 假设已经为语言模型提供了一个自然语言指令和/或几个任务演示,它可以通过完成输入文本的单词序列的方式来为测试实例生成预期的输出,而无需额外的训练或梯度更新; 指令遵循 通过使用自然语言描述的混合多任务数据集进行微调,能够在没有使用显式示例的情况下遵循新的任务指令,具有更好的泛化能力; 逐步推理 8 开发范式的转变与大模型的能力 带来AI产业化新范式,解决AI应用长尾问题 小模型vs大模型 比较维度 小模型 大模型 数据层面 需耗费大量时间进行数据标注 一次性标注+适量业务数据 模型层面 全流程重复工作、周期长、精度低 预训练大模型+下游任务微调,精度高 业务支持 研发周期长,场景无法端到端全覆盖 快速响应,通用性高,场景可延伸 对于小型语言模型而言,通常很难解决涉及多个推理步骤的复杂任务。通过使用思维链提示策略,大模型可以利用包含中间推理步骤的提示机制来解决这类任务,从而得出最终答案。 应用能力与方向演进趋势 人类思维 复杂学科研究 高级系统设计 科学发现 数字世界 人机融合的数字世界和生态 自迭代更新的系统开发设计 人机协作的前沿科学探索 知识推理 符号梳理 与外部环境互动 高质量完整代码 复杂逻辑系统 完整故事线与文图 内容娱乐智能化 AI效率工具及行业解决方案 AIOS 未来发展 闭卷问答 数学推理 代码补全 简单代码/指令序列 特点场景思维链 跨模态理解 主题内容生成 Copilot 商业流程自动化 当前状态 开卷问答 语言建模 多轮对话 相对可控的文生图 微场景的商业写作 辅助设计 搜索与知识问答 文案类助理 条件文本生成 低可控的文本生成 低可控的文生图 设计灵感辅助 非主题无逻辑文本 缺乏控制的图像 生成内容可控性 规则或原理可控 复杂逻辑推理可控 初步的思维链可控 部分逻辑 可控 基本方向 可控 不可控 关键能力涌现可生成的内容典型应用方向场景实现路径 -以大模型的直接衍生能力为主线(生成式人工智能