您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中泰证券]:金融行业:DeepSeek银行部署加速,AI金融应用迎来跃迁 - 发现报告

金融行业:DeepSeek银行部署加速,AI金融应用迎来跃迁

金融2025-03-13中泰证券好***
AI智能总结
查看更多
金融行业:DeepSeek银行部署加速,AI金融应用迎来跃迁

2 0 2 5.0 3.13 分析师:苏仪执业证书编号:S0740520060001 分析师:闻学臣执业证书编号:S0740519090007 联系人:蒋丹Email:jiangdan@zts.com.cn 分析师:王雪晴执业证书编号:S0740524120003 CCONTEDeepSeek开源、低成本、强推理助推银行业应用 性能:后训练阶段大规模应用强化学习,表现推理能力扩展 ◼DeepSeek模型在Post-Train阶段大规模应用了强化学习方法。R1使用了冷启动+大规模强化学习方法,R1-Zero版本模型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和long-CoT能力涌现等)。 资料来源:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning,中泰证券研究所 资料来源:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning,中泰证券研究所 性能:DeepSeek推理架构优化,可适配银行高并行、高响应的业务场景 ◼DeepSeek通过优化训练方法显著降低了算力消耗,使其在大规模数据处理中的成本更具优势。它在MoE架构的基础上,通过多头潜注意力机制(Multi-Head Latent Attention,MLA)进行优化;在后训练阶段采用冷启动+大规模强化学习方式,不再使用传统SFT做大规模监督微调,甚至绕过了一些CUDA,采用PTX汇编来提升能力;在推理场景下通过大规模跨节点专家并行(Expert Parallelism,EP)来优化通信开销,尽可能实现负载均衡。 资料来源:DeepSeek,中泰证券研究所 资料来源:木尧,中泰证券研究所 开源易获得:DeepSeek使私有化部署模型也能够追平前沿闭源模型水平 ◼以DeepSeek R1为代表的优秀开源模型的能力离闭源模型越来越近。行业普遍认为如果开源软件达到闭源80%以上能力,就足以压缩闭源的生存空间。DeepSeek能力能够比肩OpenAI o1,开源使各行业机构能够轻松获取前沿模型能力,且可直接进行私有化部署或商业化开发。 资料来源:AI产品榜,中泰证券研究所 资料来源:EpochAI,中泰证券研究所 成本:DeepSeek低价策略下理论成本利润率依旧可达545%,部署成本极低 ◼DeepSeek理论成本利润率极高,成本还有优化空间。通过优化,能够在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。以2025年2月27-28日数据为例,DeepSeek V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美金/小时,总成本为$87,072/天。如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。 资料来源:DeepSeek,中泰证券研究所 资料来源:DeepSeek,中泰证券研究所 性能:开源QwQ-32B性能比肩满血R1,再次降低部署成本 ◼阿里近期开源的QwQ-32B模型基于320亿参数规模,在数学推理、代码生成及通用任务中表现亮眼,综合性能对标DeepSeek-R1(6710亿参数,激活量370亿)。该模型大幅降低部署成本,支持在消费级显卡(如英伟达RTX 4090)上本地运行,满足快速响应及数据安全需求。同时,QwQ-32B集成智能体(Agent)能力,可调用工具并基于环境反馈调整推理逻辑,为定制化AI方案提供基础。 资料来源:阿里,中泰证券研究所 性能:蒸馏小型模型展现Test-time Scaling,可支持多项基础业务场景 ◼通过将DeepSeek-R1的推理能力蒸馏到更小的模型中,较小的模型也能具备强大的推理能力。DeepSeek开源了从15亿到700亿参数的R1蒸馏版本。这些模型基于Qwen和Llama等架构蒸馏,表明复杂的推理能力可以被封装在更小、更高效的模型中。从论文结论看,蒸馏比单独依赖强化学习训练更为高效,且蒸馏与强化学习的结合可以进一步提升模型性能。◼2025年2月,科学家李飞飞团队带领以不到50美元的费用训练了一个能力比肩DeepSeek-R1的s1模型,也展现了蒸馏模型的更多应用潜力。 S1仅使用1000个微调示例就达到了类似r1的准确度 模型展现出随推理时间增加准确度增加的Test timeScaling 资料来源:s1:Simpletest-timescaling,中泰证券研究所 资料来源:s1:Simpletest-timescaling,中泰证券研究所 数据:大规模RL提升非结构化数据分析能力,释放私域数据价值 ◼DeepSeek可以通过API接口或者数据中台架构,实现与传统银行技术系统的数据交互,从而实现各类业务高效高质的无缝对接,有望释放海量私域数据价值。Post-Train阶段大规模强化学习的训练方法使模型拥有了更强的自主推理能力,不再依赖传统提示工程。根据DeepSeek的官方使用指南,在使用模型时不建议添加系统提示(system prompt),而是所有指令都应当包含在用户提示(user prompt)中。这也显示出了模型通用推理能力在应用中的扩展。 图表:大模型数据类型 多模态:Janus-Pro等开源多模态模型有望进一步提升应用能力 ◼Janus-Pro结合了优化的训练策略,扩展了训练数据集和模型规模。通过这些改进,Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。 资料来源:Janus-Pro:UnifiedMultimodalUnderstandingandGenerationwithDataandModelScaling,中泰证券研究所 CCONTE理解金融应用的“降本增效-价值创造-决策赋能”三个层次 金融行业人工智能的三层价值创造 ◼我们认为金融行业人工智能的应用价值大体可以分为三个层次:降本增效,价值创造与决策赋能。其中当下应用最广泛的是降本增效,即AI对简单人力的替代,具体场景可能包括智能客服、简单的办公文件问答与内容生成等。随着模型能力提升将展现真正的价值创造能力,即AI对高价值人力的赋能,具体场景可能包括办公Agent、营销、Coding等;随着AI分析能力进一步提升,将能够为决策层直接赋能,提升决策效率和精确度。 资料来源:中泰证券研究所 降本增效场景之一:大模型承担智能客服角色 ◼降本增效场景通常基于大模型的生成能力,进行人力替代或赋能,在银行业AI应用场景中落地最早。 ◼商业银行主要通过人工客服和智能客服两种方式为客户提供咨询服务。人工客服工作强度高、处理和响应时间相对较长,而当下智能客服难以覆盖全部服务场景。如工商银行在远程银行业务中将知识搜索与大模型生成能力结合,实现基于实时通话向坐席人员主动推送答复话术或知识的能力。 图表:苏商银行大模型客服助手 资料来源:苏商银行、中泰证券研究所 降本增效场景之二:大模型助力信贷审批 ◼在传统银行信贷审批过程中,贷前调查、审批、放款以及贷后管理等诸多环节,均高度依赖人工操作,导致整个流程十分复杂且效率低下。DeepSeek为银行信贷审批注入新动力,助力审批流程实现智能化与自动化。 ◼苏商银行应用DeepSeek-VL2多模态模型,通过构建“多模态技术+混合专家框架”的创新体系,实现对嵌套表格、影像资料等复杂场景材料的精准解析,将信贷材料综合识别准确率提升至97%以上,信贷审核全流程效率提升了20%。 资料来源:苏商银行公众号,中泰证券研究所 降本增效场景之三:智能合同质检 ◼在银行的日常运营中,处理海量的合同、报表等文档是一项繁琐且易出错的任务,传统人工审核方式效率低下,难以满足业务需求。DeepSeek-VL2等多模态模型具备高精度的文档解析能力,能够提取文档中的关键信息,高效完成合同质检、条款比对等工作,大幅提升工作效率与准确性。 ◼江苏银行已成功本地化部署微调DeepSeek-VL2多模态模型、轻量DeepSeek-R1推理模型,分别运用于智能合同质检和自动化估值对账场景中。 资料来源:上海证券报,搜狐,中泰证券研究所 价值创造场景之一:AI编程赋能开发,释放开发价值 ◼AI Coding能够替代低效工作,充分释放开发者的价值。未来可能会由AI承担部分基础工作,而开发者则转向更高层次的架构设计和业务规划,专注于更复杂、更创造性的任务,如架构设计、算法优化或用户体验创新。 ◼AI编程在银行业可有效赋能内部研发。从具体用例看,澳新银行对1000名软件开发人员进行了为期六周的AI编程助手试用实验。实验发现,当软件开发人员使用AI编程助手时,平均生产率提高42%,代码质量提高12%。开发人员的工作满意度也显著提高。 资料来源:《采用AI编程助手,发展新质生产力》、中泰证券研究所 资料来源:《采用AI编程助手,发展新质生产力》、中泰证券研究所 价值创造场景之二:智能风控 ◼风控管理是银行业务经营的的核心任务之一,DeepSeek拥有卓越的推理能力,能够助力银行显著提升风险识别的效率与准确性,快速剖析风险因素并生成详尽的分析报告,全面增强银行的风险管控能力。 ◼重庆农村商业银行借助腾讯云大模型知识引擎的能力,率先在企业微信上线基于DeepSeek模型的智能助手应用“AI小渝”,成为全国首批接入DeepSeek大模型应用的金融机构,也是首家通过知识引擎构建基于DeepSeek的联网应用的金融机构。重庆农村商业银行将利用DeepSeek的模型能力,结合实时联网搜索以及RAG能力,动态识别欺诈行为,提升风险预警精准度。 ◼苏商银行通过深度融合DeepSeek系列模型技术,构建“数据+算法+算力+场景”四位一体的智能决策体系,该体系已成功应用于信贷风控、反欺诈监测等20余个业务场景,尽调报告生成效率提升40%,欺诈风险标签准确率提升35%,构建起覆盖贷前、贷中、贷后的全生命周期智能风控网络。 价值创造场景之三:AI赋能实现个性化智能营销 ◼智能营销助手:依托知识图谱与大模型的协同合作,银行能够精准捕捉客户信息,量身定制个性化营销策略,精准触达客户,显著提升营销效果。◼目前多家银行已利用DeepSeek布局智能营销场景。北京银行启动“all in AI”战略,并已部署DeepSeek系列模型,在业务应用方面,北京银行利用大模型技术已在营销等场景落地应用。 资料来源:CSDN,中泰证券研究所 决策赋能场景:高级分析能力赋能管理决策 ◼大多数商业银行的决策模式主要依赖经验以及基于规则的系统,数据价值的挖掘和释放空间较大。OpenAI的DeepResearch功能支持查找、分析和综合数百个在线资源,以研究分析师的水平创建综合报告。随着相关模型能力上限持续提升,决策层可应用DeepSeek深度挖掘和分析内外部数据,并为管理和决策赋能。 资料来源:OpenAI,中泰证券研究所 落地进展:大行发力早,中小银行推进更快 ◼在生成式人工智能落地应用中大行发力更早。六大国有银行大力投入大模型技术体系研发的同时多场景探索大模型应用,实现客服、办公、研发、运营等多个业务领域的应用创新。中小银行则多以单场景切入,探索智能客服、智慧办公等通用场景下的更多应用,如探索智慧办公场景下的宣传文案、智能周报、文章翻译、会议纪要等细分场景。 ◼我们认为,随着DeepSeek开源降本,中小银行有望加速部署应用,快速追赶与大行之间差距。 资料来源:信通院、中泰证券研究所 AI一体机:大模型落地的重要选择 ◼大模型的本地部署并非易事,从模型训