垂直领域大模型或成细分领域公司AIGC发力方向,金融领域已率先落地。垂直AI大模型专注于特定的行业、领域或场景,且能够依托行业数据与知识壁垒,并为企业提供更准确、专业的解决方案,更好满足用户在某个领域的需求,有望成为后续细分领域企业的发力方向。彭博推出专为金融行业打造的500亿参数大语言模型BloombergGPT,依托其四十年来积累的大量金融数据源,基于通用和金融业务的场景进行混合模型训练,使得BloombergGPT在执行金融任务上的表现远超同等参数量级的通用大语言模型,为国内金融行业大模型的落地与使用提供了借鉴路径。我们认为,保险行业作为数字化、智能化的先行者,在B端及C端掌握丰富的一手金融数据,且具备政策支持、业务需求、财力支撑等核心现实基础,或可复制BloombergGPT路径,打造保险领域的专业大模型,赋能保险业务全流程。 海外保险机构AI大模型布局正加速推进,国内也有望实现AI技术的迭代升级。海外方面,GPT技术已从销售助理、智能客户、核保核赔等多场景赋能保险业务,预计随着数据与训练的积累,未来长期AI大模型有望向个性化产品定价、核保核赔、风控减损等场景延伸,深度赋能全产业链。国内方面,近年来,我国大型保险机构持续关注科技投入,AI技术已广泛应用于前端销售、定损理赔、风控减损等领域,但主要仍以理解式AI为主,生成式AI仍在探索中。AI大模型可从产品研发、渠道营销、运营管理等各方位实现保险机构的全流程赋能,预计国内保险机构具备AI技术迭代升级的动力。 中国平安:人工智能等核心技术布局市场领先,AI大模型落地优势显著。中国平安是业内领先的科技型保险公司,以人工智能、区块链、云、大数据和安全五大核心技术为基础,深度聚焦金融科技与医疗科技两大领域,对内赋能金融发展,一是助力代理人招募、培训、展业、客户经营全流程,二是研发智能闪赔、智能预赔、AI坐席、智能辅助诊疗等核心应用,以科技全面优化改造业务流程,提升作业效率、优化客户体验,三是打造鹰眼系统DRS2.0、平安企业宝等技术平台,提供线上线下多元化风险管理;对外,依托平安科技、金融壹账通、陆金所等科技子公司进行科技产品和服务的对外输出,截至2022年,中国平安在人工智能技术领域、金融科技和数字医疗业务领域的专利申请数排名均为全球第一位,技术市场领先,可以助力AI大模型的训练、推理和部署的高效进行,且AIGC技术已有多场景落地,在AI大模型落地优势显著。 众安在线:AIGC探索较为积极,相关应用有望率先落地。众安保险长期专注于科技能力建设,对内从风控+客户需求挖掘+承保理赔支持与降费等方面赋能保险主业;对外,依托众安科技布局人工智能、大数据、云计算等前沿技术,围绕三大标准化科技产品系列——业务增长系列、业务生产系列、业务基建系列,以及战略轻咨询、全域数字化运营、技术共建等定制化服务,打造“科技+服务”的价值交付体系,将公司的科技中心打造为销售中心和利润中心,截至2022年,公司科技输出收入5.92亿元,其中 H2 同比+41%重回常态高增长。2023年5月,公司发布《AIGC/ChatGPT保险行业应用白皮书》,并明确已经在全系列产品中规划加入AIGC等大模型能力,并将不断实践探索应用场景,AIGC探索较为积极,应用有望最先落地。 投资建议:关注两类保险机构在大模型技术落地中的受益机会:1)大型保险公司凭借保险领域垂直数据积累、深厚的资金支持、领先技术水平,有望复制BloombergGPT路径,建议关注中国平安;2)头部保险科技公司或更为关注大模型落地带来的增效扩能机遇,相关场景落地有望更快一步,建议关注众安在线。 风险提示:技术落地不及预期;保险科技监管趋紧;研发投入周期过长。 表1:重点公司投资评级: 1AI大模型快速发展赋予AIGC产业化应用空间 AI大模型是人工智能预训练大模型的简称,以“大规模预训练+微调”范式满足多元化需求。在大数据的支持下进行预训练后,仅需少量数据的微调就能直接基于超大规模基模型打造出领域大模型或行业大模型,进而覆盖更多行业自场景,直接支撑各类应用,具备强大的泛化性、通用性和实用性,可以在自然语言处理、计算机视觉、智能语音等多个领域实现突破性性能提升。 图1.AI大模型的内涵与特征 生成式AI大模型的突破赋予AIGC广阔的产业化应用空间。2022年底OpenAI发布人工智能聊天机器人ChatGPT,在具有庞大参数量的大型语言模型训练下,ChatGPT展示出了强大的人机交互体验、高质量的持续对话能力以及较好的逻辑推理能力。生成式AI的出现,直接促使大模型带来的价值进一步升级到人类生产力工具的颠覆式革新。同时,数据规模和参数规模的有机提升,也让大模型开始具备涌现能力(EmergentAbility),为AIGC(AI Generated Content)技术的升级提供了强力支撑。 国内外大模型快速发展,将加速产业智能化变革。2019年来大模型发展提速,OpenAI、Google、百度、阿里等国内外科技公司开发迭代多版AI大模型,大模型的通用性以及基于“预训练+微调”等新开发范式,让AI场景应用的模型定制流程变得更标准化、效果优化更简单,有望大幅加速人工智能大规模产业化进程,推动AIGC在各行各业的渗透与落地。 图2.全球知名大模型发布时间节点 2垂直领域大模型或成后续发力方向,保险行业是最佳落地领域之一 我们认为,垂直领域的数据是大模型应用的关键,保险行业作为数据密集型行业,具备数据优势,在政策支持与自身强智能化意愿下,是AI大模型的最佳应用领域之一。 2.1垂直领域AI大模型成发力方向,金融领域已率先落地 垂直领域大模型成细分领域公司AI大模型发力方向。当前AI大模型发展方向已分化为通用大模型与垂直大模型两类,其中通用大模型需要巨大的计算资源和数据量,对技术团队与资金支持要求极高,是国内外科技领域大厂的重点项目,相对而言,细分领域企业既不具备开发优势,实际应用场景也较少。而垂直领域大模型专注于特定的行业、领域或场景,且能够依托行业数据与知识壁垒,为企业提供更准确、专业的解决方案,更好满足用户在特定领域的需求,当前网络安全、金融、医疗、教育等领域均有垂直领域大模型布局或落地。此外,垂直领域的大模型具备算力不够大、算法难度相对低等优势,又对特定领域数据要求高,更适合数据积累丰富的保险行业探索。 图3.中国大语言模型产业参与厂商类型与定位逻辑 彭博最早推出专为金融行业打造的500亿参数大语言模型BloombergGPT,为垂直领域大模型提供新范式。2023年3月30日美国彭博正式发布大型语言模型BloombergGPT,其具有500亿参数,并依托彭博的大量金融数据源,构建了一个3635亿个标签的数据集,使得模型更加聚焦金融场景,更加适应金融术语的复杂性与独特性,从而支持金融领域的各项任务,有效实现了GPT+垂直知识的深度融合。 BloombergGPT在金融领域表现超越现有模型,展现了基于垂直领域数据打造的大语言模型在专业领域的强大竞争力。根据彭博发布的论文,其根据模型大小、训练数据类型、整体性能以及最重要的访问权限,将BloombergGPT与其他三个最相近的模型GPT-NeoX、OPT、BLOOM在金融领域和通用领域的表现分别进行了对比。结果显示,BloombergGPT模型在金融任务上的表现远超通用模型,在五项任务中的ConvFinQA(测试对金融领域相关问题的理解和推理能力)、FiQASA(测试英文财经新闻和社交媒体标题中特定方面的情感)、FPB(金融短语库数据集,包括对金融新闻的句子情感分类任务)、Headline(判断新闻标题是否包含特定信息)四项表现最佳,在NER(对从提交给SEC的金融协议中收集的用于信用风险评估的财务数据进行命名实体识别)测试中表现也位列第二。此外,在四个特定的情感分析内部任务中,BloombergGPT的表现也远超其他测试模型。 图4.BloombergGPT与对比模型的参数对比 图5.BloombergGPT在外部金融任务的表现显著领先其他对比模型 图6.BloombergGPT在情感三分类测试结果中的表现显著领先其他对比模型 BloombergGPT在金融领域的强大竞争力主要源于其长期积累的数量庞大的金融领域数据。为训练BloombergGPT,研究人员首先构建了一个由一系列英文金融文件组成的综合数据集“FinPile”,同时用广泛用于训练LLM的公共数据对其进行充实。1)金融领域数据集由彭博在过去四十年的商业经营中积累而来,共包含了3635亿个token,占总数据集token量的51.27%,具体由金融领域相关网页(2978亿token,占比42.01%)、金融领域新闻源(376亿token,占比5.31%)、公司财报(145亿token,占比2.04%)、金融相关公司的出版物(86亿token,占比1.21%)、bloomberg(49亿token,占比0.7%)构成。2)通用数据集由共包含了3454亿个token,占总数据集token量的48.73%,具体由ThePile数据集(1836亿token,占比25.90%)、 C4 数据集(1381亿token,占比19.48%)、Wikipedia数据集(237亿token,占比3.35%)组成。 图7.BloombergGPT训练数据集 2.2保险行业具备AI大模型落地的商业化场景与现实基础 政策层面,金融科技政策持续推出,为保险机构AI大模型的发展提供了良好的政策环境。近年来,国务院、央行、银保监会、中保协等部门/协会不断推出推动保险等金融机构数字化转型的政策措施,驱动保险科技快速发展。今年2月,中共中央、国务院印发《数字中国建设整体布局规划》,明确指出在金融等重点领域,加快数字技术创新应用,人工智能作为数字技术中的核心技术之一,在金融机构的落地也有望加速进行,AIGC大发展背景下,保险等金融机构AI大模型的场景化应用存在较好的政策环境。 表1.近年来政策大力鼓励金融科技发展 行业层面,掌握核心私域数据的保险行业,在AI大模型领域的落地有望领先市场。我们认为,高质量的数据是助力AI训练与调优的关键,就国内数据市场而言,据发改委官方批露,我国政府数据资源占全国数据资源的比重超过3/4,但开放规模不足美国的10%,个人和企业可以利用的规模更是不及美国的7%。在此背景下,具备私域属性的行业数据的重要性更加凸显,手握数据的行业及公司在AI大模型领域的布局将领先一步,有望最早享受AI数据革命带来效率升级。保险行业属于数据密集型行业,信息化与数字技术应用广泛,信息交互频率高,且大型险企深耕保险科技多年,在数据层面、大模型以及知识图谱方面都有较为深厚的积累,具备垂直大模型落地的商业化场景与现实基础。 保险行业人力成本高企,监管趋严背景下,具备科技创新赋能意愿。一方面,保险产品条款复杂、专业术语繁多,对保险公司销售人员的招募与持续培训等方面的投入提出了远高于其他行业的要求;另一方面,核保核赔等后端服务也需大量人员对接,因此,保险行业通常被认为是人力密集型行业之一,人力成本高企。 且监管趋严背景下,政策端对保险从业人员专业性要求更为严格,保险公司具备科技赋能的主动诉求。 3保险机构接入大模型有望重塑行业生态 3.1国内上市险企AI技术布局已较为深入 我国保险业AI领域布局多年,已形成较为成熟的AI全场景化应用,沉淀了丰富的应用数据和场景,在AI大模型催化下,AI效能有望进一步提升。 3.1.1场景一:前台赋能 1)保险产品智能配置:个性化满足低单价产品的配置需求 AI经过深度学习和对大量解决方案的模拟运算,能够根据用户提供的个人信息量身定制合适的保险配置方案,扮演“AI保险规划师”的角色。2023年4月12日,互联网保险代理平台蚂蚁保推出业内首个AI智能保险配置工具“省心配”,基于“HRAAM模型”,根据用户年龄、常驻城市、月收入及负债情况,为每位用户模拟匹配几万种保险配置方案,并最终