前言 以ChatGPT为代表的大模型技术,正以前所未有的速度深刻改变整个人类社会。比尔盖茨提出:“ChatGPT历史意义不亚于PC或者互联网诞生”。马斯克认为:“ChatGPT将颠覆世界”。马化腾在2023年腾讯股东大会上回应有关ChatGPT和AI相关的提问时说:“我们最开始以为是互联网十年不遇的机会,但是越想越觉得,这是几百年不遇的、类似发明电的工业革命一样的机遇”。2023年7月13日,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局七部门共同制定《生成式人工智能服务管理暂行办法》,为国内大模型技术研发及应用提供了政策支持和合规指导。作为中国保险行业的深耕者,阳光保险集团立足全球视野,从大模型技术与保险底层逻辑出发,认为大模型技术将从根本上改变和赋能保险,保险业需要与时俱进,把握战略机遇。 事实上,人保、平安、太保、泰康、众安、ZurichInsurance、PaladinGroup等国内外保险公司和保险科技公司已经迅速行动,围绕大模型研发及应用进行布局,启动大模型在保险应用的主题创新。阳光保险集团于2023年初即启动“阳光正言GPT大模型战略工程”,积极探索和实践如何应用大模型技术重构保险业务模式。我们认为,联合产学研各方单位,深入研究大模型的技术原理,分析各保险公司和保险科技公司的大模型应用案例,将对大模型技术在保险行业落地提供实用的理论和方法。因此,阳光保险集团联合清华大学五道 1 口金融学院、中国保险学会、北京百度网讯科技有限公司、中国科学院计算技术研究所智 能信息处理重点实验室共同研究编写了《大模型技术深度赋能保险行业白皮书》。 白皮书聚焦大模型关键技术与核心能力,结合政策环境,深入剖析大模型在保险行业的多维应用场景与价值,为保险行业如何应用大模型技术、实现价值创造,提供实用参考建议。 白皮书系统阐释了大模型技术与保险在底层逻辑上存在的天然契合性。一方面,大模型技术充分利用互联网上的一切数据,从而具备更高的准确性、更强的泛化能力、更低的应用门槛,实现了在传统深度学习基础上的性能飞跃,满足了各行各业在多元场景中的应用需求;另一方面,保险天然就与数据紧密相连,丰富的应用场景使得保险成为大模型技术的绝佳应用领域。这种天然契合性,使得大模型和保险的结合将从“能力涌现”逐步走向“价值涌现”,其价值创造也将向从量变到质变、从改变到变革、从变革到颠覆逐步演进。大模型的深度认知能力,将改变行业对风险认知与管理的能力,推动保险行业的精算模式从“粗放预测”向“精准预知”升级,推动风险管理从相对被动的“等量管理”向相对主动的“减量管理”转变。这一转变将重塑保险行业的商业模式,引领一场颠覆性的变革,开启保险业新的发展篇章。 面对当今世界百年未有之大变局,我国在党的二十大精神指引下,以全面建成中国式现代化为主要目标进行了全方位战略布局。2023年10月30日召开的中央金融工作会议指 2 出:“金融是国民经济的血脉,是国家核心竞争力的重要组成部分”、“做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章”。保险业需要提高认识和站位,系统分析面临的形势、问题和挑战,坚定不移地推动保险改革与创新。我们认为,本次《大模型技术深度赋能保险行业白皮书》的发布恰逢其时,为保险业做好科技金融和数字金融两篇大文章提供了有力支撑。我们将坚定地走在创新前沿,将大模型技术与保险业务深度融合,为保险行业从科技赋能向科技引领的转变探索更多可能性。同时,我们也将与各界合作伙伴携手共进,共同推动科技保险和数字保险的发展,共创保险行业的美好未来! 编委会 3 目CO录NTENTS 1大模型发展迅速加速AI价值升级11 1.1 1.2 1.3 大模型技术创新,能力显著升级11 生态日益完善,推动大模型落地应用14 政策持续出台,助力大模型产业快速发展16 2应用场景丰富大模型助保险业增效提质20 2.1保险领域:全业务流程赋能20 2.1.1投研:分析市场趋势、优化资产组合21 2.1.2产品设计及定价:挖掘客户需求、定价精准化21 2.1.3营销:赋能代理人、优化销售流程22 2.1.4承保:更精准的风险评估23 2.1.5理赔:定损智能化、助力欺诈识别23 2.1.6服务:赋能坐席优化客户体验24 2.2通用领域:提升内容生成与分析效率25 2.2.1办公:辅助内容生成,降本提效25 2.2.2HR:提升招聘效率、优化员工服务25 2.2.3财务:分析和决策更准确高效26 2.2.4法务:分析历史案例、快速合同审查27 2.2.5经营决策及管理:辅助战略规划及策略优化27 2.2.6风控:识别风险,提升安全性28 2.3数字人与数字员工:智能化程度提升29 2.3.1数字人29 2.3.2数字员工30 3大模型开放平台建设打造可信大模型底座32 5 3.1大模型开放平台架构32 3.2垂直领域大模型:更懂保险的大模型35 3.2.1训练方法35 3.2.2基座模型选择37 3.2.3数据来源37 3.2.4挑战及应对38 3.3插件集市实现大模型与外部系统链接39 3.5 3.4 大模型研发工具提升模型研发效率40 智能路由和审核实现大模型动态调度和内容安全41 3.6 大模型应用安全与合规42 3.7 保险业大模型评测体系44 4 积极探索落地大模型价值全面初现46 4.1 国内险企躬身入局,初步探索AIGC应用落地47 4.1.1阳光保险:正言大模型开放平台赋能保险及办公全业务流程47 4.1.2中国人保:打造并发布人保大模型,多场景应用落地53 4.1.3平安:推出数字人产品、建立精准信用评级体系55 4.1.4太保集团:数字员工助力审计监督提升56 4.1.5泰康:积极构建生态,打造大模型原生应用58 4.1.6众安保险:将AIGC置入科技产品,打造系统应用全新体验59 4.2国外险企积极转型,营销承保服务业务全覆盖60 4.2.1PaladinGroup:承保工具UnderwriteGPT60 4.2.2CorvusInsurance:利用CorvusRiskNavigator平台实现核保·61 4.2.3Simplifai:InsuranceGPT助力自动化索赔管理61 4.2.4苏黎世保险:使用ChatGPT辅助理赔及承保62 4.2.5印度Plum:PolicyGPT聊天机器人,进行客户联系服务63 4.2.6Helvetia:利用Clara推进客户服务63 6 4.2.7TokioMarine&NichidoFireInsurance:撰写答案草稿63 4.3互联网公司妥善布局,提供一体化解决方案64 4.3.1 4.3.2 4.3.3 微软Office打造办公“全家桶”64 Google将生成式AI应用于Workspace64 国内互联网公司布局办公领域及数字人64 5挑战与机遇并存积极布局加速赋能66 5.2 5.1 5.3 5.4 5.5 大模型能力持续升级,应用前景可期66 强化治理,推动大模型可持续发展68 多方协同,构建大模型发展新生态69 面临的挑战72 应对措施建议73 7 图目录 CONTENTS 图1图2 图3图4 图5图6 图7图8图9 图10图11 图12图13图14图15 大模型的内涵与特征13 “十四五”期间人工智能相关重要政策17 近年保险行业人工智能相关政策18 大模型赋能保险全业务流程20 正言大模型开放平台系统架构图34 垂直领域大模型训练的三类主要方案36 车险全线上销售机器人产品架构48 FAQ-DocQA-Chat问答链路49 预制或自定义各类人设,支撑多类办公文案场景50 端午节营销海报生成51 基于自然语言,实现报表自动生成52 不同模型自助切换,提供更优质的答案52 构建集成开发工具常青藤辅助编程插件,实现代码辅助53 人保大模型产品规划54 商汤AI治理理念68 9 1.大模型发展迅速加速AI价值升级 在人工智能的发展历程中,大模型技术的崛起无疑标志着一次历史性的突破。随着参数规模和数据规模的显著增长,大模型在各类任务中展现出更高的准确性、更出色的泛化能力以及更低的应用门槛,从而满足了各行各业日益多元化的需求。学术界、研究机构、产业界以及各级政府均对大模型给予了高度的重视,从算法模型、技术生态、落地应用和政策环境等多个层面,推动通用大模型和领域专用大模型的快速发展和应用。 1.1大模型技术创新,能力显著升级 大模型,包括广义的人工智能预训练大模型及狭义的大型语言模型(LargeLanguageModel,LLM),是一种具有庞大参数规模和高度复杂性的机器学习模型。通常来说,这种模型的参数量能够达到数十亿,甚至扩展到数万亿的惊人规模。通过在广袤无垠、未加标注的海量数据中进行大规模的预训练,这些大模型能够深入挖掘并掌握众多微妙的模式、规律和知识。它们展现出了惊人的“涌现”现象,即模型性能的准确性、表达能力的强度以及泛化能力的广泛性都展现出了卓越的优势。这种“涌现”现象是大模型最引人注目的特征之一,也是它们在自然语言处理、计算机视觉等领域表现出色的原因之一。 大模型可分为通用大模型和专用大模型两类,它们在设计、训练与应用上均有所区别。通用大模型的目标是处理广泛的任务和领域,具备强大的泛化能力。通常,它们基于 大量的无标注数据进行预训练,然后在特定任务上实施微调。这种“预训练-微调”的方法使通用大模型能够获取丰富的语义知识,因此在各种任务中表现卓越。例如,ChatGPT就是通用大模型的典型代表,可回答各类问题、生成文本、完成编程任务等。 11 而专用大模型是针对特定任务或领域进行优化,具有很强的专业性。它们通常以领域数据或有限的有标注领域数据为基础,在通用大模型底座的基础上重新预训练或者微调,以更好地适应特定任务的需求。专用大模型在某些任务上的表现要优于通用大模型,因为它们能更准确地捕获到与任务相关的特征和模式。例如,彭博社发布的专门为金融领域打造的大语言模型BloombergGPT能更好地处理金融领域的数据和任务。 大模型在传统深度学习基础上实现了性能的飞跃性提升,其主要特点包括: (1)庞大的规模:这些模型通常具有数十亿甚至数万亿个参数,这使得它们能够捕捉到数据中的复杂模式和关系。这种规模的模型在处理自然语言处理、图像识别和语音识别等任务时表现出了优越的性能。 (2)高效的通用能力:由于其庞大的规模和强大的学习能力,大模型可以应用于多种不用的任务,展现出强大的性能。这使得大模型在实际应用中具有很高的价值,如在智能问答、语言理解、内容生成等领域。 (3)强大的泛化能力:通过使用大量的训练数据,大模型可以学习到数据中的深层次结构和规律,这使得它们能够在面对新的、未见过的任务时,快速地找到合适的解决方案。 (4)便捷的实用性:大模型能以合理的时间和资源,快速处理输入数据并做出响应,性能和效率能满足大部分应用场景的需求。 12 图1大模型的内涵与特征 来源:AI大模型市场研究报告(2023)⸺迈向通用人工智能,大模型拉开新时代序幕,AFrost&SullivanWhitePaper(.经整理) 与传统深度学习比较,大模型在处理复杂任务时具有显著的优势,从自然语言处理、搜索引擎到计算机视觉等领域,大模型技术都在不断地突破自身的能力边界,为人类带来了前所未有的便捷和智能体验。 首先,在自然语言处理领域,大模型技术取得了重要的突破。目前,无论是智能语音助手还是聊天机器人,都在利用大模型技术实现更加自然、流畅的人机交互。通过对大量文本数据的学习,大模型技术可以理解用户的意图,生成符合语法和语义的自然语言回复。这不仅提高了人机交互的效率,还降低了开发成本,使得越来越多的企业和个人能够享受到智能问答带来的便利。 其次,大模型技术在搜索与推荐领域的应用已经深入人心。谷歌、Bing、百度等主流搜索引擎都在利用大模型技术为用户