总顾问:刘勤 专家顾问:赵燕锡韩向东陈虎付建华魏代森沈雁冰曾超 发起人:杨寅吕晓雷 执笔人:杨寅宛涛李彤孙彦丛方高林孔冰刘峰史瑞超陈昊吕晓雷 研究团队:上海国家会计学院金蝶集团元年科技中兴新云用友公司浪潮通软汉得信息久其软件 主办中心:智能财务关键技术(会计科技AccTech)与系统平台研究室(中心) 学术支持:上海国家会计学院 基金支持:国家社会科学基金项目“人工智能对会计工作影响与会计职能转变研究”(20BGL083)撰写团队:杨寅吕晓雷宛涛刘丹彤肖远明李彤张亚东鲁湘孙彦丛 宁燕张蓓方高林张伟付立波孔冰莫小娟杨智刘峰 赵鹤贾晓蕊史瑞超王站姜文杰陈昊 内容审定:刘勤杨寅 发布日期:2024年9月 联系交流:yangyin@snai.edu研究院公众号二维码 前言 1.人工智能大模型技术概述 7 8 目录 1.1人工智能大模型技术概念解析8 1.2人工智能大模型技术典型特征9 1.2.1突出的“涌现”能力9 1.2.2统一的Prompt交互9 1.2.3高扩展性的应用框架9 1.2.4高成本的训练和推理过程10 1.3人工智能大模型技术发展历程及现状11 1.3.1预训练语言模型11 1.3.2大模型家谱12 1.3.3国产大模型12 1.3.4财务领域大模型13 1.4人工智能大模型技术发展趋势14 1.4.1模型架构演进 1.4.2训练方法创新 1.4.3应用场景拓展 15 15 15 1.4.4伦理和安全风险规避 1.4.5大模型发展趋势展望 16 16 2.1人工智能大模型技术整体体系架构17 3.人工智能大模型技术赋能财务概述 2.2人工智能大模型技术分类19 22 2.人工智能大模型技术体系架构概述17 3.1人工智能大模型技术赋能财务总体情况 (1)人工智能大模型赋能财务发展前景 22 22 (2)人工智能大模型在财务领域的应用分析23 3.2人工智能大模型技术赋能财务基本框架 3.3人工智能大模型技术赋能财务实现路径 3.4人工智能大模型技术赋能财务核心价值 25 28 293 4.人工智能大模型技术赋能财务应用 31 4.1人工智能大模型技术赋能家用电器制造行业A集团财务应用31 4.1.1总体情况31 (1)需求背景31 (2)发展现状32 4.1.2典型案例33 (1)案例背景33 (2)财务中台智能客服项目定位33 (3)财务中台GPT平台框架34 (4)财务大模型在智能客服场景的落地36 (5)智能客服建设成果37 4.1.3应用场景38 (1)生成式智能客服38 (2)非结构化附件的智能审核38 (3)生成式财务分析39 (4)生成式管报40 4.2人工智能大模型技术赋能B公司财务应用40 4.2.1总体情况40 (1)需求背景40 (2)发展现状41 4.2.2典型案例42 (1)智能财务平台业务架构42 (2)企业大模型应用架构43 (3)企业智能助手45 4.2.3应用场景47 (1)智能审单机器人47 (2)智能交单49 (3)智能财务制度助手49 (4)智能财务数据分析助手51 4.3人工智能大模型技术赋能C银行财务应用53 4.3.1总体情况53 (1)需求背景53 (2)发展现状 4.3.2典型案例 (1)建设思路 (2)建设框架 (3)技术突破 4.3.3应用场景 54 54 54 55 56 57 (1)风险评估防控 (2)投资组合推荐 (3)欺诈行为检测 57 59 60 4.4人工智能大模型技术赋能D汽车企业财务应用61 4.4.4总体情况 (1)需求背景 (2)发展现状 4.4.5典型案例 4.4.6应用场景 (1)智能采集 (2)智能审核 (3)智能月结 (4)智能风控 (5)经营分析 61 61 62 62 64 64 69 72 79 85 4.5人工智能大模型技术赋能E大型基础设施综合服务商财务应用89 4.5.7总体情况 (1)需求背景 (2)发展现状 4.5.8典型案例 4.5.9应用场景 (1)智能差旅 (2)智能审核 89 89 89 90 92 92 93 (3)智能融资决策95 4.6人工智能大模型技术赋能F医药行业财务应用96 4.6.1总体情况 (1)需求背景 96 96 (2)发展现状97 4.6.2典型案例97 4.6.3应用场景99 (1)合规性监控应用99 (2)智能财务客服的应用101 4.7人工智能大模型技术赋能G大学财务应用103 4.7.1总体情况 (1)需求背景 (2)发展现状 4.7.2典型案例 103 103 103 104 (1)模型与知识服务105 (2)智能财务能力组件106 (3)财务智能体(AIAgents/数字会计/智能助理)107 (4)用户场景与应用衔接 (5)案例应用效果与前景 108 108 4.7.3应用场景109 (1)智能财务助理109 (2)智能填报 (3)智能稽核 111 116 4.8人工智能大模型技术赋能H投资集团财务应用118 4.8.4总体情况 (1)需求背景 (2)发展现状 4.8.5典型案例 4.8.6应用场景 118 118 119 119 122 (1)共享服务与智能问答 (2)管理报告与智能分析 122 123 (3)司库管理与虚假贸易识别124 (4)决算分析与填报助手124 5.人工智能大模型财务应用局限性和关注问题 127 (5)工程风险评价与合规管理125 5.1人工智能大模型技术财务应用局限性 65.2人工智能大模型技术财务应用关注问题 127 127 前言 2023年9月,习近平总书记在黑龙江考察东北全面振兴期间首次提出“新质生产力”这一重要性的概念,并要求“积极培育新能源、新材料、先进制造、电子信息等战略性新兴产业,积极培育未来产业,加快形成新质生产力,增强发展新动能”。人工智能是适应全球经济创新发展的新质态生产力,习近平总书记强调指出:“加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源”。财政部、国资委等部委也相继明确指出人工智能等新技术推动财务(会计)数字化转型的重要作用,实现财务管理工作的高质量发展。 2022年横空出世的ChatGPT是一个里程碑式的人工智能深度学习系统。人工智能大模型的发展可以追溯到以传统神经网络模型为代表的萌芽阶段,而随着Google提出基于Transformer架构的神经网络模型,奠定了大模型预训练算法架构的基础。2022年OpenAI公司发布的ChatGPT是通用人机对话系统,是一个大型的语言模型和一款具有较高智能的多语言聊天机器人,在Transformer架构基础上,以GPT(GenerativePre-trainedTransformer,生成式预训练语言模型)模型及人类反馈的强化学习(RLHF)进行精调的策略下取得了巨大的成功。 虽然真正意义上的人工智能大模型发展历史并不长,但对人类社会的影响产生了积极作用。财务作为服务经济发展的重要组成部分,也将受到人工智能大模型的影响。目前,我国企事业单位已将光学字符识别、自然语言处理、语音识别、机器人流程自动化、专家系统、规则引擎、知识图谱、机器学习、深度学习等人工智能技术应用在会计核算、费用报销、财务报告、战略管理、预算管理、成本管理、营运管理、投融资管理、绩效管理、风险管理、管理会计报告、资金管理、司库管理、税务管理、审计管理等大财务领域。随着人工智能技术创新迭代,大模型将在大财务领域的应用开花结果。基于此,我们编写了《人工智能大模型技术财务应用蓝皮书》,通过大模型的技术概念、典型特征、技术架构、财务应用基本框架、财务典型案例、财务应用场景等内容,旨在帮助与引领企事业单位财务部门及广大财务人员认识大模型的技术类型与发展趋势,并了解大模型在大财务领域的应用场景,希望能够为需要的人提供启发。 1.人工智能大模型技术概述 1.1人工智能大模型技术概念解析 人工智能(ArtificialIntelligence,简称AI)是约翰·麦卡锡等人在1956年达特茅斯会议上首次提出的概念,主要研究和开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统。人工智能领域的研究包括机器人、语音识别、计算机视觉、自然语言处理、专家系统和机器学习等,旨在通过一定的学习和训练,使计算机能够模拟人类感知、认知智能行为,从而完成一定的任务。 深度学习(DeepLearning)作为机器学习(MachineLearning)的一个重要分支,基于人工神经网络(ANN)进行建模,通过模拟人脑神经元的连接和工作方式,使计算机能够像人一样学习和理解数据。深度学习技术的核心在于其深度神经网络结构,这些网络通常由多个层次组成,每一层都能够从输入数据中提取出更高级别的特征。随着层次的加深,网络能够学习到越来越复杂和抽象的特征,随着层数加深以及维度加大,逐渐形成大规模参数的模型(广义的大模型),从而实现对数据的更深入理解。 机器为了深入理解和有效掌握语言,采用构建语言模型的方法来进行语言的表征和建模。早期的语言模型是通过手工编写的规则和语法结构来解析和生成语言,随着统计学的发展,统计语言模型(StatisticalLanguageModels)开始兴起,基本思想是基于马尔可夫假设构建单词预测模型,例如,基于最近上下文预测下一个单词,为了减少计算,通常上下文取前n个词,也被称为n-gram语言模型。 为了提升语言模型的上下文理解能力,深度学习技术与语言模型进行结合产生了神经网络语言模型(NeuralNetworkLanguageModels)。早期的神经网络语言模型如循环神经网络(RNN)能够处理序列数据,但存在梯度消失和梯度爆炸问题。长短期记忆网络(LSTM)和门控循环单元(GRU)等变种RNN模型通过引入门控机制,解决了RNN的梯度问题,能够更好地处理长序列数据。Transformer模型则采用了自注意力机制,进一步提高了模型对序列中不同位置信息的处理能力,成为了目前最流行的语言模型架构之一。 预训练语言模型(PretrainedLanguageModels,PLMs)是一种通过在大规模语料库上进行无监督预训练的语言建模方法,旨在学习语言的通用表示。模型通过捕捉语言的统计规律和结构信息,为自然语言处理(NLP)任务提供了强大的基础。在预训练完成后,PLMs可以通过微调(fine-tuning)的方式,针对特定任务如机器翻译、文本分类、情感分析等进行适应性调整,典型代表如Bert模型。 近年来,随着计算能力的飞速增强和大规模数据训练模型技术的崛起,生成式大语言模型(LargeLanguageModels,LLMs)以ChatGPT为代表,开始崭露头角。这些模型通过扩大预训练语言模型的规模和训练数据的范围,能够学习到更加复杂和精细的语言表示,进而展现出令人瞩目的语言生成和理解能力。LLMs通过海量的文本数据进行训练,深入学习了语言的结构、语义和上下文关系。这使得能够以统一模型处理各种自然语言任务,同时也展现出了强大的泛化能力和涌现出新的深度理解、逻辑推理、遵循指令、代码生成等能力,为解决一系列复杂任务提供了可能。 1.2人工智能大模型技术典型特征 大模型达到一定规模后,会涌现出传统语言模型以及中小规模预训练语言模型所不具备的特殊能力,使大模型在使用界面、应用开发方式、模型构建过程和工程要求上也有深刻的变化。 1.2.1突出的“涌现”能力 “涌现”能力是大模型在达到10亿参数以上规模后出现的特殊能力,它们在解决复杂任务时表现出显著的优势,使得大模型在自然语言处理(NLP)领域取得了突破性进展,例如数学问题解答、逻辑推理和多步推理等任务,主要体现