总顾问:刘勤 发起人:杨寅吕晓雷 研究团队:上海国家会计学院金蝶集团元年科技中兴新云用友公司浪潮通软汉得信息久其软件 主办中心:智能财务关键技术(会计科技 AccTech)与系统平台研究室(中心) 学术支持:上海国家会计学院 基金支持:国家社会科学基金项目“人工智能对会计工作影响与会计职能转变研究”(20BGL083) 撰写团队:杨寅吕晓雷宛涛刘丹彤肖远明李彤张亚东鲁湘孙彦丛宁燕张蓓方高林张伟付立波孔冰莫小娟杨智刘峰赵鹤贾晓蕊史瑞超王站姜文杰陈昊 内容审定:刘勤杨寅发布日期:2024 年 9 月联系交流:yangyin@snai.edu研究院公众号二维码 目 录 前言7 1. 人工智能大模型技术概述8 1.1 人工智能大模型技术概念解析1.2 人工智能大模型技术典型特征89 1.2.1 突出的“涌现”能力1.2.2 统一的 Prompt 交互1.2.3 高扩展性的应用框架1.2.4 高成本的训练和推理过程99910 1.3 人工智能大模型技术发展历程及现状11 1.3.1 预训练语言模型1.3.2 大模型家谱1.3.3 国产大模型1.3.4 财务领域大模型11121213 1.4 人工智能大模型技术发展趋势14 1.4.1 模型架构演进1.4.2 训练方法创新1.4.3 应用场景拓展1.4.4 伦理和安全风险规避1.4.5 大模型发展趋势展望1515151616 2. 人工智能大模型技术体系架构概述17 2.1 人工智能大模型技术整体体系架构2.2 人工智能大模型技术分类1719 3.1 人工智能大模型技术赋能财务总体情况22 (1)人工智能大模型赋能财务发展前景(2)人工智能大模型在财务领域的应用分析2223 3.2 人工智能大模型技术赋能财务基本框架25 4. 人工智能大模型技术赋能财务应用31 4.1 人工智能大模型技术赋能家用电器制造行业 A 集团财务应用31 4.1.1 总体情况(1)需求背景(2)发展现状4.1.2 典型案例(1)案例背景(2)财务中台智能客服项目定位(3)财务中台 GPT 平台框架(4)财务大模型在智能客服场景的落地(5)智能客服建设成果4.1.3 应用场景(1)生成式智能客服(2)非结构化附件的智能审核(3)生成式财务分析(4)生成式管报3131323333333436373838383940 4.2 人工智能大模型技术赋能 B 公司财务应用40 4.2.1 总体情况(1)需求背景(2)发展现状4.2.2 典型案例(1)智能财务平台业务架构(2)企业大模型应用架构(3)企业智能助手4.2.3 应用场景(1)智能审单机器人(2)智能交单(3)智能财务制度助手(4)智能财务数据分析助手404041424243454747494951 4.3 人工智能大模型技术赋能 C 银行财务应用53 4.3.1 总体情况(1)需求背景5353 (2)发展现状4.3.2 典型案例(1)建设思路(2)建设框架(3)技术突破4.3.3 应用场景(1)风险评估防控(2)投资组合推荐(3)欺诈行为检测545454555657575960 4.4 人工智能大模型技术赋能 D 汽车企业财务应用61 4.4.1 总体情况(1)需求背景(2)发展现状4.4.2 典型案例4.4.3 应用场景(1)智能采集(2)智能审核(3)智能月结(4)智能风控(5)经营分析61616262646469727985 4.5 人工智能大模型技术赋能 E 大型基础设施综合服务商财务应用89 4.5.1 总体情况(1)需求背景(2)发展现状4.5.2 典型案例4.5.3 应用场景(1)智能差旅(2)智能审核(3)智能融资决策8989899092929395 4.6 人工智能大模型技术赋能 F 医药行业财务应用96 4.6.1 总体情况(1)需求背景9696 (2)发展现状4.6.2 典型案例4.6.3 应用场景(1)合规性监控应用(2)智能财务客服的应用97979999101 4.7 人工智能大模型技术赋能 G 大学财务应用103 4.7.1 总体情况(1)需求背景(2)发展现状4.7.2 典型案例(1)模型与知识服务(2)智能财务能力组件(3)财务智能体(AI Agents/ 数字会计 / 智能助理)(4)用户场景与应用衔接(5)案例应用效果与前景4.7.3 应用场景(1)智能财务助理(2)智能填报(3)智能稽核103103103104105106107108108109109111116 4.8 人工智能大模型技术赋能 H 投资集团财务应用118 4.8.1 总体情况(1)需求背景(2)发展现状4.8.2 典型案例4.8.3 应用场景(1)共享服务与智能问答(2)管理报告与智能分析(3)司库管理与虚假贸易识别(4)决算分析与填报助手(5)工程风险评价与合规管理118118119119122122123124124125 5. 人工智能大模型财务应用局限性和关注问题127 5.1 人工智能大模型技术财务应用局限性5.2 人工智能大模型技术财务应用关注问题127127 前 言 2023 年 9 月,习近平总书记在黑龙江考察东北全面振兴期间首次提出“新质生产力”这一重要性的概念,并要求“积极培育新能源、新材料、先进制造、电子信息等战略性新兴产业,积极培育未来产业,加快形成新质生产力,增强发展新动能”。人工智能是适应全球经济创新发展的新质态生产力,习近平总书记强调指出:“加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源” 。财政部、国资委等部委也相继明确指出人工智能等新技术推动财务(会计)数字化转型的重要作用,实现财务管理工作的高质量发展。 2022 年横空出世的 ChatGPT 是一个里程碑式的人工智能深度学习系统。人工智能大模型的发展可以追溯到以传统神经网络模型为代表的萌芽阶段,而随着 Google 提出基于 Transformer架构的神经网络模型,奠定了大模型预训练算法架构的基础。2022 年 OpenAI 公司发布的ChatGPT 是通用人机对话系统,是一个大型的语言模型和一款具有较高智能的多语言聊天机器人,在 Transformer 架构基础上,以 GPT(Generative Pre-trained Transformer,生成式预训练语言模型)模型及人类反馈的强化学习(RLHF)进行精调的策略下取得了巨大的成功。 虽然真正意义上的人工智能大模型发展历史并不长,但对人类社会的影响产生了积极作用。财务作为服务经济发展的重要组成部分,也将受到人工智能大模型的影响。目前,我国企事业单位已将光学字符识别、自然语言处理、语音识别、机器人流程自动化、专家系统、规则引擎、知识图谱、机器学习、深度学习等人工智能技术应用在会计核算、费用报销、财务报告、战略管理、预算管理、成本管理、营运管理、投融资管理、绩效管理、风险管理、管理会计报告、资金管理、司库管理、税务管理、审计管理等大财务领域。随着人工智能技术创新迭代,大模型将在大财务领域的应用开花结果。基于此,我们编写了《人工智能大模型技术财务应用蓝皮书》,通过大模型的技术概念、典型特征、技术架构、财务应用基本框架、财务典型案例、财务应用场景等内容,旨在帮助与引领企事业单位财务部门及广大财务人员认识大模型的技术类型与发展趋势,并了解大模型在大财务领域的应用场景,希望能够为需要的人提供启发。 1.人工智能大模型技术概述 1.1 人工智能大模型技术概念解析 人工智能(Artificial Intelligence,简称 AI)是约翰·麦卡锡等人在 1956 年达特茅斯会议上首次提出的概念,主要研究和开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统。人工智能领域的研究包括机器人、语音识别、计算机视觉、自然语言处理、专家系统和机器学习等,旨在通过一定的学习和训练,使计算机能够模拟人类感知、认知智能行为,从而完成一定的任务。 深度学习(Deep Learning)作为机器学习(Machine Learning)的一个重要分支,基于人工神经网络(ANN)进行建模,通过模拟人脑神经元的连接和工作方式,使计算机能够像人一样学习和理解数据。深度学习技术的核心在于其深度神经网络结构,这些网络通常由多个层次组成,每一层都能够从输入数据中提取出更高级别的特征。随着层次的加深,网络能够学习到越来越复杂和抽象的特征,随着层数加深以及维度加大,逐渐形成大规模参数的模型(广义的大模型),从而实现对数据的更深入理解。 机器为了深入理解和有效掌握语言,采用构建语言模型的方法来进行语言的表征和建模。早期的语言模型是通过手工编写的规则和语法结构来解析和生成语言,随着统计学的发展,统计语言模型(Statistical Language Models)开始兴起,基本思想是基于马尔可夫假设构建单词预测模型,例如,基于最近上下文预测下一个单词,为了减少计算,通常上下文取前 n 个词,也被称为 n-gram 语言模型。 为了提升语言模型的上下文理解能力,深度学习技术与语言模型进行结合产生了神经网络语言模型(Neural NetworkLanguage Models)。早期的神经网络语言模型如循环神经网络(RNN)能够处理序列数据,但存在梯度消失和梯度爆炸问题。长短期记忆网络(LSTM)和门控循环单元(GRU)等变种 RNN 模型通过引入门控机制,解决了 RNN 的梯度问题,能够更好地处理长序列数据。Transformer 模型则采用了自注意力机制,进一步提高了模型对序列中不同位置信息的处理能力,成为了目前最流行的语言模型架构之一。 预训练语言模型(Pretrained Language Models, PLMs)是一种通过在大规模语料库上进行无监督预训练的语言建模方法,旨在学习语言的通用表示。模型通过捕捉语言的统计规律和结构信息,为自然语言处理(NLP)任务提供了强大的基础。在预训练完成后,PLMs 可以通过微调(fine-tuning)的方式,针对特定任务如机器翻译、文本分类、情感分析等进行适应性调整,典型代表如 Bert 模型。 近年来,随着计算能力的飞速增强和大规模数据训练模型技术的崛起,生成式大语言模型(Large Language Models,LLMs)以 ChatGPT 为代表,开始崭露头角。这些模型通过扩大预训练语言模型的规模和训练数据的范围,能够学习到更加复杂和精细的语言表示,进而展现出令人瞩目的语言生成和理解能力。LLMs 通过海量的文本数据进行训练,深入学习了语言的结构、语义和上下文关系。这使得能够以统一模型处理各种自然语言任务,同时也展现出了强大的泛化能力和涌现出新的深度理解、逻辑推理、遵循指令、代码生成等能力,为解决一系列复杂任务提供了可能。 1.2 人工智能大模型技术典型特征 大模型达到一定规模后,会涌现出传统语言模型以及中小规模预训练语言模型所不具备的特殊能力,使大模型在使用界面、应用开发方式、模型构建过程和工程要求上也有深刻的变化。 1.2.1突出的“涌现”能力 “涌现”能力是大模型在达到 10 亿参数以上规模后出现的特殊能力,它们在解决复杂任务时表现出显著的优势,使得大模型在自然语言处理(NLP)领域取得了突破性进展,例如数学问题解答、逻辑推理和多步推理等任务,主要体现在: 上下文学习(In-context learning):大模型能够通过提供的自然语言指令或者提示语(prompt)中的个别任务示例引导,在没有额外训练和参数更新的情况下,生成与指令或示例相符的期望输出。例如,13B 的 GPT-3 模型在算术计算以及一般任务上都能表现出不错的上下文学习能力,但 GPT-1 和 GPT-2 模型则没有。 指令遵循(Instruction following):通过使用自然语言描述的多任务数据集进行指令微