政务大模型产业图谱研究报告 「前言」 作为新一轮科技革命和产业变革的核心引擎,以ChatGPT为代表的大模型引发全世界的高度关注。国外科技企业竞相围绕大模型扩展商业版图,国内群雄逐鹿愈演愈烈,上百个大模型雨后春笋般涌现,引领千行百业数智化创新发展。大模型发展热潮在带动产业规模、改变生活生产方式、撬动资本市场等方面均带来深刻影响。习近平总书记高度重视人工智能技术发展,指出要加快新能源、人工智能、生物制造、绿色低碳、量子计算等前沿技术研发和应用推广。中共中央政治局4月28日召开会议强调,“要重视通用人工智能发展,营造创新生态,重视防范风险”,同时,为促进大模型的健康发展和规范应用,维护国家安全和社会公共利益,《生成式人工智能服务管理暂行办法》、 《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》、 《北京市促进通用人工智能创新发展的若干措施(2023-2025年)》、 《北京市通用人工智能产业创新伙伴计划》等一系列政策文件陆续发布。 其中,政务业务不仅是连接政府、企业和市民的重要枢纽,同样也是大模型应用和创新的桥头堡。本文主要聚焦大模型在政务行业的应用,整理了政务大模型产业图谱,并从发展态势、现状分析、热点动态等方面进行分析研究,最后提出政务大模型发展建议,希望研究 成果能为社会各界参与大模型共同建设提供借鉴和参考。限于时间和能力所限,内容如有疏漏之处,烦请不吝指正。 「本书编写组」 编写单位 中移系统集成有限公司 中移信息系统集成有限公司 北京中软国际信息技术有限公司 国泰新点软件股份有限公司大汉软件股份有限公司 北京国脉互联信息顾问有限公司上海通办信息服务有限公司 编写成员 于庆军 卫小波 陈志刚 马鹏程 刘金樱 胡珉 郭昱 孙海涛 郭毅峰 周洪瑶 顾正嘉 刘宇 陈佳鑫 周小红 罗玉泉 池明男 杨云 吕民辉 周勤 周向明 庄子骏 「目录」 01政务大模型产业图谱 02政务大模型概念 03大模型现状与挑战 04政务大模型热点动态 05产业发展建议 01 政务大模型产业图谱 图1政务大模型产业图谱 3 02 政务大模型概念 大模型(LargeModel,也称基础模型,即FoundationModel)是指容量较大,用于深度学习任务的模型,通常具有海量的参数和复杂的架构。大模型具有更好的通用性、精度和效率,可以通过预训练或其他方式在大型数据集上进行学习,再通过微调高效地处理计算机视觉、自然语言处理等复杂任务。1随着大模型技术的不断发展,关于“大模型”的标准也不断发生新的变化。早期,数百万或几千万个参数的模型就被认为是“大模型”。但现在,由于模型的参数量和计算复杂度都在不断增加,数亿甚至数十亿个参数的模型也越来越多。 ChatGPT对大模型的解释更为通俗易懂,重点突出类似人类的归纳和思考能力:大模型本质上是一个使用海量数据训练而成的深度神经网络模型,其巨大的数据和参数规模,实现了智能的涌现,展现出类似人类的智能。 业界把大模型通常分为通用大模型、行业大模型两类。行业大模型是指在特定行业领域应用的大型语言模型。与通用大模型相比,行业大模型更加专注于某个特定的行业,例如政务、金融、医疗、法律等。行业大模型通过在该行业的领域数据上进行训练和优化,可以更好地理解和处理该行业的专业术语、规范和语义。行业大模型的发展得益于大数据和深度学习等技术的进步,以及对各个行业特定需求的理解。通过训练行业大模型,可以利用模型的语言理解和生成能力来解决该行业中的各种问题。 1《人工智能通用大模型(ChatGPT)的进展、风险与应对》华东政法大学人工智能与大数据指数研究院,2023年2月 参考行业大模型定义,同时,总结提炼市场上各类政务大模型产品描述,政务大模型就是指应用于政务领域的大语言模型,通常具有强大的语义分析能力和深层次的理解能力,可以帮助政府机构提升信息处理效率和服务质量,或能够帮助缩短政策落地时间和决策周期,或能让业务办理更加智能化。具体政务应用场景可包括三大类2:政务服务一网通办、城市治理一网统管、政府办公一网协同。政务大模型核心价值效果在于,在政府管理、社会治理、公共服务等多个领域,可以预测政策效果、优化政务流程、提高公共服务水平,处理许多复杂政务问题,解决现行政务服务中的实际问题和痛点,更好地满足人民群众的各种需求,优化提升政府服务质量。3 大语言模型(LargeLanguageModel):通常是具有大规模参数和计算能力的自然语言处理模型,例如OpenAl的GPT-4模型。这些模型可以通过大量的数据和参数进行训练,以生成人类类似的文本或回答自然语言的问题。大型语言模型在自然语言处理、文本生成和智能对话等领域有广泛应用。 视觉大模型:视觉大模型是指具有千万级别或更多参数的神经网络模型,这些模型在计算机视觉领域中广泛应用。视觉大模型可以用于图像分类、目标检测、语义分割等任务,具有很高的准确性和泛化能力。一般使用卷积神经网络(CNN)或可变形卷积神经网络 2《数字政府建设与发展研究报告(2023)》,云计算标准和开源推进委员会,2023年9月 3政务大模型发展趋势及运营商发展建议,天翼智库,2023年12月 (Transformers)进行构建。 多模态大模型:多模态大模型指的是将文本、图像、视频、音频等多模态信息联合起来进行训练的模型。 涌现能力:在特定任务上,随着模型规模提升,模型性能突然出现显著提升,不再是通常的线性增长,而是成指数级快速上涨,出现原来不具备的能力。 GPT(GenerativePretrainedTransformer):是基于深度学习技术,用于自然语言处理的预训练模型。旨在生成自然语言文本并处理各种自然语言处理任务,如文本生成翻译、摘要等。它通常在单向生成的情况下使用,即根据给定的文本生成连贯的输出。 ChatGPT:ChatGPT是人工智能技术驱动的自然语言处理工具,专注于对话和交互式对话。它经过特定的训练,以更好地处理多轮对话和上下文理解。ChatGPT设计用于提供流畅、连贯和有趣的对话体验,以响应用户的输入并生成合适的回复。 AIGC(ArtificialIntelligenceGeneratedContent):指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。例如,通过输入关键词、描述或样本,AIGC可以生成与之相匹配的文章、图像、音频等。 大模型很大程度依赖于人工智能本身的特征,除此之外还有许多 自身独特的特征,许多专家、学者从不同角度进行了总结。本文在借鉴专家总结的基础上,凝练出大模型的以下5个特征: 大规模:大模型包含数十亿个参数,模型大小可以达到数百GB甚至更大。巨大的模型规模使大模型具有强大的表达能力和学习能力。 高性能:大模型通常具有更强大的学习能力和泛化能力,能够在各种任务上表现出色,包括自然语言处理、图像识别、语音识别等。 多任务:大模型通常会一起学习多种不同的NLP任务,如机器翻译、文本摘要、问答系统等。这可以使模型学习到更广泛和泛化的语言理解能力。 大训练:大模型需要海量的数据来训练,通常在TB以上甚至PB级别的数据集。只有大量的数据才能发挥大模型的参数规模优势。 大资源:训练大模型通常需要数百甚至上千个GPU,以及大量的时间,通常在几周到几个月。 区别于大模型,政务大模型更加聚焦于政务领域的应用,服务于政府机构和官员执行的各种事务性工作和管理工作,具有更加鲜明的政务相关特征。 服务政务:政务大模型采用先进的大语言模型技术,以“一网通管、一网协同、一网通办”为基础,不断优化政务工作,以提高政府决策科学性和效率、增强为民为企的公共服务能力。智能决策支持:利用大模型进行数据分析和预测,为政府制定更科学、合理的政策提供支持,提高决策水平。资源优化管理:运用大模型优化公共资源的管理,实现更精准的分配和更高效的利用,促进资源可持续利 用。智能公共服务:利用大模型提升公共服务的质量和效率,满足多元化的民众需求,实现“一网通办”的目标。 一城一策:我国各地政府政策之间的差异明显,一套标准化的通用模型难以满足各城市的多样化需求。政务大模型面向每个省份、城市以及乡镇的权利和服务的独特差异,需进行相应的模型训练和配置,确保大模型的有效运用。差异化模型训练:针对每个行政层级和地区,进行差异化的模型训练,以充分考虑其独特的政策环境和治理需求。灵活配置与调整:大模型需要具备灵活的配置和调整机制,以适应不同城市的即时变化和新兴需求,确保政务服务的及时性和准确性。多维数据融合:整合各级政府的历史数据、实际执行情况等多维数据,为政务大模型提供更全面的信息基础,以支持更精准的决策。 场景丰富:政务大模型应用落地场景丰富,如城市管理、公共安全、环境保护、教育卫生等,实现全场景的智能化治理。一网统管:政务大模型通过整合各领域数据,实现信息的全局性管理。例如,针对城市管理,大模型汇聚城市交通、环境、社会治安等数据,提供全面的城市治理方案。一网协同:政务大模型通过跨部门、跨层级的协同机制,实现政府各职能部门之间的信息共享和协同决策。例如,在公共安全领域,通过整合警务、交通、消防等部门的数据,实现对潜在安全风险的联动分析,为跨部门的紧急事件响应提供协同支持,提高整体治理效能。一网通办:政务大模型通过提供智能客服、智能搜索、公文写作等方式,协助开展各项行政公共服务事 宜。 大模型产业按照上中下游可划分为底层算力服务商、大模型建设商、以及行业解决方案提供商。 底层算力服务商:主要包括数据、网络、训练工具、芯片等资源,其中英伟达单卡芯片支持完成百亿参数级的模型训练工作,为大模型训练提供硬件基础;华为、百度、阿里、腾讯等大型企业开发专有的网络协议,并结合硬件和芯片,为训练提供高带宽的网络基础;在训练集和数据方面,在主流的数据训练集之外,政务大模型还添加了政策、公文等政务领域专有数据,加强大模型的政务敏感性。 通用大模型建设商:科技企业与研究机构积极布局训练框架、模型库、训练集和工具平台,不断优化算法和架构,加快大模型的训练部署,在搜索、对话、推荐等基础功能方面已经形成较为成熟的解决方案。而政务大模型则是在通用大模型的基础上,进一步融合政策信息、政务知识、专家经验等特定数据,提升大模型的在政务领域的业适配性。 行业解决方案提供商:相关行业厂商可以针对相关需求进行特定集的训练,从而使大模型工具能够赋能复杂的政务场景,例如智能审批、智能客服、辅助决策等,能够有效提升群众办事的满意度,提升政府人员的工作效率和服务能力。同时,政务大模型在应用过程中产生的数据反哺给训练集,使大模型更加精准有效。 图2大模型产业链剖析 03 大模型现状与问题 国家:早在2017年,国务院就发布了《新一代人工智能发展规划》,强调人工智能是引领未来的战略性技术,要把人工智能发展放在国家战略层面来系统布局,预计到2025年,国家会“初步建立人工智能法律法规、伦理规范和政策体系,形成人工智能安全评估和管控能力”。近几年,以ChatGPT为代表的生成式人工智能技术高速发展,但是这种技术在为社会带来便利的同时也带来了相关的法律风险。在此背景下,国家网信办等七部门正式发布了《生成式人工智能服务管理暂行办法》(以下简称《办法》),对生成式人工智能进行专项监管,于2023年8月15日施行。《办法》从技术发展与治理、服务规范、监督检查和法律责任等方面对生成式人工智能发展和应用提出指导和要求。 北京:2023年5月,北京市政府印发《北京市促进通用人工智能 创新发展的若干措施》,针对提升算力资源统筹供给能力、提升高质量数据要素供给能力、系统构建大模型等通用人工智能技术体系、推动通用人工智能技术创新场景应用、探索营造包容审慎的监管环境五大方向,提出21项具体措施。同月印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年