北京市科委、中关村管委会 北京市人工智能 编制 行业大模型创新应用白皮书 北京市科委、(2中023关年)村管委会 北京市科学技术委员会、中关村科技园区管理委员会 二〇二三年十一月 北京市科委、中关村管委会 编制 北京市科委、中关村管委会 目录 编写说明. 综述 全球大模型发展整体态势 编制 二、国内外大模型行业应用概述..(一)国外大模型行业应用情况 (二)我国大模型行业应用情况..11 三、北京市大模型行业应用情况18 (一)北京市大模型产业发展情况. (二)北京市大模型行业应用特点19 1.政务领域 23 2.金融领域 .29 (三)大模型行业应用典型案例.22 3.医疗领域 34 4.传统产业赋能领域 .41 5.文化旅游领 46 6.智慧城市领域 .53 (四)北京市大模型行业应用面临的挑战59 步建议, 结语 64 致谢声明.. .65 北京市科委、中关村管委会 编制 北京市科委、中关村管委会 编制 编写说明 近一年来,大模型热潮席卷全球并持续升温。越来越多 的知名高校、科研院所和创新型企业加大研究力度,大模型 技术不断送代升级,模型能力不断加强,逐渐形成从底层算 力、模型开发到行业应用的全新智能化产业。随着大模型技 术趋于成熟,政策环境逐渐明朗,大量企业开始将大模型建 设重心从基础能力建设向应用能力建设转移,更多的产业数 字化潜力持续释放。 在此背景下,北京市科学技术委员会、中关村科技园区 管理委员会会同有关部门和相关区举办了2023年北京市人 工智能行业大模型创新应用大赛,并依托大赛相关案例及前 期工作积累编写本报告,致力于展示北京市大模型应用成 果,促进大模型价值传播和供需对接。限于编写时间仓促、编写人员知识积累有限、整体场景应用尚不成熟等方面的影 北响,京内容市或有蔬科漏,敬请指正。 北京市科委、中关村管委会 编制 综述 作为新一轮科技革命和产业变革的核心引擎,人工智能 正在为经济社会发展持续注入新动能,今年以来,大模型技 术引领着人工智能领域迈入新发展高度,在世界范围内受到 广泛关注。大模型对于人工智能户商和企业用户而言,是, 个重要发展机遇。 人工智能厂商方面,谷歌、微软、Meta、亚马逊等全球 科技巨头将大模型视为重要发展机遇,积极投入并且大动作 频发。我国众多广商也投身大模型领域,包括百度、阿里、 腾讯等互联网大厂,科大讯飞、商汤科技、旷视科技等垂直 于AI领域的厂商,以及智谱华章、百川智能、MiniMax等大 模型初创企业。市场上也不乏高校研究机构的身影,清华 大学、中国科学院自动化所、北京智源人工智能研究院等发 企业用户方面,大模型在企业侧的应用速度之快超乎想 象。2023年初,企业管理层对大模型的话题还停留在大模型 是什么,是不是概念炒作。短短半年,大模型已经从饭后谈 资走向落地应用,大企业管理层关于大模型的对话变得比之 前复杂很多,他们希望了解到大模型能为企业发展带来哪些 变革,大模型的应用路径是什么,如何提升大模型的投资回 报率,以及应该为拥抱大模型做哪些准备。而且,大模型吸 引的人群也愈发广泛,不仅吸引CIO、CTO等技术管理者的 发挥价值。这些转变表明,大模型的变革之力正益得到产 关注,CEO、CMO等非技术类管理者同样期待大模型在业务中 北京市科委、中关村管委会 北 业界的认可。从传统行业到高科技行业,从行业黑马到行业 龙头,诸多企业开始论证或试点应用大模型,期望在客户运 营、软件开发、营销推动等领域有所提升,进而增强市场竞 争力。 通过对市场规模数据的分析,能较为直观地体现出企业 对大模型应用落地的热情。根据数字化市场的研究咨询机构 北京爱分析科技有限公司相关报告显示,2023年中国大模型市场规模约为50亿元(人民币,下同)。2023年,企业在大 模型方面的采购特点是论证多、采购少,各企业计划在2024 年开始大量释放大模型预算,因此市场规模将大幅增长,预 本报告基于前期对北京市人工智能行业大模型创新应 用案例研究的情况,按照领域分类,以政务、金融、医疗、 传统产业赋能、文化旅游和智慧城市等六大领域为切入点, 并从应用案例的业务背景、共性痛点、大模型解决方案等角 度展开系统分析,聚焦创薪性、示范性、经济与社会效益、 编制 计达到120亿元。 可推广性等四个维度,选取18个具有代表性的应用案例深入调研,力求为相关领域开展应用场景建设提供参考。 在海量数据上进行自监督训练,然后利用指令数据进行有监 督指令微调,提升模型对人类指令的追随能力,最后,基于 北京市科委、中关村管委会 一、全球大模型发展整体态势 人工智能大模型,是指通过在海量数据上依托强大算力 资源进行训练后能完成大量不同下游任务的模型。在技术层 面上,大模型的实现采用“预训练+指令微调+人类反馈的强 化学习”的训练范式。首先通过预训练技术将深度学习网络 编制 (一)大模型推动智能“涌现”,打开AI技术发展上限 由人类价值标注数据训练得到的奖励模型所提供的奖励信 息进行强化学习,控制大模型的输入符合人类价值判断。在 大模型使用时,通过设计提示进行即时学习可以进一步提升 大模型完成各类任务的能力。规模化是使大模型强大的重要 原因,研究表明当模型规模足够天的时候,会“涌现”智能 能力,具备处理新的、更高层次的特征和模式的能力,能够 为一系列下游任务带来更好的任务效果。大模型不断扩大的 规模由“量变”引发“质变”,模型通用认知能力不断提升。 大模型能力的迅速发展不仅有助于人类完成“规定动作”, 还可能帮助人类去研究和发现未知领域,突破人类过去没有 突破过的极限。 大模型的技术变革呈现数据巨量化、模型通用化、应用 模式中心化的特点。整个发展历程可划分为三个阶段。 特定任务的专用模型+大量标注数据”方式,在监督学习的 机制下训练得到一个个专用小模型,但是在词向量的自监督 2013-2018年的深度学习阶段,主要还是基于传统的“针对 北京市科委、中关村管委会 学习中,使用大规模数据进行预训练的方法已初见端倪: 2017年Transformer的提出为基础架构带来了规模化构建和 规模化运算的潜力。Transformer解决了RNN和LSTM的并行 能够容纳更多的参数规模,并且具备更强的语义特征提取能 化训练和长距离依赖间题,解决了CNN的局部归纳偏差间题, 年的预训练阶段,基于“海量无标注数据”,在自监督学习 机制下获得预训练大模型,通过少量标注数据微调后得到领 域专用模型。自监督学习机制的成功使得可利用的数据愈发 编制 力、长距离特征捕获能力、综合特征提取能力。2018年-2022 “巨量化”,从标注数据拓展到无标注数据。Bert将可利用 基准模型。自此,“预训练+微调"的学习范式成为主流。在 通用大模型上通过少量标注数据微调,即可适用于一系列下 的预训练数据量扩大3到5倍,成为自然语言理解任务中的 游任务。2022年下半年以来的大语言模型阶段,预训练大模 型的通用能力愈发强大,引入指令监督训练使得模型能更好 地追随人类指令完成各种任务,并提升了在下游任务上的泛 能化能力。,通过人类反馈学习让机器与人类价值对齐成为可 产”推动生产效率颠覆式提升 内容生产方面,生成式大模型率先在内容创作、图像生 成、数学人、游戏等娱乐媒体领域广泛应用,内容生产效率 和质量显著提升,内容生产模式从辅助人到“替代”人演变。 据Gartner预测,至2023年底,将有20%的内容被生成式大 北京市科委、中关村管委会 模型所创建;至2025年底,生成式大模型产生的数据将占所有数据的10%。技术服务方面,大模型的“无限生产”能 力重塑企业生产引擎。随着大模型能力的不断提升,AIAgent 成为重要发展趋势,未来,大模型将不仅仅是一种生产工具, 更多是作为企业“合作者”,持续为企业注入生产动能。 (三)大模型作为新的“根”基础设施,驱动AI范式) 变革 大模型实现模型生产从“作坊式”到“流水线”的升级。 针对特定应用场景需求训练一个个小模型,/模型难以复用和 编制 大模型出现以前,AI模型是“定制化、场景化"的开发方式, 积累,导致AI落地的高门槛、高成本与低效率。大模型实 现基础模型底座的标准化开发和泛在化应用,解决成本团 境。 通用大模型通过从海量的、多场景、多领域的数据中学 习共性知识,成为具有通用性和泛化能力的模型底座。基于 通用大模型底座可搭建各行业的垂类大模型,可以有效缩减 垂类大模型训练所需要的算力和数据量,缩短模型的开发周 模型为底座,通过快速增量训练和个性化微调的方式,允许 期,提升垂直领域的应用开发效率。OpenAI以GPT4通用大 普通用户通过简易对话界面自定义定制GPT,支持开发者采用私有数据对GPT进行个性化微调,使大模型更易于访问和 开发,产品形态更加丰富,以满足更产泛的市场需求。 市场竞争持续深入 (四)中美是大模型技术领域的主要“玩家”,大模型 指出,美国和中国发布的通用大模型总数已占全球发布量的 北京市科委、中关村管委会 2023年5月发布的《中国人工智能大模型地图研究报告》 80%。美国方面,形成了0penAI+微软、Meta、谷歌等多个“阵管”,OpenAI重点围绕GPT4底座模型完善上层开发者生态,Meta通过开源LLaMa等大模型,引领了全球大模型开源浪潮。 编制 我国方面,大模型再次诠释中国速度。截至2023年10月 我国10亿参数规模以上的大模型厂商及高校院所共计254 中国工程院院士郑纬民指出,美国作为全球科技霸主, 一直引领人工智能领域发展前沿,整个大模型的产业布局全 面领先,在研发能力、人才储备、硬件设施及融资环境方面 占据优势。相较而言,中国占据海量数据资源和应用场景优 家,分布于20余省市/地区。 势,但顶尖的AI人才缺乏,在基础理论、原创模型等颠覆 型、阶跃型技术方面仍缺乏引领能力。产业基础层的整体实 力较弱,高质量数据积累不足,在高端芯片、关键基础软件 等领域受制于美国 北京市科委、中关村管委会 二、国内外大模型行业应用概述 美国大模型商业化应用进展全球领先,商业化进展迅 速。一是网络、存储等基础设施建设完备,技术发展成熟, 为大模型产泛应用打下良好基础。二是具备充足的用于大模 型训练推理的高端芯片,算力充沛。三是大模型技术领先 一)国外大模型行业应用情况 以OpenAI为代表的大模型公司对美国大模型在全球取得领 先地位和广泛落地起到重要推动作用。 座,为个人、开发者和企业大模型应用持续赋能,其近期推 编制 OpenAI作为全球人工智能顶尖研究机构,以GPT4为底 出的GPTStore为大模型应用带来爆发式增长。据不完全统 计,美国大模型应用已经覆盖医疗金融、房地产、媒体、 等办公软件中,提高办公效率和用户体验;摩根士丹利也接 军事、气候预测等领域,如微软将GPT4能力集成到office 入GPT4能力,优化财富管理咨询流程;房地产服务商 Realtor.com的大模型工具可根据用户提示自动生成房屋图 出版系统中,简化运营,帮助记者摆脱甘常繁琐任务、解放 像以及进行房源匹配;报纸出版商Gannett将大模型集成到 生产力 区的大模型应用尚处于前期尝试阶段,仅个别头部企业开始 欧盟、英国、加拿大、新加坡、日本、印度等国家和地 应用。在英国,会计、法律等行业的国际知名企业在部署大 模型,如普华永道已在英国员工测试使用尽职调查、识别合 规间题、审批交易等功能,未来将面向全球推