目录 编写说明 -0�- 综述-05- 一、大赛开放多维度场景及高质量数据,大模型企业奇招频出 -0�- (一)政务领域 -0�- �.赛题情况 -0�- �.企业解决方案亮点 (二)金融领域 �.赛题情况 �.企业解决方案亮点 (三)产业升级领域 �.赛题情况 �.企业解决方案亮点 (四)医疗领域 �.赛题情况 �.企业解决方案亮点 (五)文化教育领域 -0�- -0�- -0�- -�0- -��- -��- -��- -��- -��- -��- -�5- �.赛题情况 -�5- �.企业解决方案亮点 (六)智慧城市领域 -��- -��- �.赛题情况 -��- �.企业解决方案亮点 -��- 二、北京市人工智能大模型行业应用情况分析 (一)应用特征 -�0- -�0- �.由浅入深,大模型穿越边缘场景,向核心场景挺进 -�0- �.守正创新,央国企拥抱新技术,加快大模型在产业升级、金融等 领域的落地步伐 -��- �.百花齐放,大模型应用搭建难度下降,“动态行业大数据”成为 落地新关键 -��- �.量体裁衣,需求方情况各异,在采购、部署大模型时特色鲜明5.保驾护航,大模型安全逐渐受到重视,为可持续发展提供保障 -��- -�5- (二)应用挑战 -��- �.算力需求持续增长,掣肘大模型落地应用 -��- �.知识产权、数据隐私与大模型应用之间的最佳平衡点仍在探索中 �.大模型幻觉问题有所改善,但距离规模落地尚有差距 �.部分大模型应用处于“可用阶段”,需求方和技术企业协同发力让“可用”迈向“好用” 5.部分领域受监管影响,对大模型落地提出特殊要求 (三)应用研判 �.政务领域 �.金融领域 �.产业升级领域 �.医疗领域5.文化教育领域 �.智慧城市领域结语致谢声明附录 -��- -��- -��- -��- -��- -��- -��- -��- -�5- -��- -��- -��- -��- -��- 编写说明 大模型是指通过在海量数据上依托强大算力资源进行训练后能完成大量不同下游任务的模型。大模型以其在模型精度和泛化能力等多个指标上超越传统AI模型的表现,以及赋能千行百业的巨大潜力,成为当今世界各国人工智能技术发展的核心方向。 大模型经过一年多的高速发展,已在政府、医院、学校、企业等各类需求群体中建立初步认知。其中一部分需求群体设立专项预算、开放业务场景,对大模型进行试点应用。通过试点应用,需求群体加深了对大模型能力和价值的认同感,进而普遍希望在未来继续增加相关预算,将大模型与实际业务进行更深入、更广泛的融合。 在此背景下,北京市科学技术委员会、中关村科技园区管理委员会会同有关部门和相关区举办了北京市人工智能行业大模型创新应用大赛,并依托大赛成果及前期工作积累编写本报告,致力于分析北京市大模型行业应用发展趋势,促进大模型价值传播和供需对接。限于编写时间仓促、编写人员知识积累有限、整体场景应用尚不成熟等方面的影响,内容或有疏漏,敬请指正。 04 综述 北京市积极布局人工智能,加速推动产业发展 人工智能大模型经过过去一年的发展,行业应用开始出现井喷式增长。作为发展新质生产力的重要引擎,人工智能正成为经济高质量发展的最大增量。 北京市委市政府高度重视人工智能发展,�0��年5月,北京市政府印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案 (�0��-�0�5年)》,强调构建高效协同的大模型技术产业生态,建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。北京市政府办公厅印发《北京市促进通用人工智能创新发展的若干措施》,强调开展大模型创新算法及关键技术研究、加强大模型训练数据采集及治理工具研发,推动大模型在政务、医疗、科学研究、金融等领域的示范应用。 近年来,北京市积极布局人工智能产业发展要素,通过部署智能算力平台、建设数据基础制度先行区、发布中文互联网语料库、设立产业投资基金、建设大模型产业集聚区等一系列举措,加速推动人工智能产业发展。截至目前,全市人工智能相关企业约��00家,约占全国四成;�0��年人工智能产业核心产值突破�500亿元。北京人工智能领域创新和产业链条完整,在基础设施层面集聚了寒武纪、摩尔线程、昆仑芯等国内头部企业;核心技术及算法层面拥有百度、智谱、百川智能、月之暗面、零一万物等代表性基础大模型,目前已备案上线大模型5�款,全国第一;应用层面拥有猿力科技、中科闻歌、瑞莱智慧等行业大模型技术企业,相关产品已在教育、金融、政务等领域率先应用。 05 北京市以行业大模型创新应用大赛为抓手全力推动大模型技术应用落地 为进一步加强重点领域大模型建设,根据市委市政府整体部署,在市人工智能专班的统筹调度下,北京市科委、中关村管委会会同相关单位,围绕重点行业领域,研究建立全市行业大模型应用推进工作机制,并于�0��年�月举办北京市人工智能行业大模型创新应用大赛,全力推动大模型技术应用落地。以期通过大赛,挖掘一批典型的行业应用案例,启发一批潜在试点单位拥抱大模型技术,梳理一批核心业务场景,开放一批行业核心业务数据,发现一批有潜力有实力的大模型技术企业,推动一批大模型供需之间的交流与合作。 大赛设置政务、金融、产业升级、医疗、文化教育、智慧城市�个赛道,分初赛和复赛两个阶段。初赛阶段类似“自由创作”,针对参赛团队所申报的应用案例,围绕商业价值和社会效益进行综合评估;复赛阶段类似“命题作文”,结合试点单位真实业务需求,由试点单位出题,对通过初赛的大模型技术企业进行能力考核。历经数月,大赛从�个赛道�00余家参赛单位中,征集应用案例��0余项,凝练应用场景�5个,开放高质量行业数据上万条。 本报告以大赛为切入点,展示了北京市大模型技术在各领域各行业的应用方向,根据不同领域对大模型应用趋势进行分析研判,并提出工作建议,力求向市场各类参与主体呈现北京市人工智能行业大模型创新应用发展态势,为未来决策提供参考。 06 一、大赛开放多维度场景及高质量数据大模型企业奇招频出 (一) 政务领域 �.赛题情况 方向一为基于多形态知识的政务认知智能体系研究,由北京市政务服务和数据管理局提出,以构建高质量政务数据知识体系为核心目标,需要参赛企业对全市海量政务数据的实时动态挖掘、清洗、标记、转换,并打造大模型测试训练的统一平台接口。复赛所用训练及测试数据集由公积金、交管局等政务知识数据脱敏形成,可供参赛企业带回,进行部署调试。该方向将有助于进一步提升政务服务数字化、智能化水平,在政务整体场景布局中发挥大模型数据中台作用,从而支撑政务领域各项业务的大模型应用。 方向二为基于依申请政务服务事项知识图谱的智能咨询,由北京市政务服务和数据管理局提出,以提升办事企业、群众在线政务咨询及申请办事的体验为核心目标,需要参赛企业针对用户提出的依申请办事相关咨询问题进行精准回答,并锁定服务事项。复赛所用训练及测试数据集由政务服务事项办事指南、事项说明等数据形成,可供参赛企业带回,进行部署调试。该场景从形式上属于大模型智能问答,是市政务服务和数据管理局面向大众群体的重要场景,需要大模型精准把控生成内容的同时保障用户的良好体验。 07 方向三为面向政策分析场景的政策专业化标注,由北京市政务服务和数据管理局提出,以为政府办事人员提供政策分析问答、指导政策制定为核心目标,需要参赛企业对政策性文件进行条款拆解、理解并训练大模型,获得准确的问答效果。复赛所用训练及测试数据集由专精特新的政策原文数据形成,可供参赛企业带回,进行部署调试。该场景需要大模型深度理解政策原文对其拆解及标注,并在政策制定的过程中给出参考意见,将有助于提升政策制定的效率及全面性。 �.企业解决方案亮点 在提升回复准确率方面,参赛企业提出两个较为有效的解决方案。部分参赛企业通过外挂知识库的检索增强(RAG)方法来索引政策知识,从而提升大模型生成结果的准确性,并且可行性较强,但这种方案依赖知识库的知识储备和及时更新,在长期运维过程中不仅带来额外的人力成本,也可能生成大量重复、过期的知识。部分参赛企业利用大模型来对知识进行分析和存储,相比于外挂检索增强,这种通过大模型对知识进行管理的方案虽然在短期内可能会因为大模型幻觉等问题在答案精准性上有所欠缺,但长期看,随着基座大模型能力不断提升,这类方案能够真正的理解数据,从而更好的更新和利用知识,在开展垂直领域微调后表现出更好的效果。 参赛企业在提升用户体验方面也做出了多维度的尝试,从部署上,参赛企业在微调大模型后采用一体机的形式将大模型应用进行私有化部署,为数据敏感的政务场景提供解决方案。在提升准确度的考虑上,参 08 赛企业利用知识图谱辅助大模型精准定位知识,并通过主动多轮质询用户的方式提升答案质量。 (二) 金融领域 �.赛题情况 方向一为基于AIGC技术的智能审计合规研究,由北京银行提出,以提高审计工作效率和准确性为核心目标,需要参赛企业针对检查内容,利用大模型技术寻找并给出相关现象涉及的制度名称及相关原文,生成包含检查要点、检查方法等内容的审计合规方案。复赛所用训练及测试数据集由北京银行制度、监管政策以及历史问题库等内部审计合规相关知识形成,仅允许本地私有化部署。金融审计场景作为北京银行的核心业务之一,对审计结果的正确性要求很高,对大模型的检索能力及溯源能力提出较高要求。 方向二为基于金融行业的营销引导式智能员工,由北京首创融资担保有限公司提出,以帮助业务人员迅速生成风险报告,评估企业风险情况为核心目标,需要参赛企业对金融场景的数据进行理解并训练大模型,最终生成包含产品特征、贷款担保资质、项目方案(预估放款金额、担保费率)等问题的解决方案。复赛所用训练及测试数据集由企业画像、业务评审报告等文件数据形成,仅允许本地私有化部署。金融担保同时具备金融性和中介性双重属性,为完成融资担保流程,担保公司不仅需要熟悉了解金融专业及法律规定,还需要具备一定的营销能力,因此本题目方向覆盖了金融领域的端到端需求,对大模型在金融领域的综合能力提出了较高的要求。 09 �.企业解决方案亮点 外挂知识库的检索增强技术(RAG)对于提升金融大模型的回答精准度效果明显。RAG在使用语言大模型回答问题之前,从外部知识库中检索相关信息,为大模型回答提供外部知识支撑。金融领域业务具有较强的专业性,RAG技术的运用可以让大模型更好的应对知识密集型任务,不同企业在RAG的基础上可以对检索方式进行扩充,从而更准确的命中外部知识,提升回答的精准度。 强化对齐技术在金融领域发挥重要作用。未经强化对齐的模型可能会输出不符合金融行业风格甚至计算错误的结果。金融领域对结果的合规性、专业性要求很高,利用强化对齐技术的参赛企业在本次比赛中表现更好。 10 (三) 产业升级领域 �.赛题情况 方向一为基于多形态、多维度、多场景数据的企业成本智能化分析及预测,由中都物流有限公司提出,该题目方向以提升物流服务领域企业成本分析和预测的智能化水平为核心目标,需要参赛企业基于企业成本相关的数据集、社会面的数据集开展大模型训练,形成企业成本预测和分析的大模型智能工具。复赛所用训练及测试数据集由中都物流提供的线路成本、台账、运营成本等数据脱敏形成,可供参赛企业将数据带回,进行部署调试。该赛题以企业成本分析为核心目标,本身属于企业数字化转型的重要部分之一,大模型的分析及生成摘要能力,在此场景下有较好的应用空间,将有助于企业智能化决策,帮助企业把控成本。 方向二为基于联通业务数据的运营商行业大模型研究,由联通(北京)产业互联网有限公司提出,该题目方向以实现运营商业务数字化、办公智能化升级,提升运营商企业服务能力和效率为核心目标,需要参赛企业针对用户提出的运营商领域相关咨询问题进行精准回答。复赛所用训练及测试数据集由与联通公司相关的媒体报道、产品和方案介绍等内容组成,涉及大数据、云计算、物联网、区块链、安全、人工智能、产品介绍、解决方案、公司业务等方面,可供参赛企业将数据带回,进行部