智慧图书馆大模型创新与应用白皮书 上海图书馆(上海科学技术情报研究所)上海人工智能研究院 智慧图书馆技术应用联盟(筹) 2023年9月 前言 当前,大模型技术加快创新发展,掀起人工智能创新发展的新一轮浪潮。为推动智慧图书馆建设,我国政府积极出台了一系列政策,加强智慧图书馆的战略部署。经过多年的发展,智慧图书馆已经积累了良好的平台和数据基础。与此同时,信息技术的飞速发展和数字人文研究也对图书馆提出高价值知识服务能力的新需求。在这个人工智能科技创新日新月异的时代,智慧图书馆作为知识传播的重要载体,迎来了前所未有的发展机遇和契机。 �白皮书深入探讨智慧图书馆领域大模型应用,通过研究大模型对于智慧图书馆的赋能作用,并从场景创新、落地实践、生态建 设三方面提供相关建议和指导,以促进智慧图书馆领域大模型技术的创新应用。首先勾勒大模型赋能智慧图书馆全景视图: 一是提出大模型技术赋能智慧图书馆路径,即大模型基于自然 语言处理技术优势和涌现能力,或通过模型微调训练、对接外部系统以满足体验类、专业类不同的功能和性能需求。 二是提出两类智慧图书馆大模型应用总体架构,分别为“智慧 图书馆+大模型”“大模型+智慧图书馆”。“智慧图书馆+大模型”围绕图书馆业务流程嵌入大模型技术,以图书馆业务需求为导向建设大模型应用,提升馆员业务管理和工作的效率以及智能化程度。“大模型+智慧图书馆”以大模型为核心延伸智慧图书馆服务应用,面向读者打造统一服务入口,提供咨询问答、检索推荐、新型阅读等多元服务。此外提出智慧图书馆大模型应用将逐渐由“+大模型”向“大模型+”范式转变的演变特征。 三是形成智慧图书馆大模型应用场景全景视图,梳理智慧管理、 智慧服务、智慧业务、智慧空间四个方面的智慧图书馆大模型应用场景。并分析提出智慧图书馆大模型应用将逐渐由内部管理、对外服务过渡到未来体验的发展态势。 以大模型赋能智慧图书馆全景视图为引领,白皮书随后从场景 创新路径、落地实践路径、生态建设路径三方面提出重点方向、技术参考、建议举措,以加快促进智慧图书馆领域大模型技术的创新 应用: 一是场景创新路径,白皮书梳理了智慧管理、智慧业务、智慧服务、智慧空间四个方向典型的智慧图书馆大模型应用场景,为智 慧图书馆领域大模型技术创新应用提供借鉴和参考。智慧管理对图书馆馆藏资源进行语义化管理和深度分析挖掘,充分释放图书馆信息资源的潜在价值。智慧业务依托大模型技术面向馆员的日常工作和业务提供智能化辅助,以智慧化手段提高馆员信息素养和能力。智慧服务依托大模型技术面向读者提供智能、便捷、人性化、个性化的新型阅读体验和高价值的知识服务。智慧空间运用大模型技术优化图书馆空间和读者的交互体验,打造基于元宇宙图书馆的虚实融合交互体验。 二是落地实践路径,白皮书首先从智慧图书馆大模型应用的规 划设计角度提供了包括现状调研、需求分析、总体设计及实施路径设计等方面的工作指导,其次针对智慧图书馆大语言模型的微调训练,白皮书围绕模型开发训练全过程,梳理了包括模型选型、模型调优、模型评估、模型部署、模型使用等环节的技术指南,以为智慧图书馆大模型应用创新实践提供借鉴和参考。 三是生态建设路径,白皮书围绕建立完善智慧图书馆大模型创 新生态,提出加强数据开放共享和分析挖掘、搭建多元服务集聚的开放平台、完善大模型创新应用标准规范、依托联盟营造开放的创新氛围、开展行业人才培养与交流互动等建议举措,推动图书馆行业开放合作,共建智慧图书馆大模型创新生态,为智慧图书馆大模型创新应用营造开放包容、协同创新的发展环境。 鉴于大模型技术的快速发展和行业应用仍处在创新探索阶段,以及对相关行业和业务的理解不够深入,我们深知白皮书存在诸多不足之处,可能仍然是完善版�前的0.9版�。因此,我们也诚挚邀请各界人士进行批评指正,我们将借助各方经验和智慧对白皮书进行修改和完善,从而为智慧图书馆大模型创新应用提供有益参考。 目录 一、智慧图书馆发展环境与机遇1 (一)政策布局和需求驱动加快智慧图书馆建设1 (二)图书馆紧跟数字化发展步伐并积累良好基础4 (三)大模型技术赋能智慧图书馆具有广阔前景7 二、大模型赋能智慧图书馆全景视图15 (一)大模型技术赋能智慧图书馆路径15 (二)智慧图书馆领域大模型应用总体架构17 (三)智慧图书馆大模型应用场景全景视图19 三、智慧图书馆大模型应用场景创新路径23 (一)智慧管理实现图书馆资源的语义化管理23 (二)智慧业务打造辅助图情业务的智能助手25 (三)智慧服务提供新型阅读体验和知识服务26 (四)智慧空间打造虚实融合的智能交互体验28 四、智慧图书馆大模型应用落地实践路径30 (一)智慧图书馆大模型创新应用规划设计30 (二)智慧图书馆大模型创新开发落地实施36 五、智慧图书馆大模型创新生态建设路径55 (一)加强数据开放共享和分析挖掘55 (二)搭建多元服务集聚的开放平台56 (三)完善大模型创新应用标准规范56 (四)依托联盟营造开放的创新氛围57 (五)开展行业人才培养与交流互动58 一、智慧图书馆发展环境与机遇 (一)政策布局和需求驱动加快智慧图书馆建设 1、公共文化与技术创新政策叠加为智慧图书馆带来新机遇 我国陆续出台推进公共文化服务数字化的相关政策,智慧图书馆建设的战略部署持续深化。 2021年3月,我国正式发布了《中华人民共和国国民经济和社 会发展第十四个五年规划和2035年远景目标纲要》,明确提出积极发展智慧图书馆,提供智慧便捷的公共服务。建设智慧图书馆成为加快数字社会建设步伐当中非常重要的战略任务。 同年3月,国家发展改革委联合多部门印发《关于推动公共文化服务高质量发展的意见》,提出加快推进公共文化服务数字化,明确加强智慧图书馆体系建设,建立覆盖全国的图书馆智慧服务和管理架构,大力发展基于5G等新技术应用的数字服务类型,拓宽数字文化服务应用场景。 2021年4月,文化和旅游部印发《“十四五”文化和旅游发展规划》,提出加快公共数字文化建设,部署全国智慧图书馆体系建设重点任务,即以全国智慧图书馆体系建设为核心,搭建一套支撑智慧图书馆运行的云基础设施,形成国家层面知识内容集成仓储,建设和运行智慧图书馆管理系统,在全国各级图书馆及其基层服务网点普遍建立实体智慧服务空间。 2021年6月,文化和旅游部发布《“十四五”公共文化服务体系建设规划》,提出推动公共文化数字化、网络化、智能化建设,以全国智慧图书馆体系建设项目和公共文化云项目为依托,加强数字文化内容资源建设,建设公共文化网络平台,以及拓展公共文化服务智慧应用场景。 2022年5月,中共中央办公厅、国务院办公厅印发了《关于推进实施国家文化数字化战略的意见》,提出统筹推进国家文化大数据 体系、全国智慧图书馆体系和公共文化云建设,增强公共文化数字内容的供给能力,提升公共文化服务数字化水平。 此外,中国国家图书馆在2021年10月发布了《国家图书馆“十四五”发展规划》,提出实施“智慧转型”战略,基于5G网络、大数据、云计算、物联网、区块链、人工智能等关键技术,推动国家图书馆在资源、服务、设施、管理等领域全面实现智慧化转型,并部署加强信息化基础设施建设、构建智慧图书馆管理系统、推进线下服务空间智慧化升级、建设数字孪生国家图书馆、构建开放知识服务平台等重点举措。 以深化人工智能等新型数字技术创新应用为主线,我国先后发 布了多个政策文件鼓励引导人工智能在公共文化服务领域的创新应用,为智慧图书馆建设营造了良好的政策环境。 2021年12月,国务院印发《“十四五”数字经济发展规划》,提出充分运用新型数字技术持续提升公共服务数字化普惠水平,加快优秀文化的数字化转化和开发,推动文化教育等领域公共服务资源的数字化供给和网络化服务。 2022年7月,国家科技部、工业和信息化部等六部门联合引发 《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,明确提出围绕高水平科研活动加强人工智能应用场景创新,充分发挥人工智能技术在文献数据获取、实验预测、结果分析等方面的作用,推动人工智能技术成为解决科学问题的新范式,为图书馆加强文献知识资源的整合开发利用、优化面向科研机构的知识服务等带来了有利的政策条件。 地方层面,结合大模型技术创新发展热潮,多个城市谋划了促 进大模型创新应用的相关政策布局,为探索图书馆行业领域的大模型落地应用提供了良好契机。 北京市率先发布《北京市促进通用人工智能创新发展的若干措 施》,围绕加强算力资源统筹供给、加强高质量数据要素供给、系统构建通用人工智能技术体系、创新通用人工智能技术场景应用等方面出台二十一条政策措施。 上海市推出《上海市推动人工智能大模型创新发展的若干措施》,围绕大模型创新能力、创新要素、创新应用、创新环境四大方向实施大模型创新扶持计划、智能算力加速计划、示范应用推进计划,并发布“模都”倡议,全力推进卓越引领的“模”都上海建设。 深圳市发布《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023—2024年)》,从强化智能算力集群供给、增强关键核心技术与产品创新能力、提升产业集聚水平、打造全域全时场景应用、强化数据和人才要素供给、保障措施等六个方面提出十八项具体举措。 成都市发布《成都市加快大模型创新应用推进人工智能产业高质量发展的若干措施》,具体围绕强化智能算力供给、提升创新策源能力、提升产业发展能级、构建全域场景体系、加强生态要素聚集等方面出台二十条政策措施。 2、信息技术发展和数字人文研究对图书馆服务能力提出新需求 信息技术发展倒逼图书馆提升信息服务生态位,提高知识服务和空间伴随能力。一方面,伴随着互联网、大数据等技术的发展, 信息资源呈现爆炸式的增长,信息内容的体量、复杂度不断变高,使得单个图书馆管理的信息资源占比变得越来越小。另一方面,ChatGPT等大语言模型应用的创新也使得人们对于信息、知识的获取、搜索、生产方式也发生了显著变化,人们可直接通过对ChatGPT提问来高效地获取相关知识。过去一段时间,图书馆作为提供资源和服务的门户而存在,管理重在书目、纸�等实体资源的收集、处理、组织和服务以及实体资源的数字化管理。如果图书馆长期停留在以资源为中心、以机构为中心的管理理念,而不重视以 用户为中心并利用数字技术提高信息服务价值,图书馆将难以适应数字时代下信息技术的发展潮流、难以满足数字时代下读者用户个性化、高质量的阅读需求,可能会沦为信息资源价值没有得到充分发挥的信息孤岛。因此,图书馆需要提升在信息服务中的生态位,提高信息资源收集、加工、流通和知识分析挖掘、服务能力,从提供资源检索的传统情报向提供高价值知识服务的智慧情报转变,并打造促进用户交流互动、学习分享、价值创造的空间,这样方能保持与时俱进,充分融入信息社会下的知识服务生态。 数字人文范式转变要求图书馆加快提高知识生产和服务能力。 数字人文是数字技术与人文学科的交叉领域,伴随计算机技术的发展,数字人文已从早期利用计算机实现人文资源的复刻镜像、全文检索排序,逐步发展至基于自然语言处理、知识图谱、数据可视化、AR/VR等数字技术进行数据加工、知识生产、内容服务等高阶形态,数字人文研究的精细度、价值挖掘深度显著提高。图书馆作为文化记忆机构,具有大量的家谱、古籍、地方志、碑帖等极具人文研究价值的特藏资源,在文化传承、参与数字人文研究、赋能人文学科建设方面具有重要地位和作用。因此,图书馆需要加快提高运用数字技术进行内容挖掘和知识生产、服务的能力,通过运用数字技术对特藏资源进行数字化加工,提取细粒度知识信息,或进行数字化再现兼顾古籍的“藏”与“用”,从而加强图书馆特藏资源的开发利用,以满足人文学科建设和研究、文化传承的需要。 (二)图书馆紧跟数字化发展步伐并积累良好基础 1、图书馆经历从自动化、数字化到智慧化的发展历程 图书馆自动化时期对应Web1.0阶段。这一时期,公众的信息来源主要为PGC(ProfessionalGeneratedContent),指的