图书馆领域大模型创新应用需求调研报告 (征求意见稿V0.9) 上海图书馆(上海科学技术情报研究所)智慧图书馆技术应用联盟 2024年5月 说明 本报告为《图书馆领域大模型创新应用需求调研报告》的征求意见稿,仅供内部讨论、意见征集使用。在本报告的编纂过程中,得到诸多同仁及联盟成员的宝贵支持和专业意见,对此表示衷心的感谢。本报告版权属于上海图书馆(上海科学技术情报研究所)、智慧图书馆技术应用联盟。 本报告第二章节行业应用调研部分,整理自国内外公开网络信息和机构研报,特此致谢!感谢各有关机构对大语言模型技术发展与行业应用的深入调研,并公开分享这些宝贵的学习资源。 由于大模型技术与应用领域的飞速发展,本报告编写期间,很多方面如大模型能力、应用框架、多模态和智能体等方面已发生很多进展,虽然本报告尽可能考虑了相关技术对领域应用的影响,但还是强烈建议您在参考本报告内容时,密切关注大模型技术的最新进展和动态。同时,我们深知本报告难免还存在不少疏漏与不足之处,因此我们对此表示歉意,并希望您提供宝贵的反馈建议。 报告各章编辑: 第一章前言(嵇婷) 第二章大模型行业应用调研(许磊) 第三章大模型对图书馆的影响(嵇婷、周纲、许磊) 第四章智慧图书馆中的大模型应用(嵇婷、周纲、许磊) 第五章图书馆典型大模型应用需求及场景举例(嵇婷、周纲、许磊、刘倩倩、姚馨、刘贝玲、徐凡、吕思诗、张春景) 第六章总结与展望(嵇婷) 联系方式: 如对报告有任何建议,欢迎将反馈意见发送至邮箱:calsp@libnet.sh.cn。 目录 第一章前言1 第二章大模型行业应用调研3 2.1大模型行业应用价值3 2.2大模型行业应用服务4 2.3大模型行业应用技术方案6 2.3.1提示词工程6 2.3.2检索生成增强9 2.3.3智能体10 2.3.4模型微调13 2.4大模型行业应用案例14 2.4.1医药健康16 2.4.2金融保险17 2.4.3文化教育18 第三章大模型对图书馆的影响20 3.1图书馆大模型影响分析20 3.2图书馆大模型应用策略23 3.3图书馆大模型应用路径25 3.4图书馆大模型应用范式27 3.5图书馆大模型技术架构29 第四章智慧图书馆中的大模型应用31 4.1智慧服务中的大模型应用32 4.2智慧业务中的大模型应用36 4.3智慧管理中的大模型应用38 4.4智慧空间中的大模型应用41 第五章图书馆典型大模型应用需求及场景举例44 5.1智慧咨询服务45 5.1.1需求分析45 5.1.2场景举例45 5.1.3已有案例46 5.2智慧资源发现47 5.2.1需求分析47 5.2.2场景举例47 5.2.3已有案例49 5.3智慧阅读推广49 5.3.1需求分析49 5.3.2场景举例50 5.3.3已有案例51 5.4智慧知识服务52 5.4.1需求分析52 5.4.2场景举例53 5.4.3已有案例55 5.5智能采编辅助56 5.5.1需求分析56 5.5.2场景举例57 5.5.3已有案例60 5.6数字资源智能加工61 5.6.1需求分析61 5.6.2场景举例61 5.6.3已有案例62 5.7数字人文智慧研究与服务63 5.7.1需求分析63 5.7.2场景举例63 5.7.3已有案例66 5.8馆员智慧助手67 5.8.1需求分析67 5.8.2场景举例67 5.8.3已有案例68 第六章总结与展望70 附:云瀚应用商店AI应用列表72 第一章前言 人工智能(AI)技术以其迅猛的发展势头,正在成为推动社会进步的重要力量。在AI时代浪潮的推动下,以大模型技术为代表的生成式人工智能已经成为推动科技进步和产业变革的重要力量,为各行各业带来了革新的可能。2023年7月,国家互联网信息办公室等七个中央部门联合发布了《生成式人工智能服务管理暂行办法》,文件鼓励生成式人工智能技术在各行业、各领域的创新应用,探索优化应用场景,构建应用生态体系。2024年,政府工作报告中明确提出深化人工智能研发应用,开展“人工智能+”行动。国家鼓励人工智能技术与经济社会各领域深度融合,以推动各行业应用创新,赋能百业智能化转型升级。 伴随着新一代AI技术的兴起,图书馆界也迎来了重要的转型契机,步入了一个既充满机遇又面临挑战的新时代。在这一新的技术背景下,图书馆作为信息资源中心和知识服务核心场所,必须适应新时代的发展趋势,把握机遇,积极应对将AI融入运营与服务中的复杂挑战。为了有效应对变革,上海图书馆(上海科学技术情报研究所)联合上海人工智能研究院、智慧图书馆技术应用联盟于2023年9月发布了《图书馆大规模模型创新与应用白皮书》。白皮书从宏观层面,解读了智慧图书馆在AI2.0时代的发展环境和机遇,勾勒了大模型技术赋能智慧图书馆全景应用视图、实现路径、应用架构,为行业推进场景创新、落地实践、生态建设提出了方向性、建设性的参考与建议。 本报告旨在作为《图书馆大规模模型创新与应用白皮书》的补充,深入探讨大模型技术在图书馆领域的应用价值与潜在影响。在白皮书提出的图书馆领域大模型应用的总体架构与应用视图的基础上,本报告进一步分析了大模型技术在智慧图书馆中可实践应用的具体领域、场景和需求。本报告旨在揭示大模型在智慧图书馆中的应用潜力与可能性,提供图书馆在探索大模型技术创新应用的参考,以助力图书馆更好地把握人工智能发展所带来的机遇。 报告第二章首先对大模型的价值、技术、行业应用进行调研,旨在洞察行业趋势,评估大模型技术在图书馆领域的应用前景。第三章在详细分析了大模型对图书馆的影响后,提出了图书馆应用大模型的策略、路径和架构。报告第四章根据当前技术发展和落地现状,梳理了图书馆在智慧服务、智慧业务、智慧管理、智慧空间四个领域中,当前可实验、实施或展望的AI应用,并进行总结。第五 章重点聚焦于图书馆中的八个典型领域,通过需求分析、场景举例以及相关实践案例,深入探讨了大模型技术在这些领域的应用潜力。这八个领域是:参考咨询、资源发现、阅读推广、学术服务、采编辅助、资源加工、数字人文和管理决策,通过对这些关键领域的详细讨论,报告意在激发更多的创新思维,促进图书馆领域在大模型技术的开发应用和产品设计方面的思考与实践。 人工智能技术正处于快速演变之中。因此,本白皮书所阐述的观点和建议反映了当前阶段性的探索与思考。这些内容旨在为图书馆领域的未来发展提供启发,并促进对新兴技术趋势的理解和应用。随着技术进步和实践经验的积累,未来的应用模式和需求可能会有所变化,需持续对这些变革保持关注,并适时进行调整和优化以适应新的发展趋势。我们深知报告中存在诸多不足之处,因此,我们也诚挚邀请各界人士进行批评指正,我们将借助各方经验对报告进行修改和完善,从而为智慧图书馆大模型创新应用提供有益参考。 第二章大模型行业应用调研 2.1大模型行业应用价值 2022年11月上线的生成式人工智能(AIGC,AI-GeneratedContent)应用ChatGPT,在“大模型+大数据+大算力”的加持下,其在语义理解、文本创作、代码编写、逻辑推理、知识问答等领域表现卓越,在具备了多场景、多用途、跨学科的任务处理能力,是人工智能技术极为关键的发展节点1。ChatGPT的横空出世,标志着大语言模型(LargeLanguageModel,LLM,简称“大模型”)突破自然语言处理(NaturalLanguageProcessing,NLP)领域以小模型为主导的传统发展范式。通常认为,大语言模型是基于海量自然语言数据进行预训练而得到的超大型深度学习模型,参数通常从数十亿到超千亿。底层基于Transformer深度神经网络,由具有自注意力功能的编码器和解码器组成,编码器和解码器从一系列文本中提取含义,能够理解更大范围上下文的单词和短语之间的语义关系。这种巨量数据训练架构使得大语言模型具有了被称为“涌现”的泛化推理能力2,使其具有了通用人工智能(AGI)的特性。用同样方法对海量图片、音频、视频等多媒体信息结合语言数据进行预训练和指令微调的超大型深度学习模型也是大语言模型的一种发展,通常称为多模态大模型。也可以将上述两者并称为“大模型”。大模型的“涌现能力”不仅可以实现文本、图像、音频、视频的生成,构建多 模态,还可以在更为广泛的领域生成新的设计,新的知识,甚至实现广义的艺术和科学的再创造3。大模型的“大规模”和“预训练”属性,决定了其具有能力泛化、技术融合、应用支撑三大核心作用4。 (1)能力泛化方面,大模型预先在海量通用数据上训练使其具备了通用任务的泛化能力,更可进一步结合垂直行业和业务场景需求进行模型微调和应用适配,摆脱传统AI能力碎片化、作坊式开发的束缚。大模型得益于其“大规模预训练﹢微调”的范式,可以很好地适应不同下游任务,展现出它强大的通用性。 (2)技术融合方面,文本大模型融合语言、视觉、听觉等多模态信息,通 1中国人工智能学会.中国人工智能系列白皮书——大模型技术(2023版),https://www.caai.cn/index.php?s=/home/article/detail/id/3172.html,2023. 2赵鑫,李军毅,周昆,唐天一,文继荣.大语言模型,https://llmbook-zh.github.io/,2024. 3龙志勇,黄雯.大模型时代:ChatGPT开启通用人工智能浪潮[M].中译出版社,2023. 4海通国际.MaaSModelasaService模型即服务,https://pdf.dfcfw.com/pdf/H3_AP202302081582885375 _1.pdf,2023. 过对齐预训练和指令微调,实现多模态感知与统一表示;也可集成知识图谱、搜索引擎、代码执行、工具调用等技术,或者与小模型融合,从而实现优势互补,性能上实现“1+1>2”的效果,显著提升大模型的功能丰富性和性能优越性1、2。 (3)应用支撑方面,大模型涌现能力的重要体现是复杂任务推理2。复杂推理能够使大模型应用通过与工具、用户和外部环境的互动来完成复杂的指令。这为构建大量应用程序提供了机会,从而使大模型有机会成为下一代计算平台/操作系统,有效支撑智能终端、系统、平台等产品应用落地,解决传统AI应用过程中存在的壁垒多、部署难问题。 从人工智能到各行业的商业应用,可以看作是上下游的关系。大模型因其自身在能力泛化与技术融合方面的优势,使其在应用支撑方面具有先进性;同时大模型做到了相对标准化,下游可以降低对算法的使用成本,以及商业应用的适配成本。因此,大模型在“AI+”行业中将承担“基础设施”式的功能,作为底座将AI技术赋能千行百业。也就是说,在基于数据的互联网时代、基于算力的云计算时代之后,将进入基于大模型的AI时代。在未来,基于大模型,人工智能将如供水供电一般流向终端,流向用户和企业。 2.2大模型行业应用服务 大模型应用落地场景按照架构层级,一般可分为:模型层、中间层和应用层 5。 (1)第一层,为上游基础模型层,也就是由预训练模型为基础搭建的AIGC 技术基础设施层。由于预训练模型的高成本和技术投入,具有较高的进入门槛,不在本文讨论范围。 (2)第二层,为中间层,即垂直化、场景化、个性化的模型和应用工具。预训练的大模型是基础设施,在此基础上可以快速抽取生成场景化、定制化、个性化的小模型,实现在不同行业、垂直领域、功能场景的工业流水线式部署,同时兼具按需使用、高效经济的优势。随着兼具大模型和多模态的AIGC模型加速成为新的技术平台,模型即服务(ModelasaService,MaaS)开始成为现实。OpenAI创始人山姆·奥特曼(SamAltman)“认为中间那一层会创造很多价值。 5腾讯研究院.AIGC发展趋势报告2023,https://research.tencent.com/report?id=AJJ,2023. 它们不必创建基本模型,可以只为自己或与人共享来创造应用。这是创业公司能够做的关于数据飞轮的事。” (3)第三层,为应