您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[哈尔滨工业大学]:ChatGPT调研报告–20230308 - 发现报告
当前位置:首页/行业研究/报告详情/

ChatGPT调研报告–20230308

ChatGPT调研报告–20230308

C(h仅atG供P内T 部调参研考报)告 2023年3月6日 自然语言哈处尔理滨研工究业所大(学HIT-NLP) 序言 2022年11月30日,OpenAI推出全新的对话式通用人工智能工具——ChatGPT。ChatGPT表现出了非常惊艳的语言理解、生成、知识推理能力,它可以很好地理解用户意图,做到有效的多轮沟通,并且回答内容完整、重点清晰、有概括、有逻辑、有条理。ChatGPT上线后,5天活跃用户数高达100万,2个月活跃用户数已达1个亿,成为历史上增长最快的消费者应用程序。除了被广大用户追捧外,ChatGPT还受到了各国政府、企业界、学术界的广泛关注,使人们看到了解决自然语言处理这一认知智能核心问题的一条可能的路径,并被认为向通用人工智能迈出了坚实的一步,将对搜索引擎构成巨大的挑战,甚至将取代很多人的工作,更将颠覆很多领域和行业。 哈工大自然语言处理研究所组织多位老师和同学撰写了本调研报告,从技术原理、应用场景、未来发展等方面对ChatGPT进行了尽量详尽的介绍及总结。 本报告仅供内部参考。 主要编撰人员 第一章由车万翔、杨沐昀、张伟男、赵妍妍、冯骁骋、孙承杰、李佳朋编写;第二章由张伟男、隋典伯、高翠芸、朱庆福、李明达、王雪松编写;第三章由刘铭、朱聪慧、汤步洲编写;第四章由徐永东、高翠芸、朱庆福编写;第五章由杨沐昀、张伟男、韩一、庄子彧编写;第六章由隋典伯、高翠芸编写;第七章由车万翔、刘铭编写。参与各章审校工作的还有:崔一鸣、徐志明等。 报告整体由车万翔统稿。 目录 第一章ChatGPT的背景与意义6 1.1自然语言处理的发展历史6 1.2大规模预训练语言模型的技术发展历程8 1.3ChatGPT技术发展历程8 1.3.1ChatGPT的相关技术10 1.3.2ChatGPT技术发展脉络的总结11 1.3.3ChatGPT的未来技术发展方向12 1.4ChatGPT的优势与劣势13 1.4.1ChatGPT的优势13 1.4.2ChatGPT的劣势15 1.5ChatGPT的应用前景16 1.5.1在人工智能行业的应用前景及影响17 1.5.2在其他行业的应用前景及影响17 1.6ChatGPT带来的风险与挑战19 第二章ChatGPT相关核心算法24 2.1基于Transformer的预训练语言模型24 2.1.1编码预训练语言模型(Encoder-onlyPre-trainedMod- els)24 2.1.2解码预训练语言模型(Decoder-onlyPre-trainedMod- els)25 2.1.3基于编解码架构的预训练语言模型(Encoder-decoder Pre-trainedModels)28 2.2提示学习与指令精调30 2.2.1提示学习概述30 2.2.2ChatGPT中的指令学习31 2.3思维链(ChainofThought,COT)32 2.4基于人类反馈的强化学习(ReinforcementLearningwithHu- manFeedback,RLHF)33 第三章大模型训练与部署35 3.1大模型并行计算技术35 3.2并行计算框架36 3.3模型部署40 3.3.1预训练模型部署的困难40 3.3.2部署框架和部署工具41 3.3.3部署技术和优化方法43 3.4预训练模型的压缩45 3.4.1模型压缩方案概述45 3.4.2结构化模型压缩策略45 3.4.3非结构化模型压缩策略46 3.4.4模型压缩小结46 第四章ChatGPT相关数据集48 4.1预训练数据集48 4.1.1文本预训练数据集48 4.1.2代码预训练数据集50 4.2人工标注数据规范及相关数据集52 4.2.1指令微调工作流程及数据集构建方法53 4.2.2常见的指令微调数据集53 4.2.3构建指令微调数据集的关键问题54 第五章大模型评价方法59 5.1模型评价方式59 5.1.1人工评价59 5.1.2自动评价60 5.2模型评价指标62 5.2.1准确性62 5.2.2不确定性63 5.2.3攻击性63 5.2.4毒害性64 5.2.5公平性与偏见性65 5.2.6鲁棒性66 5.2.7高效性67 5.3模型评价方法小结68 第六章现有大模型及对话式通用人工智能系统69 6.1现有大模型对比69 6.2对话式通用人工智能系统调研72 6.2.1对话式通用人工智能系统72 6.2.2不同系统之间的比较75 第七章自然语言处理的未来发展方向80 7.1提高ChatGPT的能力80 7.2加深对模型的认识81 7.3实际应用82 7.4从语言到AGI的探索之路83 第一章ChatGPT的背景与意义 本章首先介绍自然语言处理、大规模预训练语言模型以及ChatGPT技术的发展历程,接着就ChatGPT的技术优点和不足进行分析,然后讨论ChatGPT可能的应用前景,最后展望ChatGPT普及后可能带来的风险与挑战。 1.1自然语言处理的发展历史 人类语言(又称自然语言)具有无处不在的歧义性、高度的抽象性、近乎无穷的语义组合性和持续的进化性,理解语言往往需要具有一定的知识和推理等认知能力,这些都为计算机处理自然语言带来了巨大的挑战,使其成为机器难以逾越的鸿沟。因此,自然语言处理被认为是目前制约人工智能取得更大突破和更广泛应用的瓶颈之一,又被誉为“人工智能皇冠上的明珠”。国务院2017年印发的《新一代人工智能发展规划》将知识计算与服务、跨媒体分析推理和自然语言处理作为新一代人工智能关键共性技术体系的重要组成部分。 自然语言处理自诞生起,经历了五次研究范式的转变(如图1.1所示):由最开始基于小规模专家知识的方法,逐步转向基于机器学习的方法。机器学习方法也由早期基于浅层机器学习的模型变为了基于深度学习的模型。为了解决深度学习模型需要大量标注数据的问题,2018年开始又全面转向基于大规模预训练语言模型的方法,其突出特点是充分利用大模型、大数据和大计算以求更好效果。 近期,ChatGPT表现出了非常惊艳的语言理解、生成、知识推理能力,它可以极好地理解用户意图,真正做到多轮沟通,并且回答内容完整、重点清晰、有概括、有逻辑、有条理。ChatGPT的成功表现,使人们看到了解决自然语言处理这一认知智能核心问题的一条可能的路径,并被认为向通用人工智能迈出了坚实的一步,将对搜索引擎构成巨大的挑战,甚至将取代很 小规模专家知识1950~1990 深度学习算法2010~2017 ChatGPT2023~? 浅层机器学习算法1990~2010 预训练语言模型2018~2023 图1.1:自然语言处理研究范式的发展历程 多人的工作,更将颠覆很多领域和行业。 那么,ChatGPT到底解决了什么本质科学问题,才能变得如此强大并受到广泛的关注呢?我们认为,ChatGPT是继数据库和搜索引擎之后的全新一代的“知识表示和调用方式”。 知识在计算机内的表示是人工智能的核心问题。如表1.1所示,早期,知识以结构化的方式存储在数据库中,人类需要掌握机器语言(如SQL),才能调用这些知识;后来,随着互联网的诞生,更多文本、图片、视频等非结构化知识存储在互联网中,人类通过关键词的方式调用搜索引擎获取知识;现在,知识以参数的形式存储在大模型中(从2018年开始),ChatGPT主要解决了用自然语言直接调用这些知识的问题,这也是人类获取知识最自然的方式。 表1.1:知识表示和调用方式的演进 知识表示方式 表示方式的精确度 知识调用方式 调用方式的自然度 研究领域代表应用代表公司 关系型数据库 高SQL低数据库DBMSOracle、Mi- crosoft 互联网中Keywords中信息检索搜索引擎Google、Mi- crosoft 大模型低自然语言高自然语言 处理 ChatGPTOpenAI、 Microsoft、Google 另外,从自然语言处理技术发展阶段的角度看(如图1.1),可以发现一个有趣的现象,即每一个技术阶段的发展时间,大概是上一个阶段的一半。小规模专家知识发展了40年,浅层机器学习是20年,之后深度学习大概 10年,预训练语言模型发展的时间是5年,那么以ChatGPT为代表的技 术能持续多久呢?如果大胆预测,可能是2到3年,也就是到2025年大概又要更新换代了。 1.2大规模预训练语言模型的技术发展历程 大规模预训练语言模型(简称大模型)作为ChatGPT的知识表示及存储基础,对系统效果表现至关重要,接下来对大模型的技术发展历程加以简要介绍。 2018年,OpenAI提出了第一代GPT(GenerativePretrainedTrans-former)模型[1],将自然语言处理带入“预训练”时代。然而,GPT模型并没有引起人们的关注,反倒是谷歌随即提出的BERT(BidirectionalEncoderRepresentationsfromTransformers)模型[2]产生了更大的轰动。不过,Ope-nAI继续沿着初代GPT的技术思路,陆续发布了GPT-2[3]和GPT模型GPT-3[4]。 (尤其是GPT-3模型,含有1,750亿超大规模参数,并且提出“提示语” Prompt)的概念,只要提供具体任务的提示语,即便不对模型进行调整也可完成该任务,如:输入“我太喜欢ChatGPT了,这句话的情感是”,那么GPT-3就能够直接输出结果“褒义”。如果在输入中再给一个或几个示例,那么任务完成的效果会更好,这也被称为语境学习(In-contextLearning)。更详细的技术细节推荐阅读相关的综述文章[5-8]。 不过,通过对GPT-3模型能力的仔细评估发现,大模型并不能真正克服深度学习模型鲁棒性差、可解释性弱、推理能力缺失的问题,在深层次语义理解和生成上与人类认知水平还相去甚远。直到ChatGPT的问世,才彻底改变了人们对于大模型的认知。 1.3ChatGPT技术发展历程 2022年11月30日,OpenAI推出全新的对话式通用人工智能工具——ChatGPT。据报道,在其推出短短几天内,注册用户超过100万,2个月活跃用户数已达1个亿,引爆全网热议,成为历史上增长最快的消费者应用程序,掀起了人工智能领域的技术巨浪。 ChatGPT之所以有这么多活跃用户,是因为它可以通过学习和理解人类语言,以对话的形式与人类进行交流,交互形式更为自然和精准,极大地改变了普通大众对于聊天机器人的认知,完成了从“人工智障”到“有趣” 的印象转变。除了聊天,ChatGPT还能够根据用户提出的要求,进行机器翻译、文案撰写、代码撰写等工作。ChatGPT拉响了大模型构建的红色警报,学界和企业界纷纷迅速跟进启动研制自己的大模型。 继OpenAI推出ChatGPT后,与之合作密切的微软迅速上线了基于ChatGPT类技术的NewBing,并计划将ChatGPT集成到Office办公套件中。谷歌也迅速行动推出了类似的Bard与之抗衡。除此之外,苹果、亚马逊、Meta(原Facebook)等企业也均表示要积极布局ChatGPT类技术。国内也有多家企业和机构明确表态正在进行类ChatGPT模型研发。百度表示正在基于文心大模型进行文心一言的开发,阿里巴巴表示其类ChatGPT产品正在研发之中,华为、腾讯表示其在大模型领域均已有相关的布局,网易表示其已经投入到类ChatGPT技术在教育场景的落地研发,京东表示将推出产业版ChatGPT,科大讯飞表示将在数月后进行产品级发布,国内高校复旦大学则推出了类ChatGPT的MOSS模型。 除了国内外学界和企业界在迅速跟进以外,我国国家层面也对Chat-GPT有所关注。2023年2月24日,科技部部长王志刚表示:“ChatGPT在自然语言理解、自然语言处理等方面有进步的地方,同时在算法、数据、算力上进行了有效结合。”科技部高新技术司司长陈家昌在回应ChatGPT相关提问时也表示,ChatGPT最近形成了一种现象级的应用,表现出很高的人机交互水平,表