ChatGPT:迈向AGI的第一步 ——GPT系列专题之一 分析师:陈旻SAC编号:S0870522020001 证券研究报告 2023年4月15日 行业:传媒增持(维持) 我们AIGC系列专题《“大模型+小样本”快速适配下游场景,“AI+传媒”的效力取决于适配与迭代》将“AI+传媒”的研究框架定义为“通用大模型”+“行业小样本”的技术架构。“AI+传媒”在应用层表现效力优劣的关键取决于通用大模型对垂直应用的适配程度及迭代速度,更进一步理解: 1、“行业小样本”的数据集来自小模型或应用及内容:AI产业链包括上层大模型、中层小模型、下层应用及内容,包括应用及内容直接接入大模型或通过小模型接入大模型两种方式,即“大模型+应用及内容”或“大模型+小模型+应用或内容”,其中具备特定功能的AIGC软件产品我们理解为“小模型”+“应用”的技术范式,本身具备较高质量的AI能力,若接入匹配的多模态大模型,有望实现能力上的质变突破。 2、“行业小样本”的结合方式包括“能力调用”及“能力训练”两层: (1)“能力调用”是指下游垂类场景直接调用通用大模型的通用能力,并基于垂类场景内产生的特性化数据不断提升调用能力在垂类场景内的适配程度。我们认为现阶段下游应用及内容主要采取此类方式接入大模型能力,此类方式可高效快速调用大模型先进能力,在时间上及成本上具备优势。 (2)“能力训练”是指下游垂类场景将通用大模型针对特性化数据集进行再训练,从而形成垂类场景专属大模型。例如彭博社利用自身丰富的金融数据源,基于开源的GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。我们认为未来拥有丰富特性化数据集的下游垂类场景将主要采取此类方式,有助于构筑更强的能力壁垒。 围绕我们对“AI+传媒”的研究框架体系,我们后续分别针对“技术层”及“产品/应用层”梳理AIGC研究版图,本篇属于AIGC系列专题中“GPT系列专题之一”,重点梳理ChatGPT基础认知。 风险提示:宏观经济风险,地缘政治风险;技术发展不及预期;AIGC行业发展不及预期。 本篇报告主要介绍了以下方面:1)ChatGPT源于OpenAI,以确保AGI造福人类为使命,深耕AIGC领域。2)ChatGPT搭载插件系统,实现全方面、多领域的商业化路径。 OPENAI是致力于人工智能和其他机器学习技术研究的明星产品。在微软“技术”+“应用”的加持下,为加速人工智能研究提供坚实可靠的服务保障,OPENAI深耕AIGC领域,是迈向AGI的第一步。 ChatGPT是能回答、判断并拒绝用户的指令的对话机器人。ChatGPT是在GPT-3.5微调、微软AzureAI超级计算基础设施上训练得到的,是迭代部署更安全、更有用的AI系统,随着ChatGPT的不断迭代,可实现从“听觉”到“视觉”再到“触觉”的进阶。 ChatGPT搭载插件系统,共筑AI的应用商店。为了能够更加灵活的扩展ChatGPT的现有功能,OpenAI上线ChatGPT插件系统,ChatGPT可根据用户需求调用第三方插件,应用插件既让ChatGPT功能有数量级的提升,又避免了GPT-4的信息迭代缺陷。 目录 SECTION Content 一、ChatGPT:深耕AIGC领域,构建更安全、更有用的AI系统二、ChatGPT:共筑AI应用商店,全方位覆盖用户需求 三、投资建议四、风险提示 以确保AGI造福人类为使命,深耕AIGC领域。OpenAI成立于美国旧金山,致力于人工智能和其他机器学习技术研究,主营业务包括GPT、DALL·E、Whisper等API接口服务和对话机器人ChatGPT。 背靠微软,技术+应用层叠加下未来可期。微软为OpenAI注入充裕资金,助力对计算技术和优秀人才的投资;Azure是 OpenAI的云服务提供商,为加速其人工智能研究提供坚实可靠的服务保障。 微软宣布向ChatGPT开发者OpenAI追加数十亿美元投资 图1OpenAI股权结构 资料来源:OpenAI官网,微软官网,FourWeekMBA,上海证券研究所 OpenAI计划逐步过渡至AGI世界。通用人工智能(ArtificialGeneralIntelligence,AGI),是具有一般人类智慧的机器智能 ,一般需要具备推理决策能力、知识表示能力、规划能力、学习能力、使用自然语言进行交流沟通的能力,以及将上述能力整合起来实现既定目标的能力。基于此,OpenAI计划:(1)持续创造并部署更多更强大的系统;(2)创造更一致、更可控的模型;(3)与全球探讨“如何管理这些系统、如何公平分配产生的利益、如何公平分享使用权”三个关键问题。 OpenAI成立八年,有序推进产品布局。我们认为,以Gym系列为代表的机器学习技术和AI产品技术内核NLP模型是重心 ,后向图片生成、音乐生成、语音识别、对话机器人等拓展,多维度实现AI技术落地。 AGI Gym系列 OpenAIGymBeta、Roboschool、GymRetro、SafetyGym 图片生成 音乐生成 Glow、ImageGPT(补全)、CLIP(匹配)、DALL·E、GLIDE、DALL·E2 MuseNet、Jukebox 图2OpenAI过渡至AGI世界的计划 OpenAI NLP模型 GPT-1、GPT-2、GPT-3、OpenAICodex、WebGPT、InstructGPT、GPT-4 对话机器人 ChatGPT、ChatGPTPlus、ChatGPTplugins 语音识别 Whisper 资料来源:OpenAI官网,上海证券研究所 ChatGPT是迭代部署更安全、有用的AI系统的最新一步。ChatGPT是一个对话机器人,能回答、判断并拒绝用户的指令,是由GPT-3.5微调、并在微软AzureAI超级计算基础设施上训练得到的。它使用简便、运行速度快、成本低,能根据用户需求提供全方位服务。但它存在一些局限性,它的回答可能不正确、可能随着指令的变动而变动。根据OpenAI收到的用户反馈,ChatGPT已被用于一系列专业场景中,包括起草和编辑文案、头脑风暴、编程指导和了解新话题。ChatGPT是免费的,其试点订阅版本ChatGPTPlus收费20美元/月。 智能搜索 文档编辑 图片输入 ... 图3ChatGPT 资料来源:OpenAI官网,上海证券研究所 图4ChatGPT功能 聊天对话 ChatGPT 智能写作 调试代码 数据分析 资料来源:OpenAI官网,上海证券研究所 ChatGPT=GPT大模型+RLHF=GPT-3.5+(SFT+RM+PPO) ChatGPT的训练过程分为三步:(1)收集演示数据,使用有监督学习微调GPT模型,训练得到有监督策略。(2)收集对比数据,并训练奖励模型。(3)基于奖励模型,使用PPO强化学习算法优化策略。 图5ChatGPT的训练过程 取样指令:“向一个6岁的孩子解释什么是强化学习。” 演示所需的输出内容:“通过奖励和惩罚来教育...” 用这一数据有监督微调GPT-3.5。 一个指令和多个模型输出示例。指令:“向一个6岁的孩子解释什么是强化学习。” 示例A:“在强化学习中,代理人是…”; 示例B:“解释奖励…”; 示例C:“在机器学习中…”;示例D:“通过奖励和惩罚来教育...”。 对输出示例从最优到最次进行排序:D>C>B>A 用这一数据训练奖励模型。 取样新的指令:“写一个关于水獭的故事。” 从有监督策略中初始化PPO模型。 该策略生成输出:“从前…” 奖励模型计算该输出的奖励。 该奖励用于更新策略。 资料来源:OpenAI官网,上海证券研究所 ChatGPT、ChatGPTPlus、ChatGPTplugins,实现从“听觉”到“视觉”再到“触觉”的进阶。 1)ChatGPT(GPT-3.5)“聆听”用户指令。GPT-3.5是混合使用文本和代码进行训练的一系列模型,其中gpt-3.5-turbo是性能最佳的GPT-3.5模型,它针对聊天进行了优化,但传统的补全任务也运行良好,且成本只是text-davinci-003的1/10。 2)ChatGPTPlus(GPT-4)“观看”上传图像。GPT-4是一个大型的多模态模型,接受图像和文本输入,生成自然语言、代码等文本输出,在各种专业和学术基准上表现出人类水平的性能。 3)ChatGPTplugins与世界交互,“触达”万物。Plugins是专为语言模型设计的工具,帮助ChatGPT访问最新的信息、运行计算、使用第三方服务。我们认为,随着Plugins权限逐渐开放,未来人类与AI互动的范式将得以塑造。 图6ChatGPT、ChatGPTPlus、ChatGPTplugins的对比 资料来源:OpenAI官网,上海证券研究所 图7ChatGPT不断增强走向AGI 资料来源:OpenAI官网,上海证券研究所 ChatGPT搭载插件系统,共筑AI的应用商店 自ChatGPT诞生以来,技术圈内有不少开发者基于它的功能实现了不少优秀的产品。为了能够更加灵活的扩展ChatGPT的现有功能,OpenAI正式上线了以安全为核心的ChatGPT插件系统,在保障数据安全性的前提下,让ChatGPT功能再度提升一整个数量级。 3月23日,ChatGPT重磅更新,初步支持插件Plugins。Plugins是专门为语言模型设计的工具,帮助ChatGPT访问最新信息、运行计算或使用第三方服务,首批插件包括3个自研插件与11个第三方插件。 ChatGPT装载Browsing插件,确保信息获取及时有效。 利用微软NewBing的API,通过访问互联网找到答案并给出网站链接(安全前提下)。通过Browsing,ChatGPT不仅能检索最新的网络信息,还能够查询即时航班、酒店信息,甚至能通过获取购物平台的最新价格进行比价与下单。 现在向ChatGPT询问奥斯卡获奖信息,能够准确回复2023年的最新数据,并会在回应中展示曾经找过的网站链接。 我们认为,将ChatGPT接入NewBing,大幅提升了ChatGPT的准确性和时效性,从而提高了ChatGPT系统整体可用性。 图8询问ChatGPT2023年奥斯卡获奖情况图9向ChatGPT询问菜谱可以一键购物 资料来源:OpenAI官网,上海证券研究所资料来源:澎湃新闻,上海证券研究所 ChatGPT装配代码解释器,降低编程技术门槛 解决定量和定性的数学问题——输入数学问题,能通过Python输出正确的计算结果并显示代码过程;数据分析和可视化— —输入函数后,可以清晰显出图像、解释结果并给出对应点的情况;快速转换文件格式——输入图片后,可以编辑图片。 我们认为,以代码解释器为基础的plugins,极大的降低了编程门槛。用户只需使用自然语言提出需求,便可以生成AI内容 ,这不仅将对AIGC发展产生深远变革,也完善了ChatGPT饱受诟病的数学分析和计算功能。 图10解决定量与定性问题图11进行数据可视化与数据分析 资料来源:OpenAI官网,上海证券研究所资料来源:新智元,上海证券研究所 图12编辑图片 资料来源:金融科技时代,上海证券研究所 ChatGPT搭配RetrievalPlugin,扩大信息库及应用领域 用户可以通过提出问题或用自然语言表达需求来从他们私有的数据源中获取相关度最高的文档片段。同时它能够为 ChatGPT提供记忆功能,因此ChatGPT可以将对话中的片段保存到矢量数据库中以供以后参考(仅当用户需要保存时)。 我们认为,Retrieval将使ChatGPT成为用户的“第二大脑”,为用户提供定制化、私人化的助理服务。同时通过开源, ChatGPT的信息功能也会越来越强