事件:美国AI公司OpenAI推出基于大语言模型的对话模型ChatGPT,可提供高质量的回答,并能实现创作、编程等复杂功能,备受市场关注。不到两个月的时间,ChatGPT全球日活用户已突破千万。 ChatGPT是突破式的创新技术 ChatGPT是OpenAI公司推出的全新聊天机器人模型。通过引入人类反馈的强化学习,大幅提升了AI在人机对话时的准确度和可控性,具有强大的语言理解能力和语言表达能力。GPT模型仍在持续迭代,更先进大语言模型GPT-4有望在2023年推出,有望进一步推动AIGC产业发展。 ChatGPT应用及商业化落地加速 科技公司纷纷涌入AIGC赛道,优秀的AIGC大模型层出不穷,我们认为基于AI文本生成的模型ChatGPT有望率先应用落地。AIGC赛道相关公司受到资本青睐,AIGC头部初创公司OpenAI最新估值约为290亿美元。作为AIGC领域领先的模型ChatGPT在对话机器人、智能创作等领域应用广泛,亚马逊、微软、Jasper等公司已经开启商业化之路,商业化前景广阔。 建议关注 作为AIGC领域顶尖的模型,ChatGPT有望对现有生产力工具进行变革,引领赛道发展。我们看好AIGC领域前景,给予“强于大市”评级。根据AIGC领域产业链上下游,我们建议关注AIGC上游数据服务商海天瑞声 (688787.SH),中游技术领先的公司科大讯飞(002230.SZ)、拓尔思(300229.SZ)、百度(09888.HK),下游应用率先受益的公司昆仑万维(300418.SZ)、中文在线(300364.SZ)、视觉中国(000681.SZ)、掌阅科技(603533.SH)、阅文集团(0772.HK)、汉仪股份 (301270.SZ)。 1ChatGPT突破式创新技术 1.1基于大语言模型(LLM)的对话模型 ChatGPT是OpenAI公司推出的全新聊天机器人模型。可以实现像人一样的交流,甚至完成写邮件、文案创作等功能。ChatGPT还是基于transformer模型,通过引入人类反馈的强化学习(RLHF),大幅提高了AI在人机对话时的准确度和可控性。 与其他AI对话机器人相比,ChatGPT具有强大的语言理解能力和更丰富的语言表达能力,并且能够生成更自然、更流畅的文本,可以回答非常复杂的推理问题。ChatGPT核心能力如下: (1)问题的理解能力大幅提升,提升了模型和人类意图的一致性,具有记忆能力,可以实现连续多轮对话; (2)结果的准确性大幅提升,主要表现在回答的更加的全面,同时可以主动承认错误、发现无法回答的问题; (3)具备识别非法和偏见的机制,针对不合理提问提示并拒绝回答; (4)理解用户需求并创造内容,甚至可以协助进行代码编写。 图表1:ChatGPT写英文故事 图表2:ChatGPT撰写新闻演示 ChatGPT的出现将AI生成推到了前台,但ChatGPT只是AI生成模型的一种。 海外学者Roberto和Eduardo将AI生成模型分成9大类,内容形态包括图像、视频、音频、文本、3D模型等。 图表3:在生成效果上达到SOTA的AI生成模型总览 1.2GPT模型加速迭代 GPT功能越来越强大。从2018年6月GPT-1发布以来,模型参数量、预训练数据量越来越大,当前已经发展到GPT-3.5(ChatGPT原型)。性能更加强大的GPT-4也正在训练测试中,有望在2023年正式发布。 图表4:GPT特点及发展历程 无监督学习GPT-1。GPT-1诞生于2018年,采用了Transformer为核心结构,通过自左向右生成式的构建预训练任务,然后得到一个通用的预训练模型,这个模型和BERT一样都可用来做下游任务的微调。GPT-1在未经调试的任务上有一些效果,但其泛化能力远低于经过微调的有监督任务,且GPT-1使用的模型规模和数据量都比较小,这也就促使了GPT-2的诞生。 多任务学习GPT-2。GPT-2诞生于2019年,同样基于Transformer,相比于GPT-1,GPT-2采用了更多的网络参数和更大的数据集,最大模型共计48层,参数量达15亿。在性能上,在各种任务如阅读、对话、写小说等方面,效果都有所提高,也在当时达到了最佳的效果。 海量参数模型GPT-3。GPT-3采用1750亿个参数,规模是GPT-2的117倍,在不经过微调便可以识别数据中隐藏的含义。作为一个无监督模型,GPT-3几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。同时,GPT-3在两位数的加减运算任务的准确率几乎达到了100%,甚至还可以依据任务描述自动生成代码。以下显示了各类NLP模型的大小,其中GPT-3是Turing NLG的十倍,远远超过GPT-1和GPT-2。 图表5:预训练模型越来越“大” 虽然GPT-3已经非常强大,可以完成诸如将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本等复杂任务,但是GTP-3并不完美。最主要的问题之一就是聊天机器人和文本生成工具无法判断内容的质量和好坏,可以学习网络上所有文本,可能产生恶意的甚至攻击性的语言输出,影响落地应用。 基于人工标注数据和强化学习的GPT-3.5(ChatGPT原型)。ChatGPT在一个开源数据集上进行训练,不过采用了更大规模的训练参数,ChatGPT的训练参数是GPT-3的10倍以上。除了训练参数规模的变化,ChatGPT还采用了颠覆式的迭代方式:人工标注数据和强化学习,其本质是加上了在GPT-3上去掉的微调步骤,从而实现了在与人类互动时从反馈中强化学习。因此,ChatGPT不仅可以理解人类不同指令的含义,也会甄别高水准答案,还能处理多元化的主题任务。既可以回答用户后续问题,也可以质疑错误问题和拒绝不适当的请求。 ChatGPT仍存在很多局限性,需持续优化。ChatGPT输入不能有错,有时解释不够人性化,偶尔会给出看似正确但荒谬的答案等。虽然目前的ChatGPT无法给我们生产方式带来根本性的变革,但有可能改变人们与计算机的互动方式,推动从用户创作(UGC)到AI创作(AIGC)的转型。 据投资公司RadicalVentures预测,GPT-4或采用更大规模的数据集,可能在10万亿个token的数据集上进行训练,同时它的参数有望比Megatron-Turing的要少。GPT-4有可能是多模态的,支持文本、图片、视频等多种数据类型的输入。意味着GPT-4可以根据文本提示词(prompt)生成图像,或者是可以输入视频然后通过文本的形式回答问题。 2ChatGPT应用及商业化落地加速 2.1巨头涌入推动赛道发展 ChatGPT日活量突破千万。ChatGPT在2022年11月30日宣布公测之后,迅速走红全网,上线5天该模型的全球用户数量已突破百万。根据ARK风险投资公司统计数据,上线不到40天,ChatGPT的日活用户已突破千万。 图表6:ChatGPT全球日活用户突破千万 图表7:各大公司AI生成模型 图表8:主流AI文本-文本生成模型 聊天机器人Cluade有超越ChatGPT之势。Claude是由GPT-3核心成员出走成立的Anthropic公司开发,当前还处于内测阶段。不过根据Scale Sepllbook团队成员内部测试结果显示,相比ChatGPT,Claude在部分任务的表现更优,在测试的12项任务中有8项更强。据silk-news消息,Anthropic即将获得约3亿美元融资,成功融资后公司估值有望达到50亿美元。 图表9:Cluade与ChatGPT功能对比 国外头部机构引领技术和商业应用,国内整体进度落后2~3年。根据北京智源人工智能研究院介绍,当前国外研究机构在这个领域具有较大优势,领先国内2~3年,尤其是基础技术研究方面。如2022年清华大学联合智谱AI发布的中英双语模型GLM-130B,参数规模与OpenAI在2020年发布的GPT-3接近,拥有1300亿参数的开源开放中英双语双向稠密模型。过去3年来,OpenAI搭建大模型基础框架,通过GPT-1/GPT--2/GPT-3/ChatGPT引领行业发展。虽然国内最近两年也发布了很多相关大模型,但本质上还是在OpenAI的基础上实现的,原创性及创新性方面还需持续提升。 图表10: GLM-130B与GPT-3、OPT-175B对比 生成式AI赛道火热,资金扎堆涌入。根据PitchBook统计数据,2022年生成式AI赛道总共获得约14亿美元的融资,几乎达到了过去5年的总和。不仅包括OpenAI、Stability AI等明星公司,其他初创企业如Jasper、Regie.AI、Replika等均获得资本青睐,获得上亿美元融资。 图表11:2017-2022年生成式AI赛道融资金额(亿美元)及数量(笔) 2.2ChatGPT应用前景广阔 ChatGPT具有广泛的应用空间。ChatGPT主要应用包括如下场景: 对话机器人:由于ChatGPT强大的的语言理解能力,可广泛应用于多种对话问答场景,包括智能客服、虚拟人、机器人、游戏NPC等应用领域。 图表12:ChatGPT在游戏中的应用 智能创作:除了擅长对话问答之外,ChatGPT还具备强大的文本内容创作能力,可用于创意写作(诗歌、新闻、小说、学术等)、命题写作(风格模仿、文本续写、主题拟定等)、摘要生成(学术类、小说类、新闻类等)等。尽管ChatGPT只是一个对话式的语言模型,本身不能生成多模态内容,但可以把它输出的结果作为一个中间变量输入其他模型,从而进一步拓展其应用。例如,通过ChatGPT和Stable Diffusion的结合使用,能够生成艺术性极强的画作。 图表13:ChatGPT结合Stable Diffusion生成的图片 编程机器人:作为对话式大型语言模型,ChatGPT擅长回答用户提出的问题,其中最关键的是ChatGPT具备与编程相关的基础知识。可以将ChatGPT打造成编程问答机器人,根据用户的需求编程或debug,大幅提升编程效率、改善用户编程质量。 图表14:ChatGPT编程演示 ChatGPT助力用户提效,应用落地多面开花。ChatGPT凭借出色的表现受到广泛关注,众多公司都在商业化方面进行积极探索。Buzzfeed近期宣布计划依靠ChatGPT加强内容创作,其股价两天上涨超过300%。 图表15:ChatGPT应用探索 ChatGPT在学术、房产等领域的应用逐渐落地。除了各大科技公司,ChatGPT也开始应用于学术、房产等领域。根据在线课程供应商Study.com对100多名教育工作者发起了一项调查,82%的大学教授知道ChatGPT,而小学教育工作者的这一比例为55%,超过三分之一(34%)的教育工作者认为应该在学校和大学中禁止ChatGPT,而66%的教育工作者支持学生访问它。不过在学术领域,ChatGPT可能加剧学术不端现象,因此在相关领域开始被抵制。知名期刊《Science》、《Springer-Nature》声称不能将ChatGPT列为作者,一些美国大学则宣布增加手写论文和口头考试的比重。美国房产中介也开始使用ChatGPT,用于房源信息撰写、房贷计算等。 图表16:ChatGPT撰写房源信息 ChatGPT商业化加速。随着ChatGPT的应用落地,商业化探索也成为关注焦点,云服务、内容营销、咨询服务等均有望实现商业化落地。OpenAI很注重商业应用,GPT-3已经拥有大量客户。随着微软、谷歌等巨头加码,ChatGPT应用场景有望进一步拓宽,相关领域商业化落地有望加速。 图表17:GPT-3的主要企业客户 图表18:ChatGPT潜在商业模式 3建议关注 AIGC赛道未来可期。作为AIGC最顶尖的模型之一,ChatGPT有望对现有生产力工具进行变革,大幅提升内容生产效率。我们认为AIGC赛道有望迎来投资热潮,建议关注