您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[招银国际]:中国互联网行业:ChatGPT&AIGC在中国市场的发展前景 - 发现报告
当前位置:首页/其他报告/报告详情/

中国互联网行业:ChatGPT&AIGC在中国市场的发展前景

2023-02-09贺赛一、陶冶、陆文韬招银国际巡***
中国互联网行业:ChatGPT&AIGC在中国市场的发展前景

2023年2月9日 招银国际环球市场|睿智投资|行业研究 优于大市 (维持) 中国互联网行业 ChatGPT&AIGC在中国市场的发展前景 中国消费互联网高度普及率及不断提升的企业数字化程度将为AIGC产业提供庞大发展潜力,中国市场的可变现的商用场景丰富且规模可观。龙头科技企业例如阿里巴巴、百度和腾讯在几年前便开始部署AI及类ChatGPT技术发展,在不久的将来会优先从企业端变现开始实现技术商业化。由于中国有丰富的电商、教育、线上客服、金融、广告、软件开发、提升工作效率等商用场景,提升工作效率和竞争力的诉求会加速该技术商业化渗透,我们认为长期来看ChatGPT技术将与AI及云技术结合,MaaS或为长期商业化方向之一。其他应用方向还包括机器人、智能驾驶、服务系统、医疗医护服务、高端制造、成为内容工业化的核心引擎等。 ChatGPT引领AIGC产业发展。ChatGPT是OpenAI公司推出的文本生成类预训练模型,相比于以往AI对话模型,ChatGPT在跟进问题、上下文语言理解和拒绝不适当请求等多方面展现出显著优势,在上线短时间内吸引广泛关 注。ChatGPT及其他AIGC大模型与应用在2022年迎来加速发展,主因在应用落地及技术迭代方面的重要进展。应用落地方面,ChatGPT访问量在23年1月已突破6亿人次,微软2023年1月宣布进一步拓展与OpenAI合作并将其AI模型集成至其主要产品线。在技术迭代方面,ChatGPT及AIGC产业链的发展需要更好的大模型(Transformer/BERT/Ne)及更多优质模型的开源)进行训练、更多的数据(GPT-3等文本大模型已突破千亿参数量)和更低的算力成本。所以在中国市场龙头科技公司拥有更强的技术迭代竞争实力,尤其是在芯片受限的情况下算力的提升需要比较高的投入。 AIGC产业化方向众多、前景广阔。我们认为AIGC在需要高效处理大量客户 需求、创意性内容行业以及标准化生产行业均有较大的应用空间,在诸如归纳性文字工作、代码开发相关工作、图象生成领域及智能客服等领域均有广阔的产业化前景。我们认为中国领先的人工智能云厂商都有能力(数据、算力、模型)来提供类ChatGPT的服务,但因为各公司业务各有侧重,各厂商在AIGC领域的应用或形成差异化。如百度已宣布其类ChatGPT产品“文心一言”即将于3月推出;腾讯的混元大模型是集计算机视觉,自然语言理解,多模态理解能力于一体。阿里巴巴“鹿班”可短时间内完成大量banner图、海报图和会场图的设计,有效提升工作效率。此外,模型训练成本快速下降也有望为AIGC大规模商用提供支撑。目前我国相较国外在AI算法和技术层面存在差距,但在数据量及应用场景端相对占优,利用好场景及数据端的优势有望助力缩小差距。 AIGC产业链已见雏形。AIGC产业链可划分为基础设施层、中间层及应用 层。1)基础设施层厂商主要为中间层及应用层厂商提供预训练模型等基础设施,掌握AIGC核心模型和算法能力,具备较高技术门槛,主要通过开放API和提供MaaS解决方案进行变现,典型企业包括OpenAI、谷歌、DeepMind、百度和科大讯飞等;2)中间层厂商基于预训练大模型生成场景化小模型,帮助不同垂直领域实现AIGC的快速部署;3)应用层厂商主要面向C端提供AIGC相关服务,典型企业包括微软、百度、阿里巴巴和腾讯等。 中国互联网行业 贺赛一,CFA (852)39161739 hesaiyi@cmbi.com.hk 陶冶 franktao@cmbi.com.hk 陆文韬 luwentao@cmbi.com.hk 相关报告 1.Baidu(BIDUUS)-Corebusinessrecoveryontrackwithmoretoexpectonnewinitiatives–8Feb2023 2.BiliBili(BILIUS)-Eyesonmonetizationpotentialandmarginimprovementtrajectory–7Feb2023 3.Baidu(BIDUUS)-Factoringintonear-termpandemicimpactbutrecoveryisinsight–20Jan2023 4.Alibaba(BABAUS)–Lookingbeyondshort-termpandemicimpact–12Jan2023 5.NetEase–Preparingfornextstrongproductcycle–18Nov2022 6.Tencent(700HK)–Returntoearningsgrowthtrack–17Nov2022 敬请参阅尾页之免责声明1 请到彭博(搜索代码:RESPCMBR<GO>)或http://www.cmbi.com.hk下载更多招银国际环球市场研究报告 ChatGPT:引领AIGC产业发展 ChatGPT(ChatGenerativePre-TrainedTransformer)是AI研究公司OpenAI推出的文本生成类预训练模型,采用Web浏览器上的对话形式交互,不仅能满足与人类进行对话的基本功能,同时能够回答跟进问题、承认错误、质疑不正确的前提和拒绝不适当的请求。ChatGPT还可以驾驭各种风格和文体,具备代码编辑能力、基础脑力工作处理能力等一系列常见文字输出任务。 相比于传统AI对话模型,ChatGPT具备多项优势功能,从而实现应用价值和使用体验的显著提升:1)能够认知自身不足并进一步提出跟进问题以更好解答用户问题;2)能够理解上下文,实现连续对话,提高用户交互体验;3)能够质疑用户提出的不合理问题与前提假设;4)能够拒绝用户提出的不合理/不合法请求与问题。 图1:ChatGPT:功能特点 资料来源:OpenAI,招银国际环球市场 相较于OpenAI此前研发的GPT1-3,ChatGPT核心技术优化在于引入RLHF (ReinforcementLearningfromHumanFeedback,人类反馈强化学习)的训练方式,从而在训练中增强了人类对模型输出结果的调节,促使模型输出结果更具备理解性。RLHF训练框架主要分为三步:1)在初步模型中AI训练师同时作为用户和AI角色,协助AI创作期望的回答,通过监督学习的方式优化模型的输出结果;2)训练师根据模型对同一个提问所做出的不同输出结果进行排序,并通过该数据训练出奖励模型;3)根据奖励模型对模型输出的结果进行打分,运用强化学习算法PPO不断迭代和优化模型输出。 图2:ChatGPT:RHLF训练框架 资料来源:OpenAI,招银国际环球市场 ChatGPT等文本生成类预训练模型是AIGC产业(AI-GeneratedContent,人工智能生产内容)最早商业化落地的核心赛道之一。除了在文本领域的应用以外,AIGC在代码、图像、视频、游戏等多领域均有望落地应用,有望进一步升级内容创作方式,提升内容创作效率和降低内容创作成本,长期来看内容创作质量有望高于相关领域专业人员。在中国消费互联网市场,无论是社交还是电商领域,视频化的趋势和内容比例越来越高。所以消费互联网产业将是AIGC在中国市场落地的重要场景之一。 图3:AIGC相关应用领域 资料来源:红杉资本,招银国际环球市场 ChatGPT&AIGC:2023年产业迎来加速发展 ChatGPT等AIGC应用在2022年的迅速崛起受到广泛关注,主因在应用落地以及技术迭代方面所取得的重要进展。在应用落地方面,AI研究公司OpenAI于2022年11月推出AI聊天机器人ChatGPT引发全球广泛关注,在两周内吸引超过百万用户。根据similarweb数 据,ChatGPT网站访问量在2023年1月已达到6.2亿人次。此外,微软于2023年1月23日宣布进一步拓展与OpenAI合作并投资数十亿美元以加速AI技术研发,未来微软将在其消费者和企业产品线应用OpenAI所研发的各类AI模型;2023年2月8日,微软宣布将GPT-4模型集合至Bing及Edge浏览器并开放小范围测试,预计在未来几周进行更大范围的发布。 图4:ChatGPT:网页应用月访问人次自上线后激增图5:Bing:GPT-4功能集合演示 (mn)700 600 500 400 300 200 100 0 Nov-22 Dec-22 Jan-23 资料来源:similarweb,招银国际环球市场 资料来源:微软,招银国际环球市场 在技术迭代方面,ChatGPT及AIGC整体产业链的发展得益于更好的模型、更多的数据、更低成本的计算:1)模型方面:DiffusionModel(2015年)、TransformerModel(2017 年)、BERT(2018年)、NeRFModel(2020年)等模型的出现使得AI进入大量参数的预训练模型时代;而且自2020年以来,许多预训练模型逐渐开源,包括GPT-j、GPT-NeoX、OPT、Bloom等,更多开发者可以参与到预训练模型的使用、优化与研发当中;2)数据方面,自2015年到2020年期间,用于训练大模型的计算量增加6个数量级,OpenAI旗下GPT-3参数量达到1,750亿,显著高于GPT-1的1.17亿参数量。部分预训练模型在手写、语音和图像识别、阅读理解和语言理解等方面超过人类基准水平。3)更低成本的计算:在模型不断优化、GPU性能提升和服务器成本优化等因素支撑下,整体计算成本有所降低。 图6:自2020年以来多个大规模预训练模型开源 资料来源:Stateof.ai,招银国际环球市场 图7:ChatGPT:GPT1/2/3参数量对比 (亿) 6,000 5,000 4,000 3,000 2,000 1,000 0 GooglePaLMGoogleBERTDeepMind Gopher OpenAIGPT3 MetaOPT 图8:文本生成预训练模型:参数量对比 (亿) 2,000 1,800 1,600 1,400 1,200 1,000 800 600 400 200 0 1750 1.2 Nov-22 15 Dec-22 Jan-23 资料来源:OpenAI,招银国际环球市场资料来源:腾讯研究院,招银国际环球市场 AIGC产业链可划分为基础设施层、中间层、应用层。1)基础设施层:该层级厂商主要为中间层及应用层厂商提供预训练模型等基础设施,掌握AIGC的核心模型和算法能力,具备较高的技术门槛,典型代表企业包括OpenAI、Stability.ai、谷歌、DeepMind、百度和科大讯飞等;2)中间层:该层级厂商基于预训练的大模型生成场景化定制化的小模型,帮助不同行业和垂直领域实现AIGC的快速部署;3)应用层:面向C端提供AIGC相关服务,典型企业包括微软、Meta、百度、腾讯,阿里巴巴等。 图9:AIGC:产业链结构 资料来源:腾讯研究院,招银国际环球市场 AIGC:商业化前景思考 AIGC产业化方向众多、前景广阔,MaaS或为长期商业化方向之一 我们认为中国领先的人工智能云厂商都有能力(数据、算力、模型)来提供类ChatGPT的服务,但因为各公司业务各有侧重,各厂商在AIGC领域的应用或形成差异化。但长期视角下,MaaS(Model-as-a-service)可能是潜在的长期商业化方向之一,模型训练、维护和部署有望逐步转移至云端,这样的方式有助于帮助客户降低对模型开发和维护的依赖,从而更专注在主业的投入、提升运营效率。而MaaS业务或将为云业务营收带来较为显著的增量,我们认为各大云厂商会持续加强对AIGC及类ChatGPT领域的投入,以支撑云业务的长期发展。但短期而言,因ChatGPT仍存在数据时效性低、可靠性不足、及推理短成本较大的问题,大规模的商业化或仍需要较长时间。 我们认为AIGC在需要高效处理大量客服需求、创意性内容行业以及标准化生产行业均有较大的应用空间,在诸如归纳性文字工作、代码开发相关工作、图象生成领域及智能客