旧金山人工智能研究公司OpenAI的智能聊天机器人系统ChatGPT在2022年12月一经推出后反响强烈。作为AIGC其中的重点细分领域,ChatGPT的成功体现了AIGC产业的快速进展,对计算机、传媒互联网及通信行业均有所催化,建议关注相关领域投资机会。 计算机:ChatGPT通过升级训练方式攻关了原有模型局限,带来出色的用户体验及较高的实用价值。科技巨头的加入、商业形式的丰富或加速ChatGPT乃至AIGC行业的商业化进程。AIGC行业在AI文本生成、音频生成及图片生成等细分领域具备广阔的应用空间,基于技术上的刚性需求,下游的应用落地刺激上游算法层及算力层的升级迭代。 传媒:AIGC有助于企业级创作降本增效,进一步降低边际成本。其中自动采编、NFT作品自动生成、游戏建模及虚拟人辅助创造等领域有望最先受到AIGC赋能,未来相关领域有望从AI替代劳动力的浪潮中进一步受益。 通信:AIGC对数字基础设施的需求较高,需要一个稳定、高效、安全的数字基础设施来支持其完成生成、存储和传输内容的整个过程。从内容生成和存储来看,AIGC的算法需要大量的数据来进行不断训练的过程,才能更好得学习人类的语言和行为模式,最终生成高质量的内容。 随着后续模型的优化和升级,预计数据量和算力需求都会继续成几何倍数增长。从数据传输来看,随着AIGC的突破和推广,用户和流量也得到倍数增长。此外,随着AIGC技术的升级,流量需求也会大幅提升。 我们认为,随着AIGC和数字基础设施相辅相成、相互促进。持续看好数字基础设施建设带动相关产业链需求稳步向上。 相关标的: 1)通信:运营商/国资云:中国移动、中国电信、中国联通、深桑达A;主设备商&服务器:中兴通讯、浪潮信息、紫光股份、星网锐捷;光模块:天孚通信、中际旭创、华工科技、新易盛;IDC:英维克、佳力图、申菱环境、润建股份;云计算&大数据:优刻得等;PCB/载板:沪电股份、深南电路、兴森科技、世运电路、崇达技术;AI:海康威视、大华股份、科大讯飞。 2)计算机:科大讯飞、云从科技、海天瑞声、拓尔思、汉王科技、万兴科技。 3)传媒互联网:百度集团、天娱数科、腾讯、中文在线、蓝色光标、创梦天地等。 风险提示:宏观经济下行;科技转化不及预期;AI商业化进程不及预期;行业竞争加剧的风险。 1.AIGC:数字推动核心劳动力迭代 1.1AIGC定义 AIGC(AI-Generated Content)指人工智能生成内容。传统的UGC/PGC/OGC三者之间主要区别在于作者的利益关系、专业程度等,本质都是由人来产出内容,而AIGC则是由AI来产出内容,包括图片、文章、交谈、评论、视频、音频等等。 图1:内容创作的四种模式 相较人工创作,AI创作最核心的优势在于高效低成本,AI算法利用互联网上的海量数据结合内容生产引擎快速产出内容质量显著提升,在2022年美国科罗拉多州博览会艺术比赛中,来自AI绘画工具Midjourney生成的作品获得了第一名,由此见得未来人类某些创造性工作可能会被AI取代,或进一步进入人机协同工作模式,而在海量资源和产出的内容生产模式下,AIGC技术的高产出能力有望进一步降低成本。 Gartner将生成性AI列为2022年5大影响力技术之一;MIT科技评论也将AI合成数据列为2022十大突破性技术之一。 1.2AIGC相关算法技术 图2:AIGC相关算法模型 AIGC的爆发得益于算法技术进展,其中包含对抗网络、流生成模型、扩散模型等等深度学习算法。各类算法功能分别覆盖了数各部分数据权重的选择、从噪声中构建数据样本、不同语言文本翻译、图像文字特征值匹配等等。 在多模态的技术支持下,目前预训练模型已经从单一的NLP或CV模型发展到了多种语言文字、图像、音视频的多模态模型。2021年Open AI团队发布了AI回话产品DALL E,通过使用者的语言描述去自动生成对应图像,便是CLIP让图片和对话找到交接点。 总的来看,AIGC在2022年的爆发得益于模型创新推动的生成算法和预训练模型创新,进而形成了参数丰富、训练量大、生成内容稳定高质量的流水线。 1.3AIGC产业结构 AIGC的产业架构分为基础层、中间层和应用层。 根据腾讯研究院1月31号发布的《AIGC发展趋势报告2023:迎接人工智能的下一个时代》,整个AI生成内容链条第一层是基础层,也是由预训练模型为基础搭建的AIGC技术基础设施层。由于预训练模型的高成本和技术投入,因此有较高的进入门槛。如GPT-3的成本超过1000万美元,因此可以进入预训练模型的主要机构为头部企业和科研机构,如Open AI、Stability ai等等。 图3:AIGC产业结构 第二层位中间层,及垂直化、场景化、个性化的模型和应用工具。预训练的大模型是基础设施,在此基础上可以快速抽取生成场景化、定制化、个性化的小模型,实现在不同领域的应用部署。 第三层为应用层,基本面像C端的文字、图片、饮食平内容的生成服务。侧重于用户的使用体验和需求,使得用户可以用消费级的显卡算力挖掘丰富的内容,包括Chat-GPT、群聊机器人等等方式 随着数字技术与实体经济融合程度的不断加深,以及互联网平台数字化场景向元宇宙转型,人类对数字内容总量的丰富程度整体需求不断提高。AIGC作为当前新型的内容生产方式,已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得了一定程度的创新,市场潜力逐渐显现。 2.ChatGPT爆火开启AIGC风口 训练方式升级攻关原有局限,产品迭代逐步实现人机协同:作为全新一代聊天机器人模型,ChatGPT使用的模型与2年前发布的GPT3底层数据和参数规模一致。相较于在进一步扩大原有的数据规模,ChatGPT采取了升级训练方式的办法,利用人类反馈的知识,对模型进行强化修改,同时对原有数据略作改良,优化语言模型,对AI的回答方式及答案存在的局限性进行更新,实现了计算机“数据”与人类“知识“的突破性结合。 ChatGPT可通过自然对话方式交互,也可完成生成文本、自动问答等复杂语言任务,在各类AI文字处理的任务中表现出色,体现出较高的实用价值。放眼未来,ChatGPT产品有望通过不断迭代逐步实现人机协同,核心技术的投入、算力、算法的通用化、更专业的人为标注(行业know-how)可以使得新场景的应用更加快速,能够加速各个行业的智能化升级,边际效用实现增长。 科技巨头加入,商业化进程加速:短短两个月时间,ChatGPT月活跃度用户已超过一亿,微软、谷歌等科技巨头已相继宣布将ChatGPT进行应用或持续研发更新,其中微软向OpenAI追加数十亿美元投资,Google宣布投资ChatGPT竞争对手Anthropic 4亿美元。 与此同时,OpenAI于2023年2月1日发布ChatGPT Plus订阅计划,每月收费20美元,通过订阅,用户可实现多项高级功能,包括:(1)高峰时刻使用ChatGPT的常规访问的权限;(2)更快的服务响应时间与速度;(3)优先使用新功能和改进。ChatGPT Plus目前供美国用户使用,未来将支持更大范围的用户使用。基于其在AI文字交互中表现出的高实用价值,ChatGPT通过一系列的商业应用带来了大量现有及潜在的商业机会。 AIGC风口开启,刺激算力算法升级:ChatGPT的爆火再次引发人们对AIGC的关注。 除了ChatGPT,资本市场持续青睐AIGC产业。根据PitchBook数据,GPT-3发布的两年多以来,VC对AIGC的投资增长了400%以上。2022年达到21亿美元。计算机对后续应用端的支持取决于计算机的算力及算法,进而影响到前端生成的产品质量,为一系列垂直赛道的产品应用落地打下基础。AI应用对算法和算力要求较高,AI文本生成工具的成功加快了整体AIGC产业商业化落地进程,刺激上游计算机算法端乃至算力端的技术迭代升级以加强对下游应用端的支持。 3.AIGC快速推广,数字新基建迎发展良机 AIGC对数字基础设施的需求较高,需要一个稳定、高效、安全的数字基础设施来支持其完成生成、存储和传输内容的整个过程。从内容生成和存储来看,AIGC的算法需要大量的数据来进行不断训练的过程,才能更好得学习人类的语言和行为模式,最终生成高质量的内容。以最近爆火的ChatGPT为例,OpenAI在训练ChatGPT时,对模型进行了多次升级,目前的基于GPT-3.5预训练大模型创建,被视为是GPT-3的微调版本,从之前的版本来看,GPT、GPT-2和GPT-3在算法模型上并没有太大改变,但模型所需的参数量从1.7亿增加到了15亿1750亿,预训练数据量从5GB增加到45TB,模型也在大量数据的训练下有较大进步,比如减少了不真实回答、避免有害回答、挑战用户问题前提等等。随着后续模型的优化和升级,预计数据量和算力需求都会继续成几何倍数增长。 从数据传输来看,随着AIGC的突破和推广,用户和流量也得到倍数增长。2022年11月30日,OpenAI发布ChatGPT,不到一周的时间就聚集了超过100万用户,推出后仅2个月,月活用户数预计已达1亿,成为历史上增长最快的消费者应用。对比之下,达到1亿月活跃用户数,TikTok用时约9个月,Instagram则用了将近2年半的时间。随着AIGC技术的突破和推广,流量需求也会大幅提升,一方面,目前AIGC仍然以文字为主,之后随着图片、音频、视频等形式的加入,自然会带来数据量的翻倍增长;另一方面,对于实时性和高效率的要求,需要相应的传输速率保证,来满足大量内容的实时传输。 图4:ChatGPT月活用户数2个月突破1亿 我们认为,随着AIGC和数字基础设施相辅相成、相互促进。一方面,随着AIGC的快速发展和推广,大量数据和流量的产生,促使数字基础设施面临升级发展需求;另一方面,随着数字基础设施的完善、数字经济应用的落地和发展,数据等计算资源得以不断增加,这为AIGC的改进提供了训练基础,它的算法得以更加复杂话、精细化,模型也能够更好地优化,从而生成的内容也更符合人类的语言和行为。 持续看好数字基础设施建设带动相关产业链需求稳步向上:数字经济的布局和建设,能够带动产业链上下游环节需求稳步向上;首先从基础设施来讲,加快数字基础设施建设,与做强做优做大数字经济相匹配,通信硬件设施将是数字经济发展最先受益的环节,包括运营商为主的技术设施底座、承载算力的IDC、服务器、“东数西算”带来的骨干网建设需求等各个产业链环节;其次从云计算、大数据、人工智能、边缘计算等技术角度来讲,未来应用的高算力运算需求,对基础设施提出更高要求的基础上也进一步带动对相关技术及算法的需求;最后从应用端角度来讲,以工业互联网、车联网、云游戏以及AR/VR等应用渐行渐近,应用场景的不断落地,进一步倒逼基础设施建设的不断加快升级,同时,随着应用场景的不断丰富,也将进一步拉动相关产业链环节需求进一步提升 4.AIGC应用场景 4.1计算机板块 AIGC对未来的“文本生成”、“音频生成”、“图像视频生成”等均具备强大技术支持。 有丰富的细分赛道,应用空间广泛 4.1.1文本生成 “应用型文本”为基于结构化格式进行特定文本生成,例如重大新闻、体育新闻等; “创作型文本”即需要对细分场景进行剧情规划与续写,对情感艺术等要求较高,对新一代AI来说,人类知识的植入有助于它实现进人类沟通,对特定情感场景的完成度也将更加完善。 4.1.2音频生成 “音频”的使用不固定于单一场景,歌曲、影视等均需要音频的生成,新一代AI可以基于对过去场景的数据结合,进行快速分析,从而以更短的周期实现初步创作、自动续写等工作,为后续团队工作打造高质量基础。 图5:Google音频生成AI模型AudioLM训练过程 4.1.3图片生成 AI绘画是图片生成中最为流行的形式。AI通过训练图像中学习绘画,用户输入描述后,会自动生成符合用户预期的画作。更高级、更复杂的图片需要高级参数及更详细的细节描述。