您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[清华大学]:生成式人工智能投资的短期与长期策略 - 发现报告
当前位置:首页/其他报告/报告详情/

生成式人工智能投资的短期与长期策略

2023-06-01许英博清华大学�***
生成式人工智能投资的短期与长期策略

生成式人工智能投资的短期与长期策略 许英博 面对未来,人们总是习惯高估一年的变化,低估五到十年的变化。 2023年,美股科技股领涨全球。英伟达、特斯拉、微软、脸书等公司涨幅居前。体现全球投资人对于生成式人工智能(AIGC,AIGeneratedContent)的较高预期。以ChatGPT为代表的生成式人工智能打开资本市场想象力,其令人惊叹的自传播性,快速完成投资者教育,引发产业界和资本市场对人工智能(AI,ArtificialIntelligence)的新一轮高度关注。人们重新审视和评估数字化、智能化在千行百业中可能带来的机遇和潜力。 笔者判断,本轮生成式人工智能将孕育长期可持续的投资机遇。我们将人工智能产业链划分为:基础算力、数据和模型、应用层等。长期看,生成式人工智能重构千行百业,应用层蕴藏规模最庞大、收益最丰厚的投资机会,但仍需时日等待AI原生爆款应用的出现。中期看,数据治理和模型精进,是确保人工智能应用能够大规模产业化落地的前提,MaaS(ModelasaService)+API(ApplicationProgrammingInterface)调用模式或成为潜力方向。短期看,在爆款应用和商业模式不确定的情况下,算力是当前相对确定的投资机会。 生成式人工智能引领2023年资本市场上涨 生成式预训练模型(GPT,GenerativePre-TrainedTransformer)持续升级迭代。2022年11月30日,美国科技公司OpenAI发布ChatGPT,其注册用户数快速突破1亿,成为史上用户增长最快的 许英博,中信证券研究部董事总经理,首席科技产业分析师。2007年硕士毕业于清华大学汽车工程系,同年加入中信证券研 究部,任汽车行业分析师。2016年,许英博创立中信证券前瞻研究团队,在中国证券市场上率先以跨行业的全球前沿科技为主要研究对象,研究内容覆盖互联网、科技硬件、云计算和人工智能、自动驾驶等。 消费者应用,引发资本市场、产业界和学界高度关注。2023年3月14日,升级版本GPT-4发布,进一步提升文字输入限制至2.5万字,准确率提升、识图水平提升。2023年9月,GPT更新支持基于图像和语音进行分析和对话。 GPT驱动OpenAI收入超预期。据媒体报道,受益于付费版ChatGPT订阅用户量增长,OpenAI在2023年的收入规模或超过13亿美元,显著超越此前资本市场的预期。2022年,公司的收入仅为约2800万美元。收入规模快速上涨,驱动公司在一级市场的估值显著提升。OpenAI年初接受微软等公司超100亿美元的投资,投后估值约为270-290亿美元。媒体报道,近期公司计划出售员工持股,估值达近900亿美元。 微软持有OpenAI约49%的股权,公司业务和估值受益于此。微软Copilot人工智能助手将GPT整合嵌入至操作系统Windows11和办公软件 Microsoft365Copilot,有助提升用户效率。微软采用“加量加价”模式,将Copilot功能定价于每月30美元。资本市场预期,人工智能应用将有助公司打开市场空间,微软股价年内最高上涨超60%。 大模型训练需要规模庞大的GPU(GraphicsProcessingUnit)算力。英伟达凭借芯片的出色性能,以及CUDA(ComputeUnifiedDeviceArchitecture)软件生态,具有较强的市场竞争力。大模型企业的持续涌现、模型版本的持续迭代,科技巨头的算力军备竞赛,加剧GPU现阶段供需紧张状态。英伟达收入和订单快速增长,今年以来截至11月30日,公司股价上涨约227%。 脸书推出开源大模型Llama2,并开放商业 许可,获得市场关注,公司股价上涨约162%。Transformer亦可应用于汽车自动驾驶领域,特斯拉股价上涨约122%。 人工智能助推美股领涨全球。今年以来截至11 月30日,美股纳斯达克指数和费城半导体指数分别上涨37%和49%。同期,中国人工智能和科技相关指数表现相对平淡,中信半导体指数上涨0.6%,中信电子指数和中信计算机指数分别上涨6.7%和5.8%;港股恒生科技指数下跌8%。 从大模型说起 生成式人工智能基于模型训练和人类反馈强化学习(RLHF,ReinforcementLearningfromHuman 全球资本市场科技相关板块走势 (2023年1月-2023年11月) 港中美市场AI标的表现对比 (2023年1月-2023年11月) 资料来源:wind,中信证券研究部 Feedback),建立在超大规模数据学习基础上,可用于文本、图片、视频、代码等多模态信息生成和交互。生成式人工智能通过分析字词间的统计学关联,预测句子中将要出现的下一个词或者空缺的词的概率,不断计算空缺单词的概率分布,最终生成完整的句子。 2017年谷歌Bert为代表的预训练+微调的Transformer模型成为当时人工智能的主流方向。OpenAI在其基础上改进,提出了GPT-2模型,使其更适合生成式任务。早期的GPT-2模型并不完善,基准成绩不算优秀。经过模型持续迭代,人工智能开始在语言任务的部分场景中追平人类。 2020年发布的GPT-3参数量高达1750亿,较GPT-2的15亿参数量显著提升。2022年初,OpenAI推出InstructGPT,引入人类反馈强化学习RLHF来进一步调整模型输出结果。尽管只有13亿参数,InstructGPT的输出效果却有显著提升,能够生成类似人类对话的结果,同时可遵循公共价值取向。 2022年11月底推出的ChatGPT使用与InstructGPT相同的人类反馈强化学习训练方法,并对数据收集优化,互动效果优秀。ChatGPT上线仅5天后,其注册用户数即超过100万;上线两个月后, 注册用户数破亿。 今年3月,OpenAI正式推出多模态大模型GPT-4,支持图像和文本的输入输出,拥有强大的识图能力。根据官网信息,GPT-4面对复杂问题的能力大幅提升,在一些专业问题和学术基准上表现已经和人类持平,如在AP考试、GRE考试等测试中表现优异。9月,GPT更新支持基于图像和语音进行分析和对话。 OpenAI从开源走向闭源,加速商业化。与以往不同,OpenAI既没有公开发布GPT-4相关论文,也没有提供详细的框架说明,仅仅提供了一份98页的技术文档,主要描述模型能力以及相关评测的得分,几乎没有任何技术细节。通过提供对应的API接口,OpenAI闭源加速商业化进程。 看到ChatGPT及其演进版本的效用和市场反响,其他竞争对手快速跟进。7月19日,脸书发布其最新开源可商用版本Llama2大语言模型。模型层面的最大亮点在于开源了与ChatGPT相同的监督微调 (SFT,SupervisedFine-Tuning)与人类反馈强化学习RLHF,成为目前开源类别中最接近ChatGPT的大语言模型。脸书的论文向业内拆解了SFT以及RLHF等的技术过程,并给出了可以直接使用的版本。我们判断,开源模型迭代进程将加速。 OpenAI发展路径及GPT产品迭代 资料来源:OpenAI,中信证券研究部 资料来源:企查查、各公司官网,中信证券研究部 12月6日,谷歌发布新一代大模型Gemini。模型包括Ultra、Pro、Nano三个版本,能够在从数据中心到移动端的多设备高效运营,多模态能力强大。谷歌在人工智能领域有着深厚基础,最早提出Transformer模型,但在大模型产业化训练过程中不够坚定,错失先机。在ChatGPT推出近一年之后,谷歌持续打磨技术和产品,追赶OpenAI和微软。 此外,海外的初创模型和应用公司中也有如StableDiffusion、Midjourney、Anthropic、Cohere、Adept、Pika等市场参与者。 在中国市场上,大量科技互联网巨头、初创公司参与到竞争当中。腾讯混元大模型、百度文心大模型、阿里通义大模型、快手快意大模型等互联网背景大模型具有较大的用户基础、较大规模的研发支出,快速开展通用模型建设。商汤、讯飞等人工智能公司,凭借此前积累的技术和资源优势,快速跟进迭代。以智谱、Minimax为代表的初创公司,在一级市场获得较高关注。清华系等高校背景大模型公司亦从科研走向产业化。此外,字节跳动大模 型亦值得期待。 生成式人工智能驱动算力需求快速提升 生成式人工智能训练对算力的要求持续提升。OpenAI预计,人工智能科学研究要想取得突破,所需消耗的计算资源每3-4个月就要翻一倍。 英伟达是全球高性能计算龙头公司。2022年英伟达新推出的H100芯片搭载Transformer引擎,使用每层统计分析来确定模型每一层的最佳精度,在保持模型精度的同时实现最佳性能,相较于上一代产品提供9倍的训练吞吐量,性能提升6倍。 过去十年,英伟达驱动人工智能计算能力持续提升。以单芯片Int8指标为例,2012年推出的主力芯片算力约为3.94Tops,2022年推出的H100芯片算力约为3958Tops。如综合考虑处理器、系统、连接等系统级因素,英伟达创始人黄仁勋表示,过去十年中人工智能处理加速和推进了一百万倍。同时他表示,相信未来十年人工智能处理将再加速一百万倍。 生成式人工智能浪潮引爆后,大模型公司持续 涌现、大模型版本持续训练迭代,高性能GPU需求爆发。核心厂商英伟达收入快速调整。2023年第二季度,公司收入达135亿美元,同比增长101%,环比第一季度增长88%。同时,公司指引第三季度的收入预期可达160亿美元。综合考虑市场需求和产能周期等因素,英伟达GPU产能紧张状态或持续至2024年。 一枝独秀的同时,英伟达在算力市场也面临挑战。谷歌、亚马逊、微软等科技巨头和需求大户,纷纷开展人工智能芯片自研计划,特斯拉亦推出Dojo,希望用于人工智能训练。AMD和Intel亦积极拓展人工智能芯片市场。 中国企业是英伟达GPU重要的需求方,但美国政府的禁令将导致英伟达无法向中国客户出售人工智能芯片。10月17日,美国商务部推出针对人工智能和半导体领域新的禁令。在新规下,面向中国市场出口高性能GPU如A100、H100、A800、H800、L40、L40S、4090等均会受到影响。此举将影响英伟达2024年在华销售规模和总收入预期。中国企业将被迫寻找替代方案。 应用端的机遇:AI原生应用和下一代科技硬件 互联网和移动互联网等科技大潮的经验表明,人们倾向于高估新技术带来的短期变化,低估技术浪潮的长期潜力。个人电脑的年销量峰值约3.5亿台,建立在此基础上的互联网产业巅峰市值约千亿美元量级。智能手机的年销量峰值约14亿部,建立在此基础上的移动互联网产业市值以万亿美元计。人工智能将带来千行百业数字化和智能化,长期看有望打开万亿美元潜在市场空间和更大规模的市值空间,甚至孕育下一代科技硬件。 苹果VisionPro首次提出“空间计算”等概念,未来“AI+科技硬件”的结合有望带来更多科技创新的可能。苹果VisionPro是基于现实空间进行计算,经人工智能技术辅助,用户看到的虚拟画面可以理解为在真实世界基础上叠加了实时计算结果。交互方式亦从二维转换为三维,更符合人类现实生活场景的交互,不再借助手柄等外设,直接使用眼睛、双手、语音进行人机交互。AI+AR,带来中长期更多创新可能。 英伟达单芯片推理能力(Int8Tops为例) 英伟达季度收入(含预测)与股价走势 生成式人工智能的潜力仍有待释放。在移动互联网时代,我们看到了专业内容创作(PGC,ProfessionalGeneratedContent)向用户创作(UGC,UserGeneratedContent)平台转变带来的潜力,字节跳动旗下抖音在全球快速斩获用户并保持高速增长。未来,生成式人工智能AIGC或将进一步改变内容产业,为我们提供创作门槛更低的丰富创作思路。Gartner预计,到2025年,生成式人工智能将占所有生成数据的10%。 AI原生应用很可能是人工智能中