ChatGPT商业化,开启AI投资浪潮 ——计算机行业研究周报 行业研 究 行业研究周 报 申港证券股份有限公司证券研究报 告 投资摘要: ChatGPT横空出世,已初试商业化。 ChatGPT具有多种先进性特征,一经发布备受瞩目。ChatGPT是由OpenAI训练的大型自然语言处理模型,可实现自然语言生成、语言翻译、自然语言理解、语言摘要等一系列功能。发布两个月后月活用户突破1亿,成为史上 用户增长速度最快的消费级应用程序。 OpenAI与微软深度绑定,技术资金实力雄厚。OpenAI成立于2015年。2019年起微软多次对OpenAI进行投资,双方建立战略合作伙伴关系,微软为OpenAI提供技术支持和资金支持。 OpenAI以API的方式提供服务,并开始探索商业化。OpenAI尚未开源,普 通用户可以通过API免费使用ChatGPT。OpenAI也开始进行商业化尝试, 今年2月OpenAI推出试点订阅计划ChatGPTPlus,定价每月20美元。 ChatGPT技术路径:Transformer架构+强化学习+大规模语料训练+超强算力 算法:基于Transformer架构,引入强化学习方法进行微调优化。 Transformer神经网络是ChatGPT的核心技术。与RNN相比,Transformer 的优点在于可以并行处理输入序列的所有位置,从而大大加快了训练和推理的速度。ChatGPT在GPT-3的基础上,新加入了人类反馈强化学习算法,旨在从人类反馈中学习,从而提高任务完成的效率的准确性。 数据:每次模型迭代都伴随着预训练数据量的爆炸式增长。通过训练大量的 文本语料,ChatGPT提升生成自然语言的准确性、适应性、效率和泛化能 力。同时,GPT模型的参数数量也呈大幅增长趋势,ChatGPT模型的复杂程度将会更高,性能表现也会更好。 算力:背靠微软获得庞大的计算资源与资金支持。OpenAI与微软合作开发了 一台新型人工智能超级计算机,OpenAI所有模型都在该计算机系统上训练。 这款超级计算机算力强大,拥有超过28.5万个CPU,1万个GPU,每个GPU服务器的网络连接能力为400Gb/s。 ChatGPT发挥催化作用,生成式AI商用黎明已至 ChatGPT开启生成式AI商用元年。生成式AI是通过机器学习方法从数据中 学习内容或对象,然后根据学习得到的模型生成完全原创的新内容,商业化 应用方向包括信息检索与处理、AIGC、各行业的专业服务等。 ChatGPT发挥“鲶鱼效应”,国内外科技巨头加快生成式AI布局。ChatGPT的爆火引起了国内外科技巨头的重视,各方加快生成式AI的研发和布局,或利用ChatGPT提高产品竞争力。 建议关注 我们认为,AI大模型训练需要大算力支撑,利好IT基础设施厂商,同时建议关注有生成式AI技术储备的人工智能厂商。相关标的如下: IDC标的:奥菲数据;服务器标的:浪潮信息、中科曙光;芯片标的:景嘉微、海光信息;生成式AI标的:科大讯飞、云从科技、拓尔思、海天瑞声。 市场回顾: 本周计算机板块延续上涨态势,周涨幅1.67%,在申万一级行业中排名7/31。 本周申万计算机行业指数前十大权重股中,科大讯飞和中科曙光涨幅较大,中科创达和德赛西威出现较大幅度下跌。 本周计算机板块涨幅前十名的公司主要集中在IDC、云计算、服务器、智慧安全等领域。 目前申万计算机行业指数当前滚动市盈率为57.24,近五年分位值63.85%。 风险提示:市场情绪风险;技术落地不及预期风险;法律及道德风险。 评级增持(维持) 2023年02月12日 曹旭特分析师 SAC执业证书编号:S1660519040001 时炯研究助理 SAC执业证书编号:S1660121120030 行业基本资料 股票家数311 行业平均市盈率57.24 市场平均市盈率11.93 行业表现走势图 10% 5% 0% -5% -10% -15% -20% -25% -30% 2022-02 2022-03 2022-03 2022-04 2022-05 2022-06 2022-06 2022-07 2022-08 2022-09 2022-09 2022-10 2022-11 2022-12 2022-12 2023-01 -35% 计算机(申万)沪深300 资料来源:Wind,申港证券研究所 相关报告 1、《计算机行业研究周报:四季度计算 机板块机构持仓迎来拐点,行业业绩逐步筑底》2022-02-05 2、《计算机行业研究周报:每周一谈,国资委强调加大信息基础设施投资力度》2022-01-30 3、《计算机行业研究周报:关注财政信息化领域投资机会》2022-01-15 内容目录 1.每周一谈3 1.1ChatGPT横空出世已初试商业化3 1.2ChatGPT技术路径:Transformer架构+强化学习+大规模语料训练+超强算力4 1.3ChatGPT发挥催化作用生成式AI商用黎明已至6 1.4建议关注8 2.板块回顾10 3.本周要闻11 3.1行业新闻11 3.2重要公司公告12 4.风险提示12 图表目录 图1:ChatGPT是全球最快达到一亿用户的消费级应用程序3 图2:ChatGPT主要功能3 图3:Transformer模型架构5 图4:ChatGPT的训练三阶段6 图5:整合ChatGPT的新版Bing7 图6:AIGC应用实例8 图7:本周计算机板块涨跌幅10 图8:申万计算机行业指数PE(TTM)11 表1:OpenAI发展历程4 表2:GPT系列模型参数量及预训练数据量6 表3:国内外科技巨头生成式AI布局8 表4:本周申万计算机行业市值前十大权重股票涨跌幅10 表5:本周计算机板块涨幅前十名11 1.每周一谈 1.1ChatGPT横空出世已初试商业化 ChatGPT是由OpenAI训练的大型自然语言处理模型。ChatGPT能够模拟人类的语言行为,与用户进行自然的交互。2022年11月30日,ChatGPT一经发布就引起了市场的轰动,根据瑞银发布的报告,ChatGPT在2023年1月末的月活用户突破了1亿,成为史上用户增长速度最快的消费级应用程序。Similarweb数据显示,1月期间,ChatGPT平均每天大约有1300万独立访客,约为上个月的两倍。 图1:ChatGPT是全球最快达到一亿用户的消费级应用程序 资料来源:WorldofEngineering申港证券研究所 ChatGPT应用广泛,具有多种先进性特征。基于GPT模型(生成型预训练变换模型),ChatGPT可实现自然语言生成、语言翻译、自然语言理解、语言摘要等一系列功能。相较于此前的对话式AI,ChatGPT具有诸多先进性,支持连续多轮对话, 极大的提升了对话交互模式下的用户体验。此外ChatGPT还可以质疑不正确的问题、主动承认自身错误或专业知识的不足。但ChatGPT目前还并不具备网络搜索功能,只能基于2021年所拥有的数据集进行回答。如果ChatGPT能够实时更新信息和数据,将带来生成式AI领域更大的突破。 图2:ChatGPT主要功能 资料来源:ChatGPT申港证券研究所 OpenAI与微软深度绑定,技术资金实力雄厚。OpenAI于2015年由奥特曼、彼得·泰尔、里德·霍夫曼和埃隆·马斯克等人共同创办,旨在利用人工智能技术 推动技术进步,并以开放研究方式推动人工智能的普及和进展。2019年,微软向OpenAI注资10亿美金,双方达成了合作协议,在合作过程中微软为OpenAI提供技术支持和资金支持。此外,微软一方面将GPT系列模型应用于Office、Bing和Microsoftdesign等产品中,以优化现有工具,改进产品功能,另一方面将OpenAI工具与自有产品进行深度集成,并推出相应产品。 表1:OpenAI发展历程 时间主要事件 2015OpenAI成立 2016发布Gym、Universe等开源项目,可应用于游戏、浏览器、模拟机器人等 2017.07发布近端优化策略算法(PPO),PPO已成为OpenAI默认的强化学习算法 2017.11自主训练的AI程序在Dota2中成功击败世界顶级选手 2018推出了第一代生成式预训练模型GPT-1 2019分阶段发布GPT-2 2019.07与微软建立战略合作伙伴关系,微软注资10亿美金,成为OpenAI独家云计算提供商 2020发布新一代GPT-3 2020.04发布自动音乐生成模型Jukebox 2021.01发布DALL·E神经网络,可以根据文本标题为可以用自然语言表达的各种概念创建图像。 2022.06发布DALL·E2 2022.11发布ChatGPT,向用户免费开放 2023.01微软与OpenAI扩大合作伙伴关系,将向OpenAI追加数十亿美元的投资 资料来源:OpenAI官网IT之家TechWeb申港证券研究所 ChatGPT模型尚未开源,目前以API方式提供服务。ChatGPT是OpenAI公司的核心技术,如果开源,其未来盈利能力将大打折扣。此外,GPT-3模型的数据和计算资源需求非常庞大,开源技术可能导致安全漏洞和数据泄露。基于以上考量, OpenAI选择不开源GPT系列模型,目前以API(应用程序编程接口)调用的方式为用户提供服务。 ChatGPT是研究性质的公测产品,已初试商业化。目前普通用户可以免费使用ChatGPT,为了覆盖部分高昂的算力成本,OpenAI也开始进行商业化尝试。今年2月OpenAI宣布推出试点订阅计划ChatGPTPlus,定价每月20美元。付费版的ChatGPT提供的增值服务包括:高峰时段免排队、快速响应以及优先获得新功能和改进。但总的来说,我们认为ChatGPT是一个非盈利目的的研究性产品,或将为下一步GPT-4的推出积累大量对话数据,并起到关键的引流作用。OpenAI预测,随着ChatGPT成为吸引客户的重要工具,其收入将会快速增长,预计2023年收入2亿美元,2024年收入预计超过10亿美元。 1.2ChatGPT技术路径:Transformer架构+强化学习+大规模语料训练 +超强算力 算法、数据和算力,被视为驱动人工智能发展的“三架马车”,下文拟从这三方面分析ChatGPT的技术壁垒。 算法:基于Transformer架构,引入强化学习方法进行微调优化。 从GPT-1到GPT3.5的多次迭代。2018年发布的GPT-1的关键特征是半监督学习,即先用无监督学习的预训练,在从大量未标注数据中增强AI系统的语言能力,获得大量知识,然后进行有监督的微调,实现了NLP任务从有监督向无监 督的迈进。2019年推出的GPT-2与GPT-1架构相同,但使用了更大的数据集,并为模型添加了更多参数,来提高模型的准确性。2020年,GPT-3的迭代出现了重大的飞跃,不需要微调就能识别到数据中隐藏的含义,并运用此前训练获得的知识,来执行下游任务。2022年发布的ChatGPT基于GPT3.5架构开发,引入来自人类反馈的强化学习进行训练,相较于前代再次产生了技术路线上的方向性变化。 Transformer神经网络是ChatGPT的核心技术。Transformer是Google在2017年提出的一种用于序列到序列学习的神经网络架构,其使用Self-Attention结构取代了在NLP(自然语言处理)任务中常用的RNN(循环神经网络)网络结构。与RNN相比,Transformer的优点在于可以并行处理输入序列的所有位置,从而大大加快了训练和推理的速度。Transformer网络使得ChatGPT可以处理长序列,而不受固定长度的限制,提高了生成文本的灵活性。 图3:Transformer模型架构 资料来源:AttentionIsAllYouNeed申港证券研究所 引入强化学习方法。ChatG