您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:计算机行业2023年4月投资策略:BloombergGPT 发布,建议关注具有数据优势的细分龙头 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业2023年4月投资策略:BloombergGPT 发布,建议关注具有数据优势的细分龙头

信息技术2023-04-02熊莉、库宏垚、朱松、张伦可国信证券能***
计算机行业2023年4月投资策略:BloombergGPT 发布,建议关注具有数据优势的细分龙头

证券研究报告|2023年04月02日 核心观点行业研究·行业投资策略 英伟达发布DGX云,算力成本有望降低。目前GPT模型对于算力的消耗量较大,GPT的模型算力和模型参数成正比,当下大模型参数量已经到千亿规模,对算力需求量较大。根据GPT官网的收费标准,GPT-4的收费标准相比于GPT-3,输入端价格增长50%-200%,输出端价格增长200%-500%,相比于GPT-3.5-turbo的成本输入成本增长了14-29倍,输出成本增长29-59倍。英伟达推出DGX云服务后,为各大厂商提供较为低廉的AI算力服务,降低了各个应用厂商的算力门槛,目前已经和微软云、谷歌云、Oracle开展合作,其首个NVIDIADGXCloud是与Oracle合作的云服务,每个实例每月 3.7万美元起。 微调模型和DGX基础模型助力应用百花齐放。GPT-3提供四种微调模型服务B端客户只需将自身的私域数据放到微调模型中训练即可获得自己的垂类小模型。英伟达也推出三大模型(NEMO语言模型、Picasso视觉模型、Bionemo生物模型)为B端厂商赋能,降低自身建立模型的门槛。微调模型和英伟达的基础模型将有效降低B端厂商建立自身模型的门槛,此情况下,B端厂商是否有模型调优能力以及细分场景数据将成为大模型能否落地应用的关键。 BloombergGPT发布,细分领域龙头有望凭借数据积累获得先发优势。Bloomberg近期发布了一个拥有500亿参数的金融领域的大规模语言模型,取名BloombergGPT。训练的数据集,51.3%来自于彭博近40年来的金融领域积累的数据,48.7%来自于公开数据。从最终的测试效果来看,在通用性能上,BloombergGPT相比其他模型没有明显的不足,但是在金融专业领域,BloombergGPT相比其他模型有明显的优势。从Bloomberg的案例可以看出,未来具备细分领域高质量数据的公司在大模型的应用上将获得先发优势。 投资建议:GPT大模型的开发已经成为业内的趋势,众多的厂商开始有计划的推出基于自身领域的垂直类大模型。未来,大模型的运用能力以及高质量细分领域数据将成为大模型是否能够有效落地应用的关键抓手,我们认为在AI领域高投入、拥有大模型调优能力,且具备细分场景高质量数据集的公司有望在应用端获得先发优势,建议重点关注细分领域龙头,比如科大讯飞、金山办公、恒生电子、广联达、石基信息、同花顺、三六零、美亚柏科等。 风险提示:疫情反复;计算机下游需求不及预期;ChatGPT技术发展不及预期;ChatGPT的商业化落地不及预期。 重点公司盈利预测及投资评级 公司 公司 投资 昨收盘 总市值 EPS PE 代码 名称 评级 (元) (亿元) 2022E 2023E 2022E 2023E 002230.SZ 科大讯飞 买入 63.68 1479.34 0.3 0.78 212.3 81.6 688111.SH 金山办公 买入 473.00 2181.78 2.42 3.49 195.5 135.5 600570.SH 恒生电子 买入 53.22 1011.18 0.57 0.99 93.4 53.8 002410.SZ 广联达 买入 74.30 885.20 0.81 1.07 91.7 69.4 002153.SZ 石基信息 未评级 25.66 538.70 -0.11 0.06 -233.3 427.7 300033.SZ 同花顺 买入 204.30 1098.32 3.15 4.12 64.9 49.6 601360.SH 三六零 买入 17.45 1246.87 -0.35 0.07 -49.9 249.3 300188.SZ 美亚柏科 买入 20.71 178.00 0.17 0.39 121.8 53.1 资料来源:Wind、国信证券经济研究所预测其中石基信息为wind一致预期 计算机 超配·维持评级 证券分析师:熊莉证券分析师:库宏垚021-61761067021-60875168 xiongli1@guosen.com.cnkuhongyao@guosen.com.cnS0980519030002S0980520010001 证券分析师:朱松证券分析师:张伦可021-608751550755-81982651 zhusong@guosen.com.cnzhanglunke@guosen.com.cnS0980520070001S0980521120004 市场走势 资料来源:Wind、国信证券经济研究所整理 相关研究报告 《人工智能专题报告——生成式人工智能产业全梳理》——2023-03-28 《人工智能行业点评-英伟达GPU、DGX云、AI工厂三驾马车发布,AI算力和应用再迎跃迁》——2023-03-26 《人工智能行业点评-OpenAI访问限流,GPT-4算力测算》——2023-03-20 《人工智能行业点评-Microsoft365Copilot发布,国内外AI应用有望加速落地》——2023-03-19 《国央企ERP专题报告:数字化转型下的新机遇》——2023-03-10 计算机行业2023年4月投资策略 BloombergGPT发布,建议关注具有数据优势的细分龙头 超配 请务必阅读正文之后的免责声明及其项下所有内容 内容目录 英伟达发布DGX云,算力成本有望降低4 目前GPT模型对于算力的消耗量较大4 英伟达推出DGX云服务,算力成本有望持续降低5 微调模型和DGX基础模型助力应用百花齐放6 GPT-3提供模型微调服务6 DGX云提供基础AI模型服务6 微调模型和DGX的基础AI模型助力应用百花齐放7 BloombergGPT发布,细分领域龙头有望凭借数据积累获得先发优势7 Bloomberg发布金融领域GPT大模型7 投资建议:紧抓AI应用,关注具有AI能力和数据优势的细分领域龙头9 风险提示9 免责声明10 图表目录 图1:算力的推理和训练成本计算方式4 图2:英伟达推出DGX云服务5 图3:GPT-3提供四种模型微调服务6 图4:英伟达提供的三种基础模型7 图5:BloombergGPT训练展示图8 图6:BloombergGPT和其他模型在通用和特定金融场景下的表现对比8 表1:各个GPT模型的收费标准4 英伟达发布DGX云,算力成本有望降低 目前GPT模型对于算力的消耗量较大 GPT的模型算力和模型参数成正比,当下大模型参数量已经到千亿规模,对算力需求量较大。根据算力的计算成本公式,推理计算的成本和2N成正比(其中N为模型参数量,比如模型参数量为1750亿,则N为1750亿)、和提问的prompt的token数量成正比、和硬件峰值倍数成正比(一般可以假设峰值的访问量是日常需求量的5倍)和模型的算力利用率成反比(一般假设模型的算力利用率为20%);算力的训练成本中,其他因素都和推理成本一致,不同的是算力成本与模型参数量的6倍正相关。 图1:算力的推理和训练成本计算方式 资料来源:CSDN,国信证券经济研究所整理 用户数量快速增长,算力成本巨高不下。根据GPT官网的收费标准,GPT-4的收费标准在8K上下文的情况下,输入收费标准为每1000个tokens0.03美金,输出标准为每1000个tokens0.06美金;在32K上下文的情况下,输入收费标准为每1000个tokens0.06美金,输出标准为每1000个tokens0.12美金。GPT-4的收费价格相比于GPT-3和GPT-3.5-turbo贵了不少:1)相比于GPT-3的价格,GPT-4的输入端价格增长了50%-200%,输出端价格增长了200%-500%;2)相比于GPT-3.5-turbo的成本上升更为可观,输入成本增长了14-29倍,输出成本增长了29-59倍。 目前GPT的日活数量接近6200万,Bing日活1亿用户,假设NewBing4000万日活,其他应用4000万日活,合计假设1.4亿日活。假设普通90%的用户使用GPT-3.5-turbo,10%的用户使用GPT-4,那么90%普通用户的一天的算力成本在28万美金左右(对应607台DGXA100系列服务器),而10%付费使用GPT-4的用户的算力成本为每天840万美金(对应1.8万台DGXA100系列服务器)。 表1:各个GPT模型的收费标准 模型收费价格 GPT-3每1000个tokens的价格为0.02美金。 GPT-3.5-turbo每1000个tokens的价格为0.002美金。 GPT-48Kcontext:输入端,每1000个tokens0.03美金;输出端,每1000个tokens0.06美金。 32Kcontext:输入端,每1000个tokens0.06美金;输出端,每1000个tokens0.12美金。 资料来源:GPT官网,国信证券经济研究所整理 英伟达推出DGX云服务,算力成本有望持续降低 DGXCloud云服务问世,让AI使用更简单。英伟达DGXCloud是未来公司重点计划,公司提供了专用的NVIDIADGXAI超级计算集群,搭配NVIDIAAI软件,向每家企业出租AI算力。英伟达的AI计算集群强大而昂贵,企业以云租赁的方式采购将更快、更方便的实现自身的AI训练和应用。目前英伟达已经和微软云、谷歌云、OracleOCI开展合作,其首个NVIDIADGXCloud是与Oracle合作的云服务,每个实例每月36,999美元起。每个实例包括八个NvidiaH100或A10080GBGPU,每个GPU节点内存高达640GB。计算资源是专用的,不与云中的其他租户共享,网络也在租户之间隔离。 参考IaaS到SaaS的发展逻辑,DGX云有望推动AI生态更加繁荣。以OpenAI大语言模型GPT3为例,其1750亿个参数,需要庞大成本投入和算力支持,一般企业难以涉足。如果做一个类似ChatGPT的大语言模型,根据调查机构TrendForce发布的报告,以AmpereA100的算力来计算,运行算力消耗高达3640PF-days(即假如每秒计算一千万亿次,需要计算3640天)的ChatGPT需要至少3万块AmpereA100;如果按零售价计算,则需要投资4.5亿美元。因此,类似于2000年后云计算的兴起,IaaS让各类企业创业和发展更加容易,催生B端SaaS和C端互联网生态。可以预期,英伟达DGX云的推出,让AI创业更为方便,不再只是巨头游戏,未来AI应用和生态有望快速发展。 图2:英伟达推出DGX云服务 资料来源:英伟达,国信证券经济研究所整理 微调模型和DGX基础模型助力应用百花齐放 GPT-3提供模型微调服务 GPT-3提供微调模型服务,帮助B端客户生成自己的垂类小模型。微调和重新训练不一样,重新训练需要很高的训练成本,而微调的成本则往往较低。微调只需要将额外的数据在训练好的模型上进行微调,而重新训练需要大量原始数据从头开始训练。微调模型,是以GPT-3为基础,结合私域数据集,给了很多的小B端厂商微调出适垂直领域小模型的机会,但是难点在于小B端厂商是否有能力对模型进行微调以及小B端厂商是否有足够多和详细的细分数据。目前GPT-3提供了4中微调模型(Ada、Babbage、Curie、Davinci),微调模型需要收集数据、清洗数据、构建模型、微调模型、评估模型、部署模型等步骤,价格也根据不同的基础模型而不尽相同,比如Ada模型的训练成本为每1000个tokens耗费0.0004美金,使用成本为每1000个tokens耗费0.0016美金,价格最贵的是达芬奇模型 (Davinci模型),训练成本为每1000个tokens0.03美金,推理成本为每1000个tokens0.12美金。 图3:GPT-3提供四种模型微调服务 资料来源:OpenAI官网,国信证券经济研究所整理 DGX云提供基础AI模型服务 英伟达进一步推出模型制作服务,形成全产业链AI能力输出。ChatGPT、Mi