您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[财通证券]:计算机行业专题报告:ChatGPT系列之二:全球商业化落地加速,新一轮算力储备开启 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业专题报告:ChatGPT系列之二:全球商业化落地加速,新一轮算力储备开启

信息技术2023-02-12杨烨、罗云扬财通证券罗***
计算机行业专题报告:ChatGPT系列之二:全球商业化落地加速,新一轮算力储备开启

行情演绎“五重击”,全面加仓正当时:本周计算机指数上涨0.47%,跑赢沪深300指数1.32pct,在31个申万一级行业中涨幅排名11,年初至今计算机涨幅排名1。2023年1月制造业PMI企稳回升,经济迎来“开门红”,同时扩大内需、数据要素流转、数据安全等纲领性政策均对创新科技的发展提供了长期驱动力;2022年底推出的AI聊天机器人ChatGPT火速出圈,开启AI新纪元,有望迎来商业化大潮。计算机板块第一阶段的“N”字第三笔延续,行情演绎“五重击”,在把握主航道的同时,建议加大顺周期的工业智能化/工业软件等板块的配置。 大模型路径成为AI产业的内生选择,全球开启新一轮AI竞赛:自2017年谷歌提出Transformer模型后,大模型技术引领AI发展趋势,生成式AI走向成熟,引领AI大规模商业化落地。全球科技巨头围绕生成式AI大模型开启新一轮竞赛。当前中美两国都已研发出上万亿参数的模型,随着模型体量持续增大,海量数据、大规模算力等资源将成为主要壁垒,在ChatGPT的加持下,全球科技巨头有望快速加码AI赛道的投入。 AI商用化落地或将“百花齐放”:AI商用化叠加数据要素流转,将构建全新的计算机产业生态。随着数据要素流转逐步落地,AI算法公司与垂直行业之间的行业数据交易、AI产品服务将形成产业闭环,加速AI商用赋能全行业。当前生成式AI已在文本、音频、图像、视频生成与编辑方面已有大量应用落地,加速从“AI辅助”到“AI创造”。 新一轮算力储备开启:AI大模型训练运算量增长速度远超硬件算力提升速度,以GPT为代表的大模型对现有算力规模形成极大挑战。对标AlphaGO,ChatGPT有望催化新一轮AI算力储备。我们认为,此次ChatGPT亦有望将大模型定为未来AI产业化主要路径,同时相比于迅速在新赛道建立卡位以紧握时代机遇,算力的成本/冗余/性价比或不会是科技巨头与国家的优先考虑因素,新一轮算力储备有望开启。 投资建议:建议关注数据标注领域的海天瑞声等;算力领域的海光信息、龙芯中科、浪潮信息、中科曙光、宝信软件、景嘉微等;算法领域的科大讯飞、云从科技、格林深瞳、海康威视、大华股份、奥普特以及AIGC领域的万兴科技等。 风险提示:AI技术迭代不及预期的风险;商业化落地不及预期的风险;政策监管风险 1本周回顾:上涨趋势延续,行情演绎“五重击” 全面加仓正当时。本周计算机指数上涨0.47%,跑赢沪深300指数1.32pct,在31个申万一级行业中涨幅排名11,年初至今计算机涨幅排名1。2023年1月制造业PMI企稳回升,经济迎来“开门红”,同时扩大内需、数据要素流转、数据安全等纲领性政策均对创新科技的发展提供了长期驱动力;2022年底推出的AI聊天机器人ChatGPT火速出圈,开启AI新纪元,有望迎来商业化大潮。计算机板块第一阶段的“N”字第三笔延续,行情演绎“五重击”:第一击:收入成本剪刀差,利润弹性逐季拔;第二击:PE估值处于历史低位,当期分位数实乃“虚高”;第三击:基金持仓低,横向景气度高,资金搬家忙;第四击:ChatGPT开启AI新纪元,科技创新周期上行加速,产业底层症结有望化解;第五击:政策主线托底,百花齐放可期。我们年度策略里提出的“百花齐放”正持续验证,全年核心主线依然是我们反复强调的泛信创、泛安全、硬科技这一产业主航道,并建议逐步加大顺周期的工业智能化/工业软件等赛道的配置。 图1.计算机指数相对各板块涨跌幅统计(2023.02.06-2023.02.10) 图2.本周各行业涨跌幅统计(2023.02.06-2023.02.10) 图3.年初至今各行业涨跌幅统计(2023.01.01-2023.02.10) 2大模型路径成为AI产业的内生选择 AI大模型方法驱使生成式AI走向成熟,引领AI大规模商业化落地。AI模型可大致分为决策式/分析式AI、生成式AI两大类,决策式AI已在推荐系统、计算机视觉、自然语言处理领域实现应用,生成式AI在大模型的驱动下逐渐发展成熟。AI大模型方法或许并不是通向“强人工智能”的终极解决方案,但为AI技术进一步突破以及产业化落地指明了方向。在过去几年中,AI大模型方法逐步成为行业的主流共识,主要原因基于以下四个方面: 业界逐步认识到大模型更加适合于生成式AI。之前参数量较小、结构简单的小模型更受欢迎,一方面是因为小模型对硬件的要求较低;另一方面是具有更高的可解释性和稳健性。但对于执行比较复杂的创新型任务,具有大量参数的大模型更为优越。 最近发展的新模型结构 ,降低了大模型的训练成本。2017年推出的Transformer可以实现更好的并行性,并可以大幅度缩短训练时间。 图4.Transformer模型在WMT 2014年英-德、英-法翻译比赛中以较低的训练成本取得较高的成绩 软硬件能力进步,为大模型提供了算力支撑。随着软件升级以及AI芯片技术突破,算力获得指数级增长,训练大型生成式AI成为可能。 图5.英伟达芯片算力指数级提升(2018-2024E) 多模数据不断丰富,为模型训练提供基础。要训练出大型生成式AI,需要投入充分的初始数据。随着移动互联网的发展,大量的文字、图片以及视频等多模数据都可以用于生成式AI训练。 图6.生成式AI与大模型发展相辅相成 处于Gartner曲线“期望膨胀期”以及“复苏爬坡期”的技术要素协同共振,ChatGPT商业化快速落地可期。根据2022年Gartner提出的AI技术曲线,大模型与生成式AI处于“期望膨胀期”,数据标注与智能应用处于“复苏爬坡期”,ChatGPT正是处于新兴技术应用展望与成熟技术落地爬升的阶段,因此获得资本市场与AI产业极高的关注度,有望于2023年快速实现垂直行业的商业化落地。 图7.2022年AI技术Gartner曲线 3百舸争流:全球开启新一轮AI竞赛 全球科技巨头开启新一轮AI竞赛。自2017年谷歌提出Transformer模型后,大模型技术引领AI发展趋势,全球科技巨头围绕生成式AI大模型开启新一轮竞赛。 大模型训练效果受到数据、算力、算法多方面影响,其竞争实质上比拼的是国家智能化综合实力,因此在中美两大AI强国诞生了众多算法模型。以OpenAI为例,2018-2020年陆续推出GPT、GPT-2、GPT-3,参数分别为1.17亿、15亿、1750亿个,模型体量呈现指数级增长。当前中美两国都已研发出上万亿参数的模型,随着模型体量持续增大,海量数据、大规模算力等资源将成为主要壁垒,在ChatGPT的加持下,全球科技巨头有望快速加码AI赛道的投入。 图8.国内外AI大模型对比 国内外科技巨头近期动作频繁,积极应对ChatGPT带来的行业变革。ChatGPT一经面世,激起千层浪,科技巨头均已加速布局。为对标ChatGPT,谷歌已明确表示正在开发一项名为Bard的对话式人工智能服务项目,百度正式宣布了大模型项目“文心一言”,360计划推出类ChatGPT技术的Demo版产品,阿里宣布正研发“阿里版ChatGPT”,各大巨头纷纷参与其中,形成百舸争流之势。 图9.国内外科技巨头近期动向 4行业变革:AI商用化落地场景或将“百花齐放” 4.1生成式AI:叠加数据要素流转,构建全新产业形态 AI商用化将构建全新的计算机产业生态。AI模型训练需要消耗大量数据与算力资源:(1)数据采集和标注来源于自有AI数据团队以及第三方AI基础数据服务商。随着大模型持续优化,高质量、高效、专业化数据标注需求持续扩张,将带动基础数据服务行业蓬勃发展;(2)大模型对算力基础设施要求提升。根据OpenAI,从2012年开始,AI训练所用的计算量呈现指数增长,平均每3.43个月便会翻倍,至2018年AI计算量扩大了30万倍。随着数据要素流转逐步落地,AI算法公司与垂直行业之间的行业数据交易、AI产品服务将形成产业闭环,加速AI商用赋能全行业。 图10.AI叠加数据要素流转构建全新产业生态 4.2全行业赋能,商业化大潮将涌现 4.2.1文本生成 微软旗下所有产品将全线整合ChatGPT。继微软宣布在搜索引擎BING、办公全家桶Office嵌入当今最火的语言模型ChatGPT后,CEO纳德拉宣布还将在云计算平台Azure中整合ChatGPT,通过Azure OpenAI服务可以访问OpenAI开发的模型,届时微软的每个产品都将具备相同的AI能力,实现AI技术的全线赋能。 此前微软推出了由ChatGPT提供技术支持的高级Teams产品,该产品可以自动生成会议记录,推荐任务,或者创建会议模板。基于OpenAI的GPT模型,即使没有参加会议,“智能回顾”也能生成会议记录和要点。微软表示这项高级服务将在6月份每月收费7美元,然后在7月份增加到10美元。 图11.微软将ChatGPT融入Teams可以自动生成会议记录 4.2.2音频生成 语音生成技术广泛应用,大厂均有布局。自动语音生成指将文本转化为语音,广泛应用于新闻阅读、有声书、通知播报、出行导航、视频配音等领域。目前,谷歌、微软、亚马逊、腾讯、阿里、百度、科大讯飞等均推出了相关平台。科大讯飞旗下讯飞配音是以互联网为连接的专业配音服务平台,基于科大讯飞的核心智能语音技术,致力于为用户提供合成配音+真人配音服务。 图12.科大讯飞在线语音合成 4.2.3图像生成 文本生成图像AI模型集中落地,开创图像设计新范式。文本生成图像模型可根据简单的描述性文本生成像照片一样逼真的图像,2022年推出的Stable Diffusion、DALL-E 2、Midjourney等模型已对大众开放,在三款模型中仅Stable Diffusion开源,已超1000万用户。谷歌于2022年5月推出由文本生成高清图像的模型Imagen,之后基于Imagen推出DreamBooth实现输入图片高度还原以及个性化表达。AI创作已步入大众生活当中,并进一步赋能创新设计和数字艺术。 图13.Imagen根据文字描述生成的图像 4.2.4视频生成 智能编辑为主,视频生成有待发展。AI视频编辑功能包括删除视频特定主体、自动跟踪剪辑、自动添加特定内容、视频特效生成、视频美颜,将大大降低视频编辑的专业门槛,提升视频剪辑效率,目前已广泛应用于视频创作领域。具体应用包括剪映、百度智能创作平台、抖音、美图等。AI视频生成仍处于高速发展期,现有模型生成视频时长较短,且部分内容准确性与客观性有待提升。目前Meta于2022年9月29日首次推出一款AI系统模型:Make-A-Video,可以仅用几行文本生成独具创意的视频,为视频创作带来新的活力。 图14.Make-A-Video根据文字描述生成视频 5ChatGPT有望开启新一轮算力储备 AI大模型训练运算量增长速度远超硬件算力提升速度。以Transformer中的典型GPT为例 ,2020年发布的GPT-3训练运算量约10^8~10^9 PFLOPs,1PFLOPs=10^15FLOPs(运算次数单位), 而2018年GPT-1训练运算量约10^4~10^5PFLOPs,综合来看Transformer模型训练运算量每2年提升750倍,而据摩尔定律,硬件算力提升速度为每2年2倍。 图15.各AI模型训练算力消耗量与摩尔定律算力提升速度对比 IDC预计2022-2026我国AI算力复合增速为47.5%。2022年我国服务器端智能算力为2.68*10^20FLOPS,IDC预计2026年将达12.71*10^20FLOPS,复合增速为47.5%,同时随着AI应用逐步加深,推理端算力占比将持续提升。 图16.中国智能算力规模与预测(2022-2026E) 图17.中国AI服务器工作负载预测 以GPT为代表的大模型对现有算力规模是极大挑战。结合大模型训练所需运算量增速与IDC对我国算力规模预测,我们做出下图测算,同时:1.我国AI训练算力不会全部用于假设的5个大模型训练;2.我国有自研基础通用大模型需求的机构或远不止5家(政府及