您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开源证券]:北交所行业主题报告:开源证券AIGC驱动智算集群建设,算力租赁模式复现IDC高增路径 - 发现报告
当前位置:首页/行业研究/报告详情/

北交所行业主题报告:开源证券AIGC驱动智算集群建设,算力租赁模式复现IDC高增路径

信息技术2023-11-15诸海滨、赵昊开源证券一***
北交所行业主题报告:开源证券AIGC驱动智算集群建设,算力租赁模式复现IDC高增路径

北交所行业主题报告 2023年11月15日 AIGC驱动智算集群建设,算力租赁模式复现IDC高增路径 北交所研究团队 ——北交所行业主题报告 诸海滨(分析师)赵昊(分析师) zhuhaibin@kysec.cn 证书编号:S0790522080007 zhaohao@kysec.cn 证书编号:S0790522080002 相关研究报告 《市场需求探底业绩承压,卫星通信与5.5G建设有望开拓新成长曲线—北交所信息更新》-2023.11.13 《15万吨新增产能投产60%,完成定向增发计划—北交所信息更新》 -2023.11.13 《北交所周观察:北交所股票预估纳入中证跨市场指数,与恒生指数公司签署许可协议—北交所策略专题报告》-2023.11.12 AIGC迎技术与应用拐点,复盘第三方数据中心看算力租赁厂商增长路径 ChatGPT引领AIGC格局,国内厂商纷纷跟进大模型布局,带动AIGC与算力的普惠化远景,预计2026年80%企业将使用AIGC产品。这一背景下涌现的算力 租赁并不是一个全新的概念,但我们更关注专门从事GPU算力建设到租赁解决方案业务的第三方厂商。复盘过去IDC领域发展迅速的第三方数据中心厂商,发掘其与算力租赁相似发展模式的高可见度与高速成长性:万国数据、秦淮数 据、奥飞数据、光环新网等批发/零售厂商通过数据中心建设和运营服务,发展早期持续50%以上营收增速,且普遍重资产运营、轻销售推广,通过绑定优质客户实现稳定现金流,行业毛利率集中在20-40%间且维持长期稳定。对比之下,算力租赁具备较多共同特征,新兴第三方AI算力租赁厂商有望复现数据中心行业前期高速成长路径,打造客户-资金-AI算力建设的螺旋型扩张,且这类商业模式扩张天生具备“侵略性”利于优质厂商快速崛起。 大模型引领算力服务商发展,GPU基建建设加速扩张 2023年10月六部门印发《算力基础设施高质量发展行动计划》提出到2025年实现GPU为主的智能算力占比达到35%(105EFLOPS),当前国内智能算力规模为41EFLOPS,预计2022-2025实现36.8%CAGR。智能算力在AIGC领域主要用于训练模型、推理推断、模型优化等,预计未来推理资源(长线运营导向)占比将提升至6成;大模型时代训练参数量快速增长,数据、用户数量指数级上涨,超越摩尔定律的算力需求带来“算力墙”,因此GPU算力资源本身具备稀缺属性。IDC预测2026年全球AI服务器市场规模将达到347亿美元,中国市场将达到123亿美元,其中全球生成式AI计算市场2022-2026实现90%以上CAGR。 聚焦软硬件多元层面,蓝耘科技、并行科技等高壁垒核心赛道厂商预计受益目前业内自建GPU算力资源厂商较少,需要第三方算力服务商为有高性能需求 的客户提供算力云租赁服务,从芯片层、服务器层到云架构层,服务商均需要持续优化算力资源体系。服务器层需要系统厂商和芯片厂商协同,实现计算、存储、网络设备、机柜、供电、液冷等系统工程优化。云架构层需要深化全栈技术体系 应用、构建一体化智能算力调度服务,并通过算力虚拟化、算力隔离、算力感知、混合部署和调度等技术实现调优。网络通信层主要通过InfiniBand网络实现RDMA技术,提升加速比、降低端到端通信时延是关键。算力资源格局演进下更需重视厂商自身壁垒,新三板&北交所两大受益标的:蓝耘科技GPU算力云服务2023H1收入5215.56万元增长117%、占比已达40%,2023年度拟投资约3亿元购买GPU服务器,乌兰巴托智算中心已落地;并行科技作为国内最大独立超算服务商/通用超算云服务商,基于自建+外接布局具备超算特色GPU资源, AI云业务2023H1收入达2294万元,公司当前GPU资源的服务能力可覆盖在手订单的需求量,预计能较好地服务当前在手订单用户。 风险提示:下游需求下滑、政策及外部环境变化、新技术发展不及预期等 北交所研究 开源证券 证券研究报 告 北交所行业主题报告 目录 1、引言:AIGC迎技术与应用拐点,大模型+云计算走向全民化、普惠化4 2、AI算力是新时代核心基建,复盘第三方数据中心看算力租赁厂商增长路径4 3、洞察趋势:AI大模型引领算力服务商发展,GPU基建建设加速扩张9 4、发掘壁垒:聚焦软硬件多元优化,虚拟化与资源调度促成本效率提优14 5、公司布局:多赛道龙头加码GPU算力,蓝耘&并行彰显专精优势22 6、风险提示26 图表目录 图1:通用及行业大模型不断涌现、进化,AIGC开启全球产业技术新引擎4 图2:英伟达多路线AI硬件持续迭代,将大模型训练、部署从两年周期缩短到一年4 图3:微软OpenAI+GPU算力资源打造协同效应,同时云服务对外提供租赁业务5 图4:第三方数据中心厂商通过绑定核心客户长期租赁模式,实现快速扩张6 图5:2014-2018年是数据中心“跑马圈地”核心阶段6 图6:资源向内生能力转化,毛利率整体维持20-40%6 图7:非流动资产占比普遍高,重资产长线运营为主7 图8:销售费用率普遍较低,绑定大客户无需大量推广7 图9:AI“算力租赁”与第三方数据中心厂商扩张模式类似,聚焦于资源层能力7 图10:“算力租赁”本质上是AI算力云业务的一种具体商业模式8 图11:算力租赁厂商与常规算力云厂商的商业模式有较多差异,具备独特竞争力8 图12:AI算力服务产业链中,云服务商(包括第三方算力租赁商)集成芯片、服务器,形成算力服务供给9 图13:2022年全球智能算力规模增长25.6%/EFLOPS10 图14:2022年中国智能算力规模增长41.4%/EFLOPS10 图15:AI模型算力需求主要来自于训练和推理两大类11 图16:2021年GPU应用于中国89%的计算加速场景12 图17:预计AI服务器用于推理计算比例将提升至6成12 图18:智能算力是驱动计算机视觉产业链发展的基础12 图19:AI时代GPU算力需求预计每年翻倍,10年内实现千倍增长13 图20:AIGC成核心驱动力,预计全球CAGR超90%13 图21:预计中国AI服务器市场2026年达123亿美元13 图22:成本端核心是优化数据中心系统工程投入,收入端核心在于提升算力利用率、实现算力调优15 图23:NVIDIA加速计算全栈平台横跨芯片层、系统层和软件层布局15 图24:从芯片层、服务器层到云架构层,服务商均需要持续优化算力资源体系16 图25:开放加速计算系统全栈设计方法涉及芯片、散热等辅助硬件、系统方案、性能调优等环节紧密配合16 图26:AI服务器集群建设过程需要在架构等硬件层的设计经验上有深厚积累17 图27:GPU云计算集群通过网络、存储协同部署以及容器化,构建AI云服务17 图28:GPU容器共享技术可依托K8S与调度算法实现18 图29:AI算力网络在算力池化基础上,通过AI-VPC实现多租户隔离19 图30:租户隔离与多租户资源调度优化是优化AI算力资源的一大重点19 图31:资源层、代码层到系统层的各级优化实现是定制化服务能力的一大核心20 图32:业内主要通过RDMA技术实现大带宽、低时延的端到端通信,其中InfiniBand是主要实现方式21 图33:智能算力需要应对不同场景对带宽、时延的需求21 图34:2022年AI云服务市场随下游需求逆势增长至79.7亿元,互联网巨头主导22 图35:蓝耘科技2018年以来实现了营收利润较大增长23 图36:2023H1蓝耘科技毛利率上升至28%23 图37:GPU算力云服务2023H1维持117%高增长,收入达5215.56万元24 图38:算力云服务业务占比持续上升至4成左右24 图39:算力云服务毛利率超50%,远高于系统集成业务24 图40:并行科技2021年以来实现了营收较大增长25 图41:2023H1并行科技毛利率23.7%25 图42:AI云业务快速增长,2023H1营收超2000万元25 图43:2023H1并行科技AI云+行业云收入占比达5成25 图44:并行科技持续研发高投入,过去三年研发费率平均超15%26 表1:算力中心可以按照用途分为通用算力、智能算力、超算三大类9 表2:国家规划加快算力、运力、存力为核心的数字基础设施建设10 表3:智能算力自建较少,业内以云租赁模式为主14 表4:A股算力租赁标的梳理,各公司纷纷加快产业合作、算力资源、客户纽带三维布局23 1、引言:AIGC迎技术与应用拐点,大模型+云计算走向全民化、普惠化 2023年可以称作“AIGC”突破元年,在ChatGPT率先打破格局之后,国内厂商纷纷跟进大模型产品,如百度文言一心、讯飞星火、腾讯混元、华为盘古、阿里通义千问等。大模型所引领的AIGC(生成式AI)浪潮不仅限于语言模型的革命,还将涉及各领域的生产、学习、工作和管理等,经过大规模预训练的模型、云计算与开源的融合正在推动生成式人工智能(生成式AI)的全民化,这也将带动计算力的“普惠化”。据Gartner预测,使用生成式AI的API或模型、或在生产环境中部署支持生成式AI的应用的企业比例,将从2023年初的不到5%提升到2026年的80%;这一背景下涌现的技术趋势还包括AI增强开发、习得性智能应用、数字人“客户”、行业云平台等等,共同驱动全球产业深化发展。 图1:通用及行业大模型不断涌现、进化,AIGC开启全球产业技术新引擎 资料来源:2023科大讯飞全球1024开发者节发布会 2、AI算力是新时代核心基建,复盘第三方数据中心看算力租赁厂商增长路径 ChatGPT的诞生象征着全球AI领域一次深刻而革命性的变革。作为一款基于GPT-3.5架构的先进AI模型,ChatGPT不仅引领了自然语言处理领域的发展,而且带动了AI行业对于高性能算力的需求;这一需求正在推动着硬件领域的创新和投资,特别是针对高性能GPU和云计算基础设施的发展,尤其是英伟达高性能GPU为代表的AI训练/推理硬件成为当下算力建设的核心资源。 图2:英伟达多路线AI硬件持续迭代,将大模型训练、部署从两年周期缩短到一年 资料来源:英伟达官网、开源证券研究所 当下,微软公司凭借对OpenAI的整合并利用其庞大的资源和技术实力,同时推进大规模AI模型和强大的计算基础设施,已经成为AI竞争中不可忽视的顶级巨头。AzureOpenAI业务作为微软大模型侧的核心布局,新增客户数量持续突破,其GPT3.0/3.5/4.0的陆续亮相率先打造了全球大型语言模型品牌壁垒;其全球影响力和资源投入使得微软公司也成为众多AI技术公司的第三方算力供应商,以应对大模型参数量快速这种所带来的计算挑战。 OpenAI等AI板块的快速增长很大程度也得益于微软基于英伟达A100及H100等GPU的算力集群作为底座支持。微软通过持续布局AI算力基础设施,搭建了全面的公有/私有/混合云服务,除了研发AI需求的自用部分外,还提供服务器云租赁业务,在典型场景上与亚马逊AWS、谷歌云竞争。2023Q3,微软AI相关业务已贡 献了Azure业务3%的增长,并潜在驱动了客户提前切入Azure服务以准备获得未来AI服务的意愿。据Bernstein估计,微软平均每张英伟达A100GPU每小时可赚进 1.5美元,满利用率下每月约1000美元(约为7300元人民币),且GPU算力租赁业 务产生的毛利率高达40%以上。 图3:微软OpenAI+GPU算力资源打造协同效应,同时云服务对外提供租赁业务 资料来源:微软财报、钛媒体公众号、开源证券研究所注:按照现实季度,2023Q2对应微软 FY2023Q4 云计算服务是数字化时代的核心基建,而“租赁”形式则是其商业模式的外显。 算力租赁并不算一个全新的概念,其本身可以是诸如微软Azure、AWS、阿里云等公有云、混合云服务的一面具体指称,但我们总体更关注专门从事算力建设到租赁解决方案业务的第三方厂商,核心在于其发展模式的可见度与高速成长性。这一模式在前几代数字化基建加速建设的2010年左右便已涌现。回顾