您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:推理微服务NIM:英伟达的Thenextbigthing - 发现报告
当前位置:首页/行业研究/报告详情/

推理微服务NIM:英伟达的Thenextbigthing

信息技术2024-07-25浦俊懿、项雯倩、陈超东方证券s***
推理微服务NIM:英伟达的Thenextbigthing

行业研究|深度报告 看好(维持) 推理微服务NIM:英伟达的Thenextbigthing 计算机行业 国家/地区中国 行业计算机行业 报告发布日期2024年07月25日 核心观点 Scalinglaw持续有效,大模型的迭代有望持续带来大量算力需求,英伟达业绩再创新高,占全球AI芯片市场九成。近年来,生成式AI需求快速增长,推动AI芯片市场规模迅速扩大。据Gartner预测,2025年全球AI芯片收入总额有望达到919.55 亿美元。作为人工智能领域的领导者,英伟达(NVIDIA)在全球人工智能芯片市场的市占率达到了九成。FY25Q1,英伟达业绩继续超预期,营收、净利润创新高。英伟达在大模型的开发训练方面有着深厚积累,使得其在这波AI浪潮中成为“卖铲子”的龙头企业。公司数据中心业务持续增长,FY25Q1,英伟达数据中心业务实现营收226亿美元,同比增长427%,数据中心业务占到所有业务收入的87%。 英伟达在训练算力领域的绝对优势,得益于其硬件的持续迭代和其CUDA生态的持续完善。面向模型开发者,英伟达能够提供以AI芯片、网络为基础的性能卓越的硬 件,以及CUDA为主的完善的软件生态。多年来,英伟达AI芯片不断迭代,且算力呈指数增长,在八年间算力增长了1000倍。英伟达的加速计算平台性能突出,生态环境优异。自2006年面世以来,CUDA持续更新迭代新版本,功能持续优化,性能持续提升,相较于ROCm等生态也更加成熟稳定,成为英伟达最大的护城河之一。 推理占比逐步提升,AI应用有望迎来爆发。据英伟达2024财年Q4的电话会披露,公司全年的数据中心收入里已经有40%来自推理业务,未来推理端算力需求将 占据主导地位。类比移动互联网时代,AI应用还需要一定时间探索产品形态,2B应用会是最先突破的方向。随着AI推理成本下降和模型性能提升,根据云计算市场的发展经验,我们认为最接近最终客户的应用层肯定是价值最大的环节。长期看,AI应用的市场规模广阔。 英伟达发布NIM微服务,加速AI企业端部署。NIM的全称为NvidiaInferenceMicroservice,即英伟达推理微服务,是NvidiaAIEnterprise的一部分,可以帮助客户快速部署产品级AI大模型应用。NIM实际上是一种容器化的部署工具,包含了 行业标准API、特定领域的代码、优化的推理引擎以及对于自定义模型的支持。相比于直接开发部署,NIM的部署时间大幅缩短。目前已有数百家生态系统合作伙伴嵌入了NIM。除了基础的AI模型都和NIM进行了适配加速外,一些行业巨头企业也已经开始使用NIM来加强自身的生成式AI应用,涉及制造业、医疗、金融服务、零售、客户服务等领域。 NIM的推出为英伟达在企业软件服务领域的发展再次加码。英伟达通过将AI领域的开发和部署软件微服务化,加速企业的生成式AI应用开发与部署。NIM是数据驱动 的推理核心,NVAIE则包含了整个AI开发全链条工具,如RAG、数据清洗、抗压测试等。通过提前针对模型、CUDA等做好优化,让企业用户无需深入了解技术,也能做出满足企业需求的AI应用,让用户的注意力更加聚焦于如何用AI去解决业务场景中的问题,而不是去担心硬件和模型。 投资建议与投资标的 我们认为,从今年开始AI在企业端的应用有望加速落地,类似NIM这样的软件平台推出有望进一步推动AI应用发展,英伟达相关的合作方有望受益,建议关注亚康股份、神州数码、浪潮信息等。 风险提示 技术落地不及预期;政策监管风险 浦俊懿021-63325888*6106 pujunyi@orientsec.com.cn 执业证书编号:S0860514050004 项雯倩021-63325888*6128 xiangwenqian@orientsec.com.cn执业证书编号:S0860517020003香港证监会牌照:BQP120 陈超021-63325888*3144 chenchao3@orientsec.com.cn 执业证书编号:S0860521050002 覃俊宁qinjunning@orientsec.com.cn 宋鑫宇songxinyu@orientsec.com.cn 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、AI算力需求高涨,英伟达业绩持续高增4 二、英伟达软硬件积累深厚,支持各类大模型开发6 三、英伟达加速从硬件“卖铲人”转向企业服务11 3.1推理占比逐步提升,AI应用有望迎来爆发11 3.2英伟达推NVAIE和NIM微服务,加速AI在企业端部署14 投资建议与投资标的20 风险提示20 图表目录 图1:Scalinglaw持续有效4 图2:Gartner预测2023-2025年全球人工智能半导体收入(百万美元)4 图3:海外头部云厂资本开支(十亿美元、Globalstandard)5 图4:英伟达FY25Q1营收突破单季度新高5 图5:英伟达FY25Q1净利润同比增长628%5 图6:英伟达FY25Q1毛利率、净利率高于预期5 图7:数据中心收入增长强劲,25Q1创历史新高(单位:十亿美元)6 图8:FY25Q1,数据中心产品占业务收入87%6 图9:英伟达AI芯片不断迭代6 图10:MI300硬件性能指标7 图11:CUDA发展历程8 图12:CUDA软件栈8 图13:CUDA赋能高8 图14:CUDA旨在支持各种语言和应用程序编程接口9 图15:英伟达数学库10 图16:CUDA-X人工智能生态系统10 图17:CUDA迭代历程11 图18:23年AI领域融资大部分在模型和Infra侧11 图19:2024以来AI应用公司融资增长快速11 图20:AI应用随着成本降低的创新路径13 图21:云计算市场分布和生成式AI市场分布情况13 图22:移动互联网时代典型公司的股市表现13 图23:NVAIE软件平台架构14 图24:英伟达在Azure上推出AIFoundryService15 图25:英伟达和戴尔AIFactory一起推广NVAIE16 图26:英伟达NIM架构16 图27:英伟达NIM支持大量的AI模型17 图28:TensorRT-LLM能大幅提升推理性能18 图29:通过NIM加速构建Agents19 图30:NIM生态伙伴19 表1:近期国产大模型价格统计12 表2:英伟达NIM支持AI模型一览17 表3:NIM部署和传统部署对比18 一、AI算力需求高涨,英伟达业绩持续高增 模型能力取决于算力资源,计算基础设施有长期投资价值。尺度定律(Scalinglaws)通常表现为一些可测量的特征随着系统规模变化呈现出固定的比例关系。基于经验性的实验分析,OpenAI的研究者在2020年发现大语言模型也遵循着尺度定律,其性能受到模型大小、数据集大小以及计算浮点数的影响。其中,模型规模是影响性能最大的因素,而模型规模的训练则需要大量的算力资源。换而言之,算力供应才是模型能力突破的真正决定因素。这表明,大模型的持续迭代将会持续带来大量算力需求。 图1:Scalinglaw持续有效 数据来源:机械之心、全天候科技、每日经济新闻、东方证券研究所绘制 近年来,生成式AI需求急剧攀升,推动AI芯片市场规模迅速扩大。市场调查机构Gartner最新报告显示,2024年全球AI芯片收入总额将达712.52亿美元,同比增长33%。Gartner还预测2025年全球AI芯片收入总额有望达到919.55亿美元,在今年的基础上再增长约29%。 图2:Gartner预测2023-2025年全球人工智能半导体收入(百万美元) 91955 71252 53662 100000 90000 80000 70000 60000 50000 40000 30000 20000 10000 0 2023E2024E2025E 数据来源:Gartner、通信世界网、东方证券研究所 2023年初AIGC兴起至今,谷歌、微软等海外云厂商的CAPEX持续增长,且有望于2024年继续保持增长态势。微软预计下季度资本开支将环比大幅增长,谷歌预计2024年每季度资本支出将超过120亿美元,全年同比增长至少50%。亚马逊表示会有意义的增加资本开支,主要用于支持AWS基础设施和生成式AI的进一步研发建设。META上调2024资本开支预期到350-400亿 美元,用于建设数据中心以及支持AI业务。 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 图3:海外头部云厂资本开支(十亿美元、Globalstandard) 亚马逊(AMAZON)谷歌(ALPHABET)-A 微软(MICROSOFT)-不含融资租赁脸书(METAPLATFORMS) 50.0 40.0 30.0 20.0 10.0 0.0 数据来源:wind、东方证券研究所 据Gartner,作为人工智能领域的领导者,英伟达(NVIDIA)在全球人工智能芯片市场的市占率预计达到九成。这一成就得益于过去一年间生成式AI需求的快速增长。在人工智能芯片市场,英伟达(NVIDIA)(NVDA.O,未评级)的A100/H100系列AIGPU成为了市场的首选产品。Gartner和MoorInsights&Strategy预测,英伟达将在2024年继续保持强劲势头。英伟达计划2024销售约150万至200万个AIGPU,是2023年的三倍。 英伟达FY25Q1(2024年2月至4月)业绩超预期,营收、净利润创新高。英伟达最新一季季报显示,英伟达营业收入突破单季度新高,达到260.4亿,同比增长262%,远高于预告的240亿美元。净利润达到148.8亿,同比增长628%。同时,英伟达预计,本财年第二季度总收入将达 到280亿美元,上下浮动2%,高于去年同期的两倍,所有市场平台都将实现连续增长。 图4:英伟达FY25Q1营收突破单季度新高图5:英伟达FY25Q1净利润同比增长628% 营业总收入(十亿美元)yoy 70 60 50 40 30 20 10 0 300%35 250%30 200%25 150%20 100%15 50% 0%10 -50%5 0 净利润(十亿美元)yoy 700% 600% 500% 400% 300% 200% 100% 0% -100% 数据来源:wind,东方证券研究所数据来源:wind,东方证券研究所 英伟达的高毛利率显示了其绝对龙头地位。FY25Q1,英伟达毛利率为78.9%,高于其预期的77%。据英伟达FY25Q1交流会,第二季度非GAAP毛利率预计为75.5%,全年毛利预计在75%左右。而竞争对手AMD非GAAP利润率为52%。英伟达第一季度净利率达到57%,调整后运营费用预计为28亿美元。 图6:英伟达FY25Q1毛利率、净利率高于预期 净利率毛利率 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 数据来源:wind,东方证券研究所 英伟达在大模型的开发训练方面有着深厚积累,使得其在这波AI浪潮中成为“卖铲子”的龙头企业。公司数据中心业务持续增长,AI大模型的开发支撑了其收入和利润的高速增长。FY25Q1,英伟达数据中心业务实现营收226亿美元,创历史新高,环比增长23%,同比增长427%,数据中心产品占到所有业务收入的87%。主要得益于对NVIDIAHopperGPU计算平台的持续强劲需求。 图7:数据中心收入增长强劲,25Q1创历史新高(单位:十亿美元) 数据中心产品游戏GPU和相关产品 专业视觉设计GPU智能驾驶GPU及相关产品其他业务 图8:FY25Q1,数据中心产品占业务收入87% 数据中心产品游戏GPU和相关产品 专业视觉设计GPU智能驾驶G