您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:CUDA生态仍然至关重要 - 发现报告
当前位置:首页/行业研究/报告详情/

CUDA生态仍然至关重要

信息技术2023-06-17刘高畅国盛证券比***
CUDA生态仍然至关重要

以软件定义硬件,CUDA护城河高筑。1)GPU于20世纪末正式面世,主要针对图形处理设计,对应采用着色语言编程,程序员被迫将算法表达成图形流水线概念,学习曲线高、编程复杂性高、并行计算效率低。 2)2006年11月,代号G80的革命性产品NVIDIA GeForce 8800面世,彻底改变GPU内核的硬件架构,采用统一渲染结构,目标直指通用计算。伴随G80发布,CUDA编程模型横空出世,提供了硬件的直接访问接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问。软硬结合,GPU正式打开高性能计算大门。3)除了架构革新,CUDA还具备成本低、门槛低、兼容性高、生态广等多重优势。根据量子位报道,自CUDA推出以来,英伟达在将GPU转化为更通用的计算工具上投入了将近100亿美元。英伟达通过押注CUDA,为自身GPU业务构筑起高护城河。 AIGC时代 , 算法依旧快速变化 , 需要最广泛的生态支持 。1)自OpenAI发布GPT以来,我们认识到,当前的AIGC算法已经具备了真实复刻和创造某些通用内容的能力,但真正落地到具体场景和应用,仍需大量的算法优化。2)面临大量的、多样性的算法需求,为了更好发挥硬件的性能效率,广泛的开发者生态必不可少,CUDA或成为目前最优解。截至2022年底,CUDA在全球共有380万开发人员使用,同比上年底增速约27%,仍在快速扩张;同时,公司已通过Inception项目与数百所大学和13000多家初创公司合作,传播人工智能。时至今日,CUDA已经历12个大版本更新,工具完备、功能丰富,广泛用于天文学、生物学、化学、物理、数据挖掘、制造、金融等领域的GPU加速程序。我们认为,CUDA生态仍将在未来相当一段时间内,在全球占据主导地位。 随着大模型与部分应用逐步走向成熟,算力可部分由AMD或ASIC芯片实现补充。 算力持续短缺,CUDA生态厂商大有可为。1)全球来看,根据福布斯新闻,马斯克预计未来GPU需求量还会增至当前的3-5倍,算力需求有望持续高景气。而从供给端来看,英伟达作为AI算力龙头,正将部分产品交给英特尔代工,并计划在下半年大幅增加整个数据中心产品系列(包括InfiniBand和BlueField-3DPU)的供应,彰显其产能饱满,全球算力供不应求。2)国内代表厂商同样看到了AIGC引爆的算力需求,有望加速规划更大产能,例如,台积电表示AI订单需求突然增加、急需增加产能;浪潮信息正规划更大规模的液冷生产基地;中际旭创已向海外重点客户持续交付与GPU相配套的800G产品。3)我们认为,AIGC带来的算力需求正加速落地,供给端已加快产品迭代、扩大生产能力,在政策引导下,算力发展或形成上下合力,推动市场增长。 投资标的:英伟达、浪潮信息、中科曙光、光通信产业链、工业富联、 海光信息、紫光股份、寒武纪、云赛智联、易华录、优刻得、昇腾算力、景嘉微等。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 1.以软件定义硬件,CUDA护城河高筑 20世纪末GPU正式面世,专注图形处理,可编程性逐步提升。1999年,NVIDIA公司正式发布GeForce 256图形处理芯片,首次提出GPU概念,这时的GPU还只是一种专用的图形流水线硬件,且所有的硬件模块都是固定不可编程的。2001年,GPU首次引入了可编程性,即引入了顶点着色器的概念,自此,出现了一些GPU通用计算的设计算法。2003年,像素着色器的出现,使得GPU计算能力得到了更大的释放。2004年,以NVIDIAGeForce6800为代表的新一代GPU,开始支持分支操作,包括循环和子函数调用,这对于GPU通用计算是一个重要突破,GPU开始用于大量的通用计算领域。 由于着色语言编程复杂性高,GPU并未能在通用计算领域得到普及。1)根据《CUDA在高性能计算中的应用》,传统的GPU是专为图形处理而设计的,其内部的体系结构也几乎完全按照图形流水线的方式设计,每个硬件模块代表了一个图形流水线级。2)这时,编程语言均为一种着色语言,在图形流水线的绘制过程中完成自定义函数功能。这类GPU编程语言的学习曲线高、编程复杂性高、效率低,程序员们被强迫把他们的算法表达成图形流水线的概念,使得这类GPU编程语言的通用计算被限制于一些高级图形开发者所使用。虽然出现了很多通用计算的工作,却并没有让GPU在通用计算领域得到普及。 受制于硬件的具体规格参数,可编程性更多掌握在GPU厂商手中。1)GPU编程最关键的是应用程序接口或编译器以及驱动,而一般人无法获得硬件的具体规格参数,因此这两个编程关键需要GPU厂商提供,GPU的可编程性很大程度在GPU厂商手中。2)当相应指令集完备后,编程环境更完善,硬件的规格细节开放及构成一定标准的兼容了,GPU或有望普及。 革命性产品G80推出,目标直指高性能计算。2006年11月,代号G80的NVIDIA GeForce 8800面世,彻底改变了GPU内核的硬件架构,抛弃传统图形流水线设计方式,采用统一渲染架构,统一了GPU计算单元,设计完全按照通用计算架构设计,带来了更强大的运算能力,目标直指通用计算,尤其是高性能计算。 图表1:G80体系架构 针对硬件提供直接访问接口,大幅提升GPU并行计算效率。CUDA(Compute Unified Device Architecture)是跟随2006年11月GeForce 8800显卡面世而发布的,是一个完整的GPGPU解决方案,提供了硬件的直接访问接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问。 图表2:GPU计算应用 除了架构革新,CUDA还具备低成本、兼容高、生态广等多重优势。 1)CUDA本身免费,安装过程简洁明确,开发者几乎无需承担任何额外成本。 2)CUDA采用当时已经流行的C/C++语言作为编程语言,提供大量的高性能计算指令开发能力,开发者学习门槛低,使用效率高。 3)在培养生态方面,当时NVIDIA决定让消费级及高端级GPU均支持CUDA开发,最大限度推广CUDA生态。同时,NVIDIA还尽力与大学等科研教育机构合作,开设CUDA相关课程,尽早培养CUDA使用习惯。 图表3:部分CUDA使用教材 累计投入研发或近百亿美元,CUDA护城河高筑。根据量子位报道,自CUDA推出以来,英伟达在将GPU转化为更通用的计算工具上投入了将近100亿美元。英伟达通过押注CUDA,为自身GPU业务构筑起高护城河。 图表4:2005-2022年英伟达研发费用 2.AIGC时代算法依旧快速变化,需要最广泛的生态支持 AIGC时代来临,从模型到应用,仍需要大量的算法支持。自OpenAI发布GPT以来,我们认识到,当前的AIGC算法已经具备了真实复刻和创造某些通用内容的能力,但真正落地到具体场景和应用,仍需大量的算法优化,且更专业的垂直场景或需要结合行业know-how,进行更落地的算法支持。 广泛的开发者生态必不可少,CUDA或是最优解。1)面临大量的、多样性的算法需求,为了更好发挥硬件的性能效率,广泛的开发者生态必不可少。2)而CUDA在全球GPU市场中,生态或最为广泛。根据Nvidia2022年年报,全球有380万开发人员使用CUDA和其他软件工具来帮助公司在目标市场部署其技术;同时,公司通过Inception项目与数百所大学和13000多家初创公司合作,传播人工智能。此外,英伟达的深度学习研究所提供有关如何使用其加速计算平台在应用程序中设计、训练和部署神经网络的最新技术的指导。 图表5:CUDA开发者数量 图表6:Inception项目创业公司数量 时至今日,CUDA已经历12个大版本更新,工具完备、功能丰富。1)根据英伟达官网介绍,自2006年推出以来,CUDA已通过数以千计的应用程序和已发表的研究论文得到广泛部署,并得到笔记本电脑、工作站、计算集群和超级计算机中超过5亿个支持CUDA的GPU的安装基础的支持。2)CUDA工具包已迭代12个大版本、数十个小版本,广泛用于天文学、生物学、化学、物理、数据挖掘、制造、金融等领域的GPU加速应用程序。 图表7:CUDA工具包历次版本更新 图表8:CUDA应用领域 我们预计,CUDA生态仍将在未来相当一段时间内,在全球占据主导地位。 3.算力持续短缺,或可更关注CUDA生态厂商 算力供应短缺的问题已经成为行业的普遍热点,根据福布斯新闻,马斯克预计,未来GPU需求量还会增至当前的3-5倍之多。 英伟达部分产品交给英特尔代工,或彰显需求旺盛、产能饱满。1)根据财联社报道,《科创板日报》5月30日讯,英伟达CEO黄仁勋今日表示,公司供应链将力求多元化,H100是由台积电代工生产,部分产品也由三星代工生产,并即将开放委托英特尔代工。 2)我们认为,此举或彰显下游算力需求的旺盛程度。 数据中心业务超预期高增,Q2营收指引高于一致预期50%。1)随着ChatGPT发布,轰动的人工智能领域对芯片算力产生较大需求,英伟达因可以提供训练大量文本、图像、视频训练的AI芯片,数据中心(Data Center AI GPUs)收入贡献显著营收同比涨14%至42.8亿美元,环比增长18%,主要原因系基于Hopper和Ampere架构GPU的生成式AI和大语言模型的需求不断增长。根据21世纪经济报,公司在业绩说明会上表示,由于互联网公司、云计算提供商和企业客户都迫切希望将生成式AI应用到自身业务中,下一季度数据中心客户的销售额或将翻番,计划在下半年大幅增加整个数据中心产品系列(包括InfiniBand和BlueField-3DPU)的供应,以满足激增的需求。2)业绩指引方面,根据华尔街见闻,英伟达预计,本财年第二财季营收为110亿美元,正负浮动2%,指引范围在107.8亿到112.2亿美元之间,同比增长约32.7%。分析师预计二季度营收只有71.8亿美元,同比下降13.4%。110亿美元的营收较分析师预期高53.2%,二季度将扭转收入连续三个季度同比下滑的势头。 人工智能订单突增,台积电积极扩充产能。根据《科创板日报》6日讯,台积电董事长刘德音坦言,最近AI订单需求突然增加,先进封装产能需求远大过台积电现在产能,公司被迫急需增加产能,我们认为AI有望驱动算力层持续增长。 AI服务器需求旺盛,产业龙头已在规划更大生产基地。受益于AIGC和chatGPT所带来的人工智能热潮,人工智能服务器承载着AI新型算力基础设施的供给水平,底层支撑的算力侧需求大增,未来行业市场规模仍将保持快速增长。2)AI算力规模持续增长是带动液冷需求的因素之一,根据财联社,浪潮信息服务器产品线人士称“AIGC火热带来AI服务器需求量的爆增,3月份我们发现AI(服务器)市场出现几倍以上增长,以前客户关注点是能不能便宜点,现在是能不能用得上。” 800G光模块在手订单充足,中际旭创率先落地。6月4日,中际旭创表示,今年以来,公司已向海外重点客户持续交付与GPU相配套的800G产品。公司光模块产品在海外市场占有率处于行业领先地位。 我们认为,AIGC带来的算力需求正加速落地,供给端已加快产品迭代、扩大生产能力,在政策引导下,算力发展或形成上下合力,推动市场增长。 投资标的 英伟达、浪潮信息、中科曙光、光通信产业链、工业富联、海光信息、紫光股份、寒武纪、云赛智联、易华录、优刻得、昇腾算力、景嘉微等。 风险提示 AI技术迭代不及预期风险:若AI技术迭代不及预期,则对产业链相关公司会造成一定不利影响。 经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响。 行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。