您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:CUDA生态仍然至关重要 - 发现报告
当前位置:首页/行业研究/报告详情/

CUDA生态仍然至关重要

信息技术2023-06-18刘高畅国盛证券比***
CUDA生态仍然至关重要

计算机 CUDA生态仍然至关重要 以软件定义硬件,CUDA护城河高筑。1)GPU于20世纪末正式面世,主要针对图形处理设计,对应采用着色语言编程,程序员被迫将算法表达成图形流水线概念,学习曲线高、编程复杂性高、并行计算效率低。 2)2006年11月,代号G80的革命性产品NVIDIAGeForce8800面世,彻底改变GPU内核的硬件架构,采用统一渲染结构,目标直指通用计 证券研究报告|行业周报 2023年06月18日 增持(维持) 行业走势 算。伴随G80发布,CUDA编程模型横空出世,提供了硬件的直接访问计算机沪深300 接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问。软硬结合,GPU正式打开高性能计算大门。3)除了架构革新,CUDA还具备成本低、门槛低、兼容性高、生态广等多重优势。根据量子位报道,自CUDA推出以来,英伟达在将GPU转化为更通用的计算工具上投入了将近100亿美元。英伟达通过押注CUDA,为自身GPU业务构筑起高护城河。 AIGC时代,算法依旧快速变化,需要最广泛的生态支持。1)自OpenAI发布GPT以来,我们认识到,当前的AIGC算法已经具备了真实复刻和创造某些通用内容的能力,但真正落地到具体场景和应用,仍需 大量的算法优化。2)面临大量的、多样性的算法需求,为了更好发挥硬件的性能效率,广泛的开发者生态必不可少,CUDA或成为目前最优解。截至2022年底,CUDA在全球共有380万开发人员使用,同比上年底增速约27%,仍在快速扩张;同时,公司已通过Inception项目与数百所大学和13000多家初创公司合作,传播人工智能。时至今日,CUDA 已经历12个大版本更新,工具完备、功能丰富,广泛用于天文学、生物学、化学、物理、数据挖掘、制造、金融等领域的GPU加速程序。我们认为,CUDA生态仍将在未来相当一段时间内,在全球占据主导地位。随着大模型与部分应用逐步走向成熟,算力可部分由AMD或ASIC芯片实现补充。 算力持续短缺,CUDA生态厂商大有可为。1)全球来看,根据福布斯新闻,马斯克预计未来GPU需求量还会增至当前的3-5倍,算力需求有望持续高景气。而从供给端来看,英伟达作为AI算力龙头,正将部分产品 交给英特尔代工,并计划在下半年大幅增加整个数据中心产品系列(包括InfiniBand和BlueField-3DPU)的供应,彰显其产能饱满,全球算力供不应求。2)国内代表厂商同样看到了AIGC引爆的算力需求,有望加速规划更大产能,例如,台积电表示AI订单需求突然增加、急需增加产能;浪潮信息正规划更大规模的液冷生产基地;中际旭创已向海外重点客户持续交付与GPU相配套的800G产品。3)我们认为,AIGC带来的算力需求正加速落地,供给端已加快产品迭代、扩大生产能力,在政策引导下,算力发展或形成上下合力,推动市场增长。 投资标的:英伟达、浪潮信息、中科曙光、光通信产业链、工业富联、海光信息、紫光股份、寒武纪、云赛智联、易华录、优刻得、昇腾算力、景嘉微等。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 48% 32% 16% 0% -16% -32% 2022-062022-102023-022023-06 作者 分析师刘高畅 执业证书编号:S0680518090001邮箱:liugaochang@gszq.com 相关研究 1、《计算机:加大重视金融AI》2023-06-17 2、《计算机:AI培训产业链》2023-06-12 3、《计算机:算力持续短缺》2023-06-11 请仔细阅读本报告末页声明 内容目录 1.以软件定义硬件,CUDA护城河高筑3 2.AIGC时代算法依旧快速变化,需要最广泛的生态支持6 3.算力持续短缺,或可更关注CUDA生态厂商8 投资标的9 风险提示9 图表目录 图表1:G80体系架构3 图表2:GPU计算应用4 图表3:部分CUDA使用教材5 图表4:2005-2022年英伟达研发费用5 图表5:CUDA开发者数量6 图表6:Inception项目创业公司数量6 图表7:CUDA工具包历次版本更新7 图表8:CUDA应用领域7 1.以软件定义硬件,CUDA护城河高筑 20世纪末GPU正式面世,专注图形处理,可编程性逐步提升。1999年,NVIDIA公司正式发布GeForce256图形处理芯片,首次提出GPU概念,这时的GPU还只是一种专 用的图形流水线硬件,且所有的硬件模块都是固定不可编程的。2001年,GPU首次引入了可编程性,即引入了顶点着色器的概念,自此,出现了一些GPU通用计算的设计算法。2003年,像素着色器的出现,使得GPU计算能力得到了更大的释放。2004年,以NVIDIAGeForce6800为代表的新一代GPU,开始支持分支操作,包括循环和子函数调用,这对于GPU通用计算是一个重要突破,GPU开始用于大量的通用计算领域。 由于着色语言编程复杂性高,GPU并未能在通用计算领域得到普及。1)根据《CUDA在高性能计算中的应用》,传统的GPU是专为图形处理而设计的,其内部的体系结构也 几乎完全按照图形流水线的方式设计,每个硬件模块代表了一个图形流水线级。2)这时,编程语言均为一种着色语言,在图形流水线的绘制过程中完成自定义函数功能。这类GPU编程语言的学习曲线高、编程复杂性高、效率低,程序员们被强迫把他们的算法表达成图形流水线的概念,使得这类GPU编程语言的通用计算被限制于一些高级图形开发者所使用。虽然出现了很多通用计算的工作,却并没有让GPU在通用计算领域得到普及。 受制于硬件的具体规格参数,可编程性更多掌握在GPU厂商手中。1)GPU编程最关键的是应用程序接口或编译器以及驱动,而一般人无法获得硬件的具体规格参数,因此 这两个编程关键需要GPU厂商提供,GPU的可编程性很大程度在GPU厂商手中。2)当相应指令集完备后,编程环境更完善,硬件的规格细节开放及构成一定标准的兼容了,GPU或有望普及。 革命性产品G80推出,目标直指高性能计算。2006年11月,代号G80的NVIDIAGeForce8800面世,彻底改变了GPU内核的硬件架构,抛弃传统图形流水线设计方式, 采用统一渲染架构,统一了GPU计算单元,设计完全按照通用计算架构设计,带来了更强大的运算能力,目标直指通用计算,尤其是高性能计算。 图表1:G80体系架构 资料来源:《CUDA在高性能计算中的应用》,国盛证券研究所 针对硬件提供直接访问接口,大幅提升GPU并行计算效率。CUDA(ComputeUnifiedDeviceArchitecture)是跟随2006年11月GeForce8800显卡面世而发布的,是一个完 整的GPGPU解决方案,提供了硬件的直接访问接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问。 图表2:GPU计算应用 资料来源:英伟达官网,国盛证券研究所 除了架构革新,CUDA还具备低成本、兼容高、生态广等多重优势。 1)CUDA本身免费,安装过程简洁明确,开发者几乎无需承担任何额外成本。 2)CUDA采用当时已经流行的C/C++语言作为编程语言,提供大量的高性能计算指令开发能力,开发者学习门槛低,使用效率高。 3)在培养生态方面,当时NVIDIA决定让消费级及高端级GPU均支持CUDA开发,最大限度推广CUDA生态。同时,NVIDIA还尽力与大学等科研教育机构合作,开设CUDA相关课程,尽早培养CUDA使用习惯。 图表3:部分CUDA使用教材 资料来源:当当网,国盛证券研究所 累计投入研发或近百亿美元,CUDA护城河高筑。根据量子位报道,自CUDA推出以来,英伟达在将GPU转化为更通用的计算工具上投入了将近100亿美元。英伟达通过押注CUDA,为自身GPU业务构筑起高护城河。 图表4:2005-2022年英伟达研发费用 研发费用(亿美元) 80 70 60 50 40 30 20 10 0 200520062007200820092010201120122013201420152016201720182019202020212022 资料来源:Wind,国盛证券研究所 2.AIGC时代算法依旧快速变化,需要最广泛的生态支持 AIGC时代来临,从模型到应用,仍需要大量的算法支持。自OpenAI发布GPT以来,我们认识到,当前的AIGC算法已经具备了真实复刻和创造某些通用内容的能力,但真正落地到具体场景和应用,仍需大量的算法优化,且更专业的垂直场景或需要结合行业 know-how,进行更落地的算法支持。 广泛的开发者生态必不可少,CUDA或是最优解。1)面临大量的、多样性的算法需求,为了更好发挥硬件的性能效率,广泛的开发者生态必不可少。2)而CUDA在全球GPU市场中,生态或最为广泛。根据Nvidia2022年年报,全球有380万开发人员使用CUDA 和其他软件工具来帮助公司在目标市场部署其技术;同时,公司通过Inception项目与数百所大学和13000多家初创公司合作,传播人工智能。此外,英伟达的深度学习研究所提供有关如何使用其加速计算平台在应用程序中设计、训练和部署神经网络的最新技术的指导。 图表5:CUDA开发者数量图表6:Inception项目创业公司数量 400 350 300 250 200 150 100 50 0 开发者(万人) 2020/012021/012022/012023/01 14000 12000 10000 8000 6000 4000 2000 0 2020/01 创业公司(家) 2021/012022/012023/01 资料来源:英伟达财报,国盛证券研究所资料来源:英伟达财报,国盛证券研究所 时至今日,CUDA已经历12个大版本更新,工具完备、功能丰富。1)根据英伟达官网介绍,自2006年推出以来,CUDA已通过数以千计的应用程序和已发表的研究论文得到广泛部署,并得到笔记本电脑、工作站、计算集群和超级计算机中超过5亿个支持 CUDA的GPU的安装基础的支持。2)CUDA工具包已迭代12个大版本、数十个小版本,广泛用于天文学、生物学、化学、物理、数据挖掘、制造、金融等领域的GPU加速应用程序。 图表7:CUDA工具包历次版本更新 时间版本 2010年3月CUDAToolkit3.0 2007年6月CUDAToolkit1.0 2008年8月CUDAToolkit2.0 2011年5月CUDAToolkit4.0 2012年10月CUDAToolkit5.0 2015年3月CUDAToolkit7.0 2014年4月CUDAToolkit6.0 2016年9月CUDAToolkit8.0 2017年9月CUDAToolkit9.0 2020年6月CUDAToolkit11.0 2018年9月CUDAToolkit10.0 2022年12月CUDAToolkit12.0 资料来源:英伟达官网,国盛证券研究所 图表8:CUDA应用领域 资料来源:英伟达官网,国盛证券研究所 我们预计,CUDA生态仍将在未来相当一段时间内,在全球占据主导地位。 3.算力持续短缺,或可更关注CUDA生态厂商 算力供应短缺的问题已经成为行业的普遍热点,根据福布斯新闻,马斯克预计,未来 GPU需求量还会增至当前的3-5倍之多。 英伟达部分产品交给英特尔代工,或彰显需求旺盛、产能饱满。1)根据财联社报道, 《科创板日报》5月30日讯,英伟达CEO黄仁勋今日表示,公司供应链将力求多元化, H100是由台积电代工生产,部分产品也由三星代工生产,并即将开放委托英特尔代工。 2)我们认为,此举或彰显下游算力需求的旺盛程度。 数据中心业务超预期高增,Q2营收指引高于一致预期50%。1)随着ChatGPT发布,轰动的人工智能领域对芯片算力产生较大需求,英伟达因可以提供训练大量文