您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东吴证券]:从硬件GPU设计到软件CUDA+Omniverse开发,建立人工智能和元宇宙生态系统 - 发现报告
当前位置:首页/公司研究/报告详情/

从硬件GPU设计到软件CUDA+Omniverse开发,建立人工智能和元宇宙生态系统

2022-05-27李晗玥东吴证券望***
从硬件GPU设计到软件CUDA+Omniverse开发,建立人工智能和元宇宙生态系统

英伟达高瞻远瞩,积极发展软件工具链,试图在未来拥有广阔市场空间的人工智能和元宇宙领域形成生态系统,实现对硬件芯片的绑定,筑牢行业壁垒。与英特尔和AMD(超威半导体)等以芯片设计为主的公司相比,我们认为英伟达之所以享有高估值,主要因为其已经不仅仅是芯片设计公司,而是软硬件并重的、形成生态系统的公司。英伟达对于扩展GPU的使用场景非常重视,以人工智能行业为例,2006年在英伟达意识到GPU并行计算的优势后,就开始投入巨资开发CUDA这一软件工具链,让人工智能行业的研究者免费使用该软件来调用GPU的计算资源,这使得英伟达成为人工智能中深度学习的训练和推理领域的重要推动者,因此从人工智能行业发展开始,人工智能产业人员就在使用英伟达的软硬件套装,这些领域很难有动力使用英伟达之外的产品;英伟达也将这种软硬件并重的模式推向元宇宙(Omniverse)等新领域。我们认为,在以云计算、自动驾驶等人工智能和以数字孪生、虚拟人为代表的元宇宙领域,英伟达有可能成为通用硬件平台+软件工具生态的供应商,类似于智能手机中的高通芯片+安卓操作系统的地位,行业壁垒很高。 由于GPU架构的使用场景越来越丰富,我们认为英伟达潜在的市场空间(TAM)是现有传统业务的4倍。我们认为其传统的消费者(游戏)业务的TAM为1000亿美元左右,目前正在快速扩张的数据中心领域TAM在1500亿美元左右,这是英伟达目前主要的营收领域。展望未来,以下将是英伟达发挥巨大空间的领域:在逐渐显露出竞争优势的汽车芯片TAM为3000亿美元左右;英伟达计划组成GPU+DPU+CPU的产品矩阵,未来的云服务器领域TAM在3000亿美元左右;在元宇宙时代可能大放异彩的Omniverse平台,其TAM在1500亿美元左右。 盈利预测与投资评级:我们预计,随着英伟达在数据中心(三年复合增速52%)、汽车(三年复合增速67%)以及专业显示领域(三年复合增速51%)营收快速增长,且ToB利润率会略高于ToC业务,其高PE会得到快速消化。我们按照FY2025测算的239亿美元的净利润为基础,以8%折现到FY2022,考虑到公司在新兴领域的龙头地位和稀缺性,给予公司50倍PE,其估值为9486亿美元,对应当前目标价为374美元,首次覆盖,给予买入评级。 风险提示:国家政策风险;法律风险;自身技术风险;竞争者风险。 F 1.公司历史及业务简介 1.1.GPU简介 多核心的并行结构GPU比少核心串行结构的CPU更适合处理图形图像(矩阵结构)信息。CPU(Central Processing Unit,中央处理器)的功能主要是解释计算机指令以及处理计算机软件中的数据,是计算机的核心大脑,可以处理计算机遇到的所有指令。 GPU(Graphics Processing Unit,图形处理器)是图形计算的重要元件,主要用来处理与与图形图像相关的数据,在高端PC中通常会有独立GPU,以获得更好的视觉体验。 他们二者的区别主要是,CPU通常有4个、8个或16个强力ALU核心(arithmetic logic unit,算术逻辑单元),适合做复杂的通用串行任务;而GPU可能有数千个简单ALU核心,适合做简单特定的并行任务。我们通过以下的例子来说明CPU和GPU的差异:CPU就像一个大学生,可以进行微积分等复杂计算,但若要在短时间内完成几万道加减算数问题,也是很难办得到的;而GPU就像几百个小学生,虽然都不会微积分等复杂计算的能力,但人数多,可以在很短时间内完成几万道加减算数问题。也有例子把CPU比作跑车,GPU比作大卡车,对于将少量货物从A运到B来说,是作为跑车的CPU更快;但如果货物非常多,那么作为跑车的CPU需要往返的次数远远多于作为货车的GPU,作为货车的GPU虽然完成一次任务较慢,但是可以携带更多的货物,其效率会高于CPU。 总而言之,对于复杂的单个计算任务来说,CPU的执行效率更高,通用性更强;而对于图形图像这种矩阵式多像素点的简单计算,更适合用GPU来处理,但通用性较弱。 图1:CPU的基本结构及原理 图2:GPU的基本结构及原理 GPU按接入方式分为独立GPU和集成GPU;按照应用端划分为移动GPU、服务器GPU和PC GPU。GPU是图形处理单元,在PC(个人电脑)早期,图形数据较为简单,主要都是由CPU来进行图形处理。随着图形显示规模的增加,CPU已经很难分出更多精力来处理图形信息,而且CPU的架构决定了其处理图形信息的效率是偏低的,因此逐渐发展出了专门处理图形信息的GPU。英伟达专做GPU,开发了独立于CPU的GPU;英特尔作为CPU的霸主,开发了寄生于CPU芯片上的GPU单元,被称为集成GPU。通常来讲,独立GPU的性能都要优于集成GPU,在对图形实时处理要求不高的 F 日常办公领域,使用普通的集成GPU即可;在对图形实时处理能力要求很高的游戏及设计领域,一般都需要使用独立GPU。随着移动设备的发展,GPU也从PC端扩展到了移动端,高通骁龙以及苹果的A系列芯片都开发了相应的GPU芯片模块。 图3:GPU的分类 随着AI以及云计算的兴起,具有并行计算架构的GPU具有更高的效率,这也使得GPU被应用到AI及云计算等数据处理之中。这是一个全新的领域,拥有巨大的成长空间。值得一提的是,市场上还存在着比GPU专用程度更高的芯片,包括FPGA(Field-programmable gate array,可编程逻辑阵列)和针对某一类AI计算的ASIC(Application-specific integrated circuit,特定场景芯片),包括谷歌推出的TPU(张量计算单元)和特斯拉推出的NPU(神经网络计算单元),虽然在某些特定计算上效率更高,但目前这些芯片的使用场景比较单一,市场规模还较小。 图4:常见芯片特点总结 1.2.英伟达发展历史 英伟达(NVIDIA)是一家以GPU(Graphics Process Unit,图形处理单元)芯片设计起家的人工智能计算公司。公司创立于1993年,总部位于美国加利福尼亚州圣克拉拉市。美籍华人Jensen Huang(黄仁勋)是创始人兼CEO。1999年,NVIDIA定义了GPU,GPU的出现被业界视为现代计算机图形技术的开端。英伟达于1999年1月在纳斯达克挂牌上市,在2000年它收购了曾经在90年代称霸图形显示市场的3dfx公司的知识产权,逐渐占据图形显示市场的优势地位。到2021年为止,在消费PC领域,能够量产GPU的公司只有英伟达、AMD和英特尔,其中英特尔主要是以集成GPU为主, F AMD既有集成GPU也有独立GPU,英伟达主要是独立GPU。在独立GPU领域,英伟达2021Q1占据81%的市场份额,处于绝对的领先地位。 公司20多年来始终引领GPU行业的发展,将GPU的主要应用场景从游戏以及画图等图像显示扩展到了以AI、云计算等大数据相关的并行计算领域。英伟达保持着两年升级一次GPU架构的步伐,不断提高GPU的性能。在英伟达GTC 2020主题演讲中,NVIDIA宣布推出安培(Ampere)架构,这是NVIDIA发布的第八代GPU架构,包含超过540亿个晶体管,性能相较于前代提升了高达20倍,也是NVIDIA 8代GPU历史上最大的一次性能飞跃。 安培架构的最新一代RTX30系列游戏GPU和AI计算GPU A100作为各自领域的代表产品,继续推动着相关领域的发展。 图5:英伟达GPU发展历史 1.1.英伟达业务简介 按照FY2022(对应公历2021.1~2022.1)的年报分法,英伟达有消费者(游戏)业务Gaming、数据中心业务Data Center、汽车业务Auto、专业解决方案业务Professional Visualization以及OEM和其他业务OEM&Others,英伟达主要为这些领域提供GPU芯片及相应的软件工具链。从消费者行为来看,在PC端购买独立GPU的主要目的是为了体验高性能游戏,因此英伟达将PC端GPU的销售业务称之为游戏业务。游戏业务一直是英伟达的主营业务,在各板块中营收排名领先;随着AI和云计算的不断兴起,英伟达逐渐将GPU打造为AI和云计算提供算力的底层芯片,这部分与AI和云计算相关的业务被称为数据中心业务。英伟达数据中心业务营收从2020年以来迎来迅速增长,我们预计在2025年左右将成为营收规模最大的板块;汽车智能化对算力需求的提高,英伟达也将GPU芯片装入车辆中为其提供高算力。随着汽车智能化的不断提速,我们预计英伟达汽车业务营收也会快速增长,成为公司的一个重要板块。 F 图6:英伟达分业务的历史营收变化 2.传统业务:消费者(游戏)相关业务保持稳定增长 2.1.英伟达GPU五年来持续占据PC独显六成以上市场 由于疫情导致的居家时间延长,公司GPU量价齐升,FY2022Q2游戏相关营收同比大增85%,单季收入首次超过30亿美元。英伟达的GPU在PC端是以独立显卡的形式存在,通过独立显卡可以实现高帧率高分辨率3A游戏、专业绘图等应用。独显领域是一个壁垒极高的市场,经过20多年的充分竞争后,目前仅有英伟达、AMD可以推出相关产品,而英伟达占据绝对的领先优势。据研究机构Jon Peddie Research报道,2021Q1英伟达在PC独显市场占据81%的市场份额(2020全年为77%)。 图7:全球台式机GPU市场份额变化(单位:百万片) 以每两年更新一次架构、每半年性能翻倍的速度,持续引领消费级GPU市场。2020 F 年9月2日,英伟达发布了新一代显卡RTX30系列,与前一代RTX20系列相比,采用了全新的安培架构,在核心数、显存、频率等性能都有了大幅度提升。RTX30的高算力加上英伟达的DLSS(Deep Learning Super Sampling,深度学习超采样)技术,大大提高实际场景的运算力(在算力不变的情况下提高帧率),使得英伟达显卡深受游戏玩家的喜爱。在中国,RTX30系列中的RTX3080由发售价的5499元被一路炒高至18000元左右,足见其火爆程度(虽然部分原因是受到数字货币“挖矿”抢货的影响)。英伟达以半年性能提升一倍的“黄氏定律”牢牢占据GPU的领导者地位。截止到2021年3月,英伟达的各系列GPU在性能排行的前20名中占据了包括第一名在内的14个席位,可以看出英伟达在GPU领域的霸主地位。 图8:截止到2021年3月的GPU排行榜 F 图9:英伟达DLSS技术展示 2.2.借助Bluefield能力,发力云游戏Geforce Now业务 云游戏是以云计算为基础的游戏方式,在云游戏的运行模式下,所有游戏都在服务器端运行,并将渲染完毕后的游戏画面压缩后通过网络传送给用户。在客户端,用户的游戏设备不需要任何高端处理器和显卡,只需要基本的视频解压能力就可以,因此其市场潜力很大,据Newzoo 2021年3月发布的报告预测,2023年全球云游戏市场收入可能达到51亿美元。但目前主要受限于网络延迟以及服务器延迟等方面,市场尚处于初期阶段。除英伟达外,目前还有微软、谷歌、索尼、腾讯以及网易等也在拓展云游戏业务。 英伟达云游戏平台Geforce Now采用Bluefield架构,解决云游戏服务器的延迟问题。对于云游戏来说,延迟是最亟待解决的问题。而控制延迟的关键,不仅需要良好的通信网络能力,更为重要的是对云端服务器的数据处理特别是图形相关的处理速度。英伟达利用其在数据中心的经验,优化了服务器架构,推出了英伟达云游戏平台Geforce Now,采用RTX服务器来实现更低延迟(整体延迟小于100ms),使云游戏体验得到了优化。由于目前云游戏仍受限于网络延迟,整个市场尚不成熟,但随着基础设施的不断发展,此项业务将为英伟达带来未来全新增长空间。 F 图10:英伟达云游戏Geforce Now采用Bluefield架构来减小延迟 3.成长业务:数据中心成为云和AI领域基础设施,营收迅速扩大 英伟达成为云计算和AI这个