英伟达是全球领先的GPU芯片制造商之一。公司是全球GPU龙头,市场份额遥遥领先。根据Jon Peddie Research发布的GPU市场数据统计报告,英伟达2022年全年PC GPU出货量高达3034万块,是AMD的近4.5倍;截至2022年四季度,在独立GPU市场,英伟达占据84%的市场份额,远超同业竞争公司。我们认为通过研究英伟达的发展路径和战略,能够帮助国内企业更好地了解GPU的应用和未来趋势,为国内企业提供宝贵的借鉴和启示。在本篇研究报告中,我们还原了英伟达所处不同发展阶段的行业背景,深入分析了三个阶段中英伟达通过实施何种战略超越了竞争者,形成了竞争优势。 研发为底、生态为径、AI为翼:研发实力是一家芯片设计公司的核心竞争力,英伟达从发展初期即重视研发生产力,以高投入换去高回报不断提升产品竞争力。2005年,AMD的研发费用为11亿美元,是英伟达的3.2倍左右,而到了2022年,英伟达的研发费用达到了73.4亿美元,是AMD的1.47倍。随着研发投入的不断增长,英伟达通过技术进步降低成本和产品价格,不断推出新的产品吸引更多消费者,优势逐渐凸显; 生态方面,英伟达推出CUDA平台,使得利用GPU来训练神经网络等高算力模型的难度大大降低,将GPU的应用从3D游戏和图像处理拓展到科学计算、大数据处理、机器学习等领域,这一生态系统的建立让很多开发者依赖于CUDA,进一步增加了英伟达的竞争壁垒;AI方面,人工智能的发展为GPU带来更大增长空间,英伟达抓住下游发展新机遇,推出AI加速卡,伴随以ChatGPT为代表的生成式AI大模型发展进入快速增长通道。 算力是AI芯片底层土壤,未来算力需求将呈爆发式增长。根据IDC数据,未来5年我国智能算力规模CAGR将达52.3%。AI芯片中,GPU占据主要市场规模。根据IDC数据,2022年国内人工智能芯片市场中,GPU芯片所占市场份额达89.0%。GPU作为市场上Al计算最成熟、应用最广泛的通用型芯片,应用潜力较大,其并行计算架构相较于其他AI芯片更加适合于复杂数学计算场景,支持高度并行的工作负载。 国产厂商加速布局,看好AI发展推动国产替代进程提速。在ChatGPT等概念影响下,AIGC关注度火热。未来AI应用的落地离不开庞大算力的支撑,也将推动算力产业链快速增长。据IDC,2021年中国AI投资规模超100亿美元,2026年将有望达到267亿美元,全球占比约8.9%,排名第二,其中AI底层硬件市场占比将超过AI总投资规模的半数。看好国产AI供应商在产业创新趋势以及国产替代背景下进入快速增长通道。 建议关注:(1)AI算力芯片:寒武纪、海光信息、景嘉微;(2)服务器产业链:工业富联、沪电股份、奥士康;(3)AI应用:大华股份、海康威视;(4)Chiplet:通富微电、长电科技、华海清科、长川科技、兴森科技。(5)C端AI应用:国光电器、漫步者;瑞芯微、晶晨股份、乐鑫科技、中科蓝讯。 风险提示事件:需求不及预期、产能瓶颈的束缚、大陆厂商技术进步不及预期、中美贸易摩擦加剧、研报使用的信息更新不及时。 1、英伟达:算力芯片巨头领跑AI时代 1.1公司简介:全球领先的GPU龙头厂商 公司是全球GPU龙头,市场份额遥遥领先。英伟达(NVIDIA)是一家全球知名的技术公司,成立于1993年,最初以图形处理器(GPU)起家,通过不断的创新和发展,逐渐成为了高性能计算领域的领导者。根据JonPeddie Research发布的GPU市场数据统计报告,英伟达2022年全年PCGPU出货量高达3034万块,是AMD的近4.5倍;截至2022年四季度,在独立GPU市场,英伟达占据84%的市场份额,远超同业竞争公司。 图1:引领GPU市场的巨头,英伟达的崛起和发展历程 英伟达的产品创新和迭代从未止步。自英伟达成立以来,其经历了多个重要的发展时间点。其中包括1999年推出全球第一款GPU、2006年发布Fermi架构、2012年发布Kepler架构、2016年推出AI加速器Tesla P100和Volta架构、以及2020年发布Ampere架构等。这些重要时间点的创新和进步,为英伟达在高性能计算、人工智能、虚拟现实等领域的发展奠定了坚实的基础。 图2:英伟达时间线 横向拓展丰富业务产品线,实现“CPU+GPU+DPU”三芯布局。英伟达的三芯战略侧重于在数据中心市场实现CPU、GPU和DPU三类硬件的布局,旨在全面提升竞争力,满足云计算、人工智能及机器学习等高端应用领域的需求。CPU的加入使英伟达能够更好地应对各种计算任务,尤其是那些需要快速逻辑判断和高度并行处理能力的应用。而DPU则针对数据中心和网络设备的需求,具有高效处理数据包和协议的能力,为英伟达的产品线增添了新的价值。通过将CPU、GPU和DPU集成到同一平台上,英伟达可以为客户提供更加全面、高效的计算解决方案。目前CPU+GPU的产品组合获得超级计算中心的采用并即将广泛部署于大型服务器,三芯战略初显成效。 图3:“CPU+GPU+DPU”业务布局 图4:英伟达三芯布局产品线 芯片架构是英伟达的技术核心,快速迭代的新架构为产品带来不断的创新与升级。自英伟达GPU问世以来,其架构经历了多个重要发展阶段。 2006年,Fermi架构在GPU计算领域实现了重大突破,Kepler架构进一步提高了能效比和GPU性能,并引入了动态并行处理技术。随后,Maxwell架构实现了更加节能和高效的设计,Pascal架构则引入了深度学习计算中的Tensor Core和NVLink技术,以及更多的AI加速功能。 Volta架构则实现了更高的计算能力和存储带宽,并引入了深度学习加速器Tensor Cores V100。Turing架构则进一步提高了光线追踪和图形渲染性能,而Ampere架构则在AI加速、性能和能效方面实现了重要进展。 每一代架构的创新和进步,都为GPU技术在高性能计算、人工智能、虚拟现实等领域的应用奠定了坚实的基础。 图5:架构发展历程 图6:产品及相应架构 1.2公司产品:多元化产品矩阵助力公司长期增长 英伟达产业布局多元化,解决客户不同需求。GPU产品为英伟达主要收入来源,收入占比稳定在80%以上。相比较于CPU,GPU在机器学习算法有天生的优势。英伟达一直专注于GPU的设计,同时由于GPU的并行计算能力,可以通过数千个计算核心进行深度学习,英伟达开始将服务和系统、软硬件和可编程算法结合在一起,提出CUDA架构。从下游应用来看,英伟达产品主要集中于游戏、专业可视化、数据中心以及自动驾驶领域: 1)游戏市场:英伟达提供的产品包括PC游戏的GeForce RTX和GeForce GTX,用于游戏和流媒体的SHIELD设备,用于云端游戏的GeForce NOW,以及用于专门控制台游戏设备的平台和开发服务; 2)专业可视化市场:英伟达除了加速GPU计算解决方案,同时也为汽车、娱乐、建筑工程、石油和天然气、医疗等行业引入新的解决方案; 3)数据中心市场:英伟达使用NVlink技术将多个GPU结合在一起,加速神经网络训练和推理。同时开发出DGX超级计算机,进行科学计算、深度学习和机器学习; 4)自动驾驶市场:英伟达Drive作为一个人工智能汽车平台,涵盖了从交通拥堵到机器人出租车自动驾驶的所有领域。2018年有超过370家自动驾驶汽车公司开始使用Drive,共同开发自动驾驶的人工智能系统。 图7:英伟达产品线总览 游戏业务:是英伟达主要产品线,作为基本盘见证了其里程碑式的革新。 英伟达在游戏业务领域持续不断的技术升级,以应对玩家日益增长的画质需求。游戏业务一直是英伟达的核心领域,每年都以引人注目的新产品展现其持续的创新力。与前一代产品相比,每一代新显卡都带来了显著的性能提升。 从核心数量来看,英伟达显卡产品的CUDA核心数量已从最初的640颗增长到现在的高达16384颗,技术上不断突破,包括实时光线追踪技术等。 另外,英伟达在游戏显卡市场上有着广泛的布局,从入门级到专业级,都提供了相应的产品。这一策略允许英伟达满足从独立游戏玩家到专业电竞选手的多元需求。 图8:英伟达游戏显卡重要时间点 图9:英伟达游戏显卡详细参数 数据中心:持续发力,高市占率源自于英伟达持续不断的研发与创新。英伟达长期占据高端GPU市场的领导地位,截至目前英伟达占据全球算力芯片90%的市场份额。高端芯片领域的霸主地位主要源自于公司不断的技术提升所形成强大的技术壁垒。从2017到2022这五年间,公司先后推出了Volta、Ampere、Hopper等针对高性能计算和AI训练的架构,以此为基础发布了V100、A100、H100等高端GPU。通过不断的技术革新,英伟达GPU产品向量双精度浮点算力已从7.8 TFLOPS增至30 TFLOPS。 图10:英伟达数据中心GPU发展历程 英伟达数据中心GPU在11年间从制程工艺到核心数量,各参数全方位提升。从2011年的TeslaM2090开始英伟达不断更新迭代数据中心产品,到了2022年发布的英伟达全新GPU产品NVIDIAH100,性能上已经出现了质的飞跃。此外,英伟达在数据中心的布局不仅仅停留在GPU,在CPU方面英伟达也全面发力,在2022年发布了首款CPU产品Grace。Grace内臵下一代Arm Neoverse内核,采用第四代NVIDIA NVLink,从CPU到GPU连接速度超过900GB/s,相当于目前服务器14倍的带宽速度;从CPU到CPU的速度超过600GB/s。并且Grace拥有最高的内存带宽,采用的新内存LPDDR5x技术,带宽是LPDDR4的2倍,能源效率提高了10倍,能提供更多计算能力。 图11:英伟达数据中心GPU及其参数 图12:英伟达Grace与x86+Hopper对比 自动驾驶业务:为英伟达提供中长期增长曲线。英伟达的自动驾驶SoC产品线以其高性能、高能效和创新技术而著称,致力于满足不断增长的计算需求。英伟达推出的自动驾驶SoC产品包括先进的Atlan和Orin芯片,它们集成了安培架构GPU核心、基于Arm的Grace CPU核心、深度学习和计算机视觉加速器单元以及BlueField DPU核心,以实现卓越的算力和性能。 英伟达的SoC产品线不断创新,为客户提供卓越的性能和可靠性,帮助推动未来智能驾驶和高度互联的汽车发展。 图13:英伟达自动驾驶芯片时间轴 最新款AtlanSoC算力获得指数级提升,为自动驾驶提供充足算力。2021年,英伟达推出了自动驾驶SoC Atlan,其单颗算力高达1000TOPS,是上一代Orin SoC(254TOPS)的近四倍。Altan还支持400Gbs(40万兆)网络和安全网关,可以满足高速通信需求。同时,Atlan可与为上一代芯片组编写的软件堆栈(如Orin或Xavier)兼容,使得汽车制造商和AV开发人员不需要重新设计软件就能利用新SoC的性能提升,大大提升使用的便捷程度。 图14:英伟达几代汽车芯片对比 可视化业务:技术革新助力卓越视觉与计算体验。在过去几年,英伟达专业可视化业务持续推出了一系列的技术革新,包括新的GPU架构(如Pascal、Volta、Ampere、AdaLovelace),更高效的显存技术(如GDDR6X),以及更加智能化的软件工具(如RTX Studio)。这些创新大幅提升了英伟达专业显卡在高性能计算、人工智能、虚拟现实等领域的性能和可靠性,为专业用户提供了更加卓越的视觉体验和计算能力。 图15:英伟达专业可视化产品重要时间点 英伟达专业显卡技术不断进步,性能显著提升。随着英伟达专业可视化显卡的不断升级,计算能力和相关性能得到了显著提升。从最初的几百万个CUDA核心、数百GB/s的显存带宽,到现在的数千万个CUDA核心、TB/s级别的显存带宽,英伟达专业显卡已经成为高性能计算、人工智能、虚拟现实等领域不可或缺的重要组成部分,为专业用户提供了更加卓越的视觉体验和计