鼎雄咨询 18th MEDIMTEIK NVIDIA G-SYNC 英伟达人工智能发展战略研究报告 鼎惟咨询战略创新研究院 2024年9月 引言 英伟达愿景使命 人工智能大模型的迅猛发展推动算力需求的高速增长,占据数据中心GPU市场98%这一绝对份额的英伟达,已经从曾经游戏显卡之王华丽转身成为人工智能时代“卖铲人” 英伟达的野心绝不仅限于此,英伟达致力于成为人工智能计算领或的领导者,创造下一个工业革命,用算力来驱动智能时代的到来,驱动整个社会的智能化转型,让算力渗透到所有的社会领域,成为人工智能时代基础设施的提供商。 02英伟达三芯战略 GPU(图像处理器)作为英伟达的核心产品,特别是在AI训练和推理、高性能计算以及图形染等领或,提供了强大的并行处理能力:CPU(中央处理器)的加入使得英伟达能够更好地应对需要快速逻辑判断和高度并行处理能力的应用;DPU(数据处理器)则专门针对数据中心和网络设备的需求,具有高效处理数据包和协议的能力。 通过集成CPU、GPU和DPU到同一平台上,英伟达的三芯战略为客户提供了一站式的解决方案,能够更好地满足现代数据中心对于多样化计算需求的挑战。 03英伟达四大业务 游戏业务是英伟达的基本盘,英伟达提供GeForceRTXGPU等针对个人电脑的显卡,SoC等针对游戏主机的显卡和GeForceNow为主的云游戏服务,目前游戏业务以“云游戏+AI为发展主线,不断强化RTX光线追踪和ACE虚拟数字人类生成两大关键技术,预计将在2025年发布AIPC芯片,进入高端笔记本电脑市场。 专业可视化业务主要聚焦于为设计和可视化专业人士提供先进解决方案。英伟达面向专业级和企业级市场提供Quadro系列和RTX系列GPU,面向创作者和专业开发者提 供6大版本的Omniverse实时协作平台,形成Omniverse生态系统,应用于电影制作、建筑设计、虚拟现实等众多领域。 数据中心业务是驱动英伟达市值增长的第一大业务。英伟达提供从边缘计算到云端的全方位产品和解决方案,包括最新架构的CPU、GPU、DPU芯片、DGX系统、高速 网络系列产品以及AIEnterprise等软硬件生态系统。英伟达持续强化五层算力体系,布局AI工厂,发布DGXSuperPOD超级计算机,引领下一代AI基础设施。未来, 数据中心业务也从面向传统云服务商发展到面向各国家私有云及电信云,推出Jetson平台,大力布局边缘计算领域。 汽车业务是英伟达极具未来潜力的关键业务。英伟达提供端到端的解决方案,包括Thor、Atlan汽车芯片、DRIVE软硬件及基础设施,赢得国内外广泛主机厂客户认可, 04英伟达应用场景 在医药领域,英伟达提供clareHoloscan计算平台,支持从医疗设备到边缘服务器的无缝连接,推动医学影像AI分析,与甲骨文,强生等代表性企业进行深度合作在汽车领域,英伟达提供DRIVE软硬件及Omniverse平台,赋能端到端的汽车自动驾驶解决方案,与特斯拉、小鹏等代表性企业进行深度合作 在机器人领域,英伟达提供Issac、Omniverse及Jetson平台,协助开发各类型机器人,并且前瞻布局具身智能,与比业迪、西门子等代表性企业合作。 05英伟达竞争策略 英伟达采用“三团队-两季度”的创新研发选代模式,即三个井行开发团队专注于独立的分阶段产品开发,确保公司每6个月推出一次新产品领先市场1-2个研发周期,使 得GPU的算力增长始终高于CPU的算力增长而无法被CPU集成,实现了计算机芯片产品品类的重新定义。 英伟达通过构筑软件生态、调动开发者、发掘应用场景对计算机形态进行渐进式改造,使得计算机从单纯的“CPU”形态逐渐演变为“CPU+GPU”形态,塑造计算机 形态向着有利于其自身发展的形态演进 06英伟达生态壁垒 CUDA软件生态系统包括了多个层面,从编程语言和API支持到性能分析和调试工具,再到丰富的库和框架,以及对多种应用领域的支持,覆盖AI和HPC领域,CUDA与英伟达的GPU硬件紧密结合,提供了最佳的性能和最优化的体验。 这种封闭的集成第略使得CUDA在性能上具有明显优势,构筑了软件覆盖率高、AI框架支持率高、细分行业渗透率高三大生态竞争壁垒,巩固了英伟达在AI和高性能计算 市场的领导地位。 通过提供全面的软件支持和优化,英伟达的GPU在训练和部署AI模型方面成为行业标准,使得英伟达在AI芯片市场中占据主导地位 供应链主导地位 英伟达充分利用数据中心对人工智能的无限需求,凭借自身的巨大产量和人工智能服务器所有技术和组件的超前领先地位,将网络组件、内存和其他组件都封装(CoWoS)到单个系统中,进而在供应链中占据主导地位。近日黄仁勋还透露,英伟达自主开发了很多技术,必要时,可弃用台积电,能让英伟达把订单转移给替代供应商。 为方便您的阅读请先解以下常见术语 A100 基于Ampere架构的高性能数据中心GPU 支持大规模AI训练和科学计算 Aerial 用于5G和边缘网络的AI平台 提升电信网络的性能和智能化 APIClara 组预定义的函数或协议,用于构建软件应用程序 用于医疗健康领域的A计算平台 支持软件开发和集成 提升医疗设备和应用的性能 CUDA ComputeUnifiedDeviceArchitecture的缩写,是NVIDIA的并行计算架构和编程模型。 用于开发GPU加速的应用程序和算法。 CUDACores CUDA计算单元,GPU中用于并行处理任务的基本处理单元 用于执行并行计算任务,加速计算患集型应用 CUDAKernel CUDA程序中执行的并行计算哟数。 用于在GPU上执行并行计算任务。 CUDAStreams CUDA的并行执行机制,允许多个任务在不同的流中并行处理。 用于提升并行计算的效率 CUDAToolkit 包含编译器、库、开发工具和文档的完整开发工具包,用于CUDA编程。 用于开发和优化CUDA应用程序。 cuLitho 用于半导体制造的计算光刻技术 提升芯片制造的精度和效率 cuOpt 用于物流和路径优化的AI工具 提高物流效率和降低成本 DeepLearningSDK NVIDIA提供的软件开发工具包,包含用于深度学习的库和工典 用于开发和优化深度学习应用。 DGX 专为数据中心设计的高性能GPU 提供大规模AI训练和推理能力 DGX NVIDIA的深度学习超级计算机平台,集成了高性能GPU和优化的软件栈。 用于高性能的深度学习训练和推理。 DLSS AI超分辨率算法,通过较低分辨率输入预测更高分辨率输出 提升游戏赖率和图像质量 DPU 专用于数据处理的处理器 提升数据中心网络和存储性能 DRIVESim 用于自动驾驶汽车模拟训练的软件平台 提高自动驾驶系统的安全性和效率 术语定义用途 众 ECC EGX 用于边缘计算的GPU平台 实现实时AI推理和分析 FP16(HalfPrecision) 16-b计浮点数精度,用于加速深度学习模型的训练和推理 用于提高计算效率和减少内存占用 GeForce 面向游戏娱乐领域的显卡系列 提供高性能游戏体验 GPU 专门用于处理图形和视觉计算任务的处理器 提供图形擅染和视觉计算能力 GPUDirect G-SYNC NVIDIA技术,允许直接在GPU之间传输数据,从而减少CPU和主内存的干预同步显示器刷新率与显卡输出,减少画面撕裂 用于提升GPU之间的数据传输效率,改善游戏和视频的视觉质量 HGX 用于高性能计算的GPU平台 支持科学研究和复杂计算任务 IGX 专为智能边缘设备设计的计算平台 提供安全、高效的边A计算 Isaac 用于机器人开发的软硬件平台 一种能够检测和修正常见的数据损坏类型内存提升数据完整性和系统稳定性 简化机器人的设计开发和部署鼎雄咨询 鼎椎咨询13 为方便您的阅读请点图片横屏试货 术语 Jetson 定义 专为机器人和边缘设备设计的计算平台 用途 提供AI和计算机视觉能力 Merlin用于构建推荐系统的AI框架提高推荐系统的性能和准确性 Metropolis用于视频分析和监控的AI平台提升视频分析的智能化水平 MIG允许单个物理GPU被划分为多个独立实例的技术提升资源利用率和灵活性 NeMo用于生成式AI应用开发的架支持自然语言处理和语音合成 NVIDIAGFE提供显卡驱动更新,性能监控和游戏优化的工具简化显卡管理和游戏设置 NVIDIAReflex降低延迟,提升竞技游戏体验优化FPS游戏中的操作响应 NVLink用于连接GPU和CPU或其他GPU的高速通信接口提升数据传输速度和系统性能 NvSwitchNVIDIA提供的高带宽交换技术,用于在多个GPU之问提供高速连接,用于实现GPU集群中的高效数据交换和并行计算 用于3D设计和实时协作的平台提供虚拟世界构建和模拟的能力 Quadro RAPIDS 用于数据分析和机器学习的加速平台 提高数据处理速度和效率 Replicator 用于生成合成数据的AI工具 提高AI模型训练的质量和效率 Riva 用于语音识别和合成的A/平台 提升语音交互的自然度和准确性 RTX 一种用于实时渣染画面,模拟接近现实的光照、阴影等效果的技术 增强游戏的沉浸感,提升画面通真度 RTXAIPCS 配备RTX显卡的A增强型个人电脑 支持A加速的创意和工作流程 SMP SymmetricMultiprocessing,对称多处理,指多个处理器共享内存和系统资源。 用于提升计算性能,支持多线程和多任务处理 Studio 为创意专业人士设计的软硬件平台 提供专业级的内容创作工具 SuperNIC 高性能网络接口卡 提升网络通信速度和效率 TensorCore NVIDIAGPU中专为加速深度学习运算而设计的核心。 用于提升深度学习模型的训练和推理性能。 TensorRT NVIDIA提供的高性能深度学习推理优化库。 用于优化和加速深度学习模型的推理过程。 Tesla 面向数据中心和高性能计算的GPU系列 提供强大的计算和数据处理能力 TGP 显卡的设定功耗,用于选择合适的电源 电源选择和功耗管理 Tokkio 用于创建虚拟形象和数字人的平台 提供虚拟形象创建和管理的能力 Triton 用于AI模型推理的服务平台 提供高性能的A推理能力 V100 基于Volta架构的高性能数据中心GPU 提供高性能计算和A推理能力 VGPU 虚拟化技术,允许多个虚拟机共享物理GPU资源 鼎咨询14 Omniverse 面向专业设计和可视化的显卡系列提供精确的颜色再现和高质量的图形渣染 发展历程 -发展阶段 -市场表现 发展价段英伟达创立至今经过了创业初期、GPU定✎时期、GPU送代时期A萌芽时期、A精焊时五 个阶段,并在2024年6月19日成为全球市值最高✁公司 2022:公布最新自动驾驶技术平台Drive 2007:推出TeslaGPU2012:发布基于Kepler架构✁GPUHyperion9:发布云原生Al模型和服务 2009:在第一届GPU技术大会2013:发布首款完全继承✁4GLTEOmniverseAvatarCloudEnginr(ACE) 1995:推出公司首款产品NV1上发布代号为"Fermi”✁新移动处理器Tegra4i:面向游戏玩家2023:推出新代GH200GraceHopper超级芯 代CUDAGPU架构推出GeForceGTXTITAN片,同时推出基于GH200构✁✁新服务器设计 1997:推出全球首款128位3D2011:推出全球首款双核移动处理2014:发布192核超级芯片TegraK1,2024:推出NVIDIABlackwell平台,以万亿参 处理器R/VA128器Tegra2推出Maxwell(第10代架构)数规模推动A/计算✁新时代:6月,英伟达市值 登顶全球第一超越微软和苹果 1993-1997 创业初期 2007-2014 GPU送代时期 椎咨询 2022-2024 AI辉煌时期 1998-2006T GPU定义