热门搜索：

VR、机器人、自动驾驶：Blackwell之外业务不断发展

2024-03-21王大卫、童钰枫交银国际c***

AI智能总结

英伟达 (NVDA US) GTC大会于3月18日如期举行，新硬件产品架构、软件服务模式和不同应用的前景引发市场关注。Blackwell新架构在性能上比之前的Hopper架构有很大升级，集成两个独立制造的裸晶，具有2080亿个晶体管和192GB HBM3e内存。此外，英伟达还发布推理服务NIM和CUDA-X微服务，以及与苹果的合作项目Omniverse Cloud和GR00T项目，人形机器人和自动驾驶等应用也受到关注。尽管下游需求尚存分歧，但2025年或仍有20%增长，股价或在2025年有更明确需求的情况下出现进一步变化。

交银国际研究消息快报科技 2024年3月20日英伟达(NVDAUS) VR、机器人、自动驾驶–Blackwell之外业务不断发展 英伟达GTC于当地时间3月18日如期举行。此次活动万众期待，18000人的场地座无虚席。虽然外界对本次活动发布的内容早有预期，我们通过总结新硬件产品架构、软件服务模式和不同应用的前景，对生成式人工智能后续的技术发展和应用的铺开保持积极态度。 新产品架构Blackwell符合市场预期：虽然具体的产品效果仍需实践检验，但Blackwell新架构在性能上比之前的Hopper架构有很大升级。Blackwell采用台积电4nm制程，整合两个独立制造的裸晶。基于Blackwell的B200共有2080亿个晶体管，通过10TB/秒的芯片到芯片链路连接成单个统一的GPU。内存方面，Blackwell搭载192GBHBM3e，和之前AMD所发布的MI300的配置相同。采用Blackwell架构的GPU系列产品包括B100、B200和GB200。其中B100只适配于之前发布的HGX和DGX平台。GB200集成了两个B200GPU与一个GraceCPU，提供20PFLOPS的FP4算力。基于Blackwell的AI算力将以名为DGXGB200的服务器芯片形态提供给用户，结合36颗CPU和72颗GPU。这些芯片通过NVLink5.0连接，NVLink5.0为1.8TB/s双向吞吐量，一个超级计算机或可配置8块DGXGB200，确保多达 576个GPU之间的无缝高速通信。 软件新产品加高护城河：微服务是软件的关键词。英伟达首次发布推理服务NIM，公司的销售策略是让客户购买基于NVDA服务器（搭载之前几代GPU产品）的推理微服务，价格为每个GPU4,500美元/年。我们认为，NIM产品很好的解决了在GPU供给不足情况下推理应用不断增长的需求。另外，新发布的CUDA-X微服务亦可以使得训练的微调更加便捷。 AR/VR/MR、人形机器人、自动驾驶等各类应用纷至沓来：英伟达深化与苹果的合作，NVDAOmniverseCloud将可以连接到苹果VisionPro。该服务允许企业将3D应用中的交互式通用场景描述串流传输到AppleVisionPro头显中，为数字孪生等应用服务。公司公布了GR00T项目，旨在为人形机器人提供及一个基础模型。GR00T硬件基于英伟达ThorSoC芯片，搭载Blackwell架构下8比特800TFLOPS算力。我们认为，人形机器人或是生成式人工智能算法在人机互动模式方面一个新的平台。英伟达同时发布了下一代车载计算芯片系统DRIVEThor，预计明年投产。公司宣布了与多家中国车企的合作扩展，包括比亚迪、小鹏以及广汽埃安旗下的Hyper品牌。 我们依然保持乐观，认为2025年下游需求依然强劲，相较2024年或仍有20%增长。股价在最近一段时间震荡整理，或在2025年有更明确需求的情况下出现进一步变化。王大卫,PhD,CFA Dawei.wang@bocomgroup.com (852)37661867 童钰枫 Carrie.Tong@bocomgroup.com (852)37661804 交银国际研究海外科技系列英伟达(NVDAUS)-成长性强，能见度高，市场或仍低估(2024-02-28) 英伟达(NVDAUS)-VR、机器人、自动驾驶–Blackwell之外业务不断发展(2024-03-20) 英伟达(NVDAUS)-下游需求尚存分歧–英伟达报告客户反馈(2024-03-20) 此报告最后部分的分析师披露、商业关系披露和免责声明为报告的一部分，必须阅读。下载本公司之研究报告，可从彭博信息：BOCM或https://research.bocomgroup.com GTC大会要点北京时间3月19日凌晨4点，一年一度的英伟达GTC开发者大会拉开帷幕。英伟达CEO发表了名为“见证AI的颠覆时刻”的主题演讲，也在会上推出了新一代架构Blackwell、新款旗舰人工智能芯片B200/GB200、推出企业软件订阅产品NIM以及针对VisionPro的新服务、GR00T的人形机器人等见证AI颠覆时刻的产品。我们对其中最为关键的产品和技术进行了梳理。推出新一代架构Blackwell Blackwell作为本次大会的重磅产品，相比Hooper，在性能上有较为明显的进步。 Blackwell采用台积电4nm制程，整合两个独立制造的裸晶（Die），基于Blackwell的B200共有2080亿个晶体管，具有两个十字线极限GPU芯片，通过10TB/秒的芯片到芯片链路连接成单个统一的GPU。基于Blackwell的AI算力将以名为DGXGB200的完整服务器芯片形态提供给用户，结合36颗NVIDIAGraceCPU和72块BlackwellGPU。这些超级芯片或可通过NVLink5.0连接成一台超级计算机，NVLink为每个GPU提供了突破性的1.8TB/s双向吞吐量，确保多达576个GPU之间的无缝高速通信。性能上，每个BlackwellDie的浮点运算能力要比上一代HopperDie高出25%，而且每个封装中有两个Blackwell芯片，总性能提高了2.5倍。能效上，公司表示以前训练一个1.8万亿个参数的模型，需要8000个Hopper GPU连续跑90天，消耗15兆瓦电力，相同的工作，只需要2000个Blackwell 跑90天就能完成，耗电量仅为4兆瓦，能耗仅为之前的四分之一。公司表示Blackwell拥有六项革命性的技术，可以支持多达10万亿参数的模型进行AI训练和实时LLM推理。这六项技术为：第二代Transformer引擎、全球最强大的芯片Blackwell架构GPU、第五代NVLink、RAS引擎、安全人工智能、解压缩引擎。图表1:DGXGB200NVL72 资料来源:英伟达,交银国际图表2:英伟达新一代Blackwell架构资料来源:英伟达,交银国际新款基于Blackwell架构的旗舰人工智能芯片B200和GB200 采用Blackwell架构的GPU系列产品包括B200和GB200。公司表示，尽管HopperH100仍具备十分出色的运算能力，但市场对较大型图像处理器有强烈需求，因此决定现时推出GB200。 GB200集成了两个B200BlackwellGPU与一个基于Arm的GraceCPU，通过2080亿个晶体管提供高达20petaflops的FP4吞吐量。与用于推理的相同数量的H100TensorCore图形处理单元（GPU）相比，全新GB200NVL机架级系统具有36个GraceBlackwell超级芯片，成本和能耗降低了大幅下降。算力方面，基于Blackwell架构的处理器GB200在FP4条件下20PFLOPS训练算力（或者40PFLOPS推理算力），为H1004PFLOPS的5倍。同时，GB200的成本和能耗降至25分之一。大模型（LLM）的大规模推理始终是一个挑战，并非适合单个GPU的任务。在具有1750亿个参数的GPT-3LLM基准测试中，GB200的性能是H100的7倍，并且训练速度是H100的4倍。B200配备192GBHBM3e内存，足以提供高达8TB/s的带宽。公司预计，包括亚马逊、谷歌、MetaPlatforms、微软、OpenAI和特斯拉在内的主要客户将选择使用新芯片。英伟达此次还携手亚马逊、谷歌、微软以及Oracle等云服务巨头，将通过云服务出售GB200的接入权。据介绍，亚马逊云服务AWS将建立一个拥有2万颗GB200芯片的服务器集群。图表3:英伟达B200 资料来源:英伟达,交银国际图表4:英伟达GB200 资料来源:英伟达,交银国际推出企业软件订阅产品NIM以及针对VisionPro的新服务 NIM（NvidiaInferenceMicroservice）可以更容易地使用旧的英伟达GPU进行推理，并允许公司继续使用他们已经拥有的数亿个英伟达GPU。推理服务NIM策略是让客户购买基于Nvidia服务器的推理微服务，每个GPU的成本为4,500美元／年。同时，NVIDIAOmniverseCloud将可以连接到苹果公司混合头显VisionPro。该服务允许企业将3D应用中的交互式通用场景描述（OpenUSD）串流传输到AppleVisionPro混合现实头显中。这一技术的应用，标志着工业设计和仿真领域向高效、互动和沉浸式体验迈出了重要一步。推出名为GR00T的人形机器人项目英伟达正在为最近涌现的人形机器人制造商提供一个名为GR00T的AI平台，其合作者包括1XTechnologies、AgilityRobotics、Apptronik、波士顿动力、FigureAI、FourierIntelligence、SanctuaryAI、宇树科技和小鹏鹏行等公司。由该平台提供支持的机器人，将被设计为通过观察人类行为来理解自然语言和模仿动作，使它们能够快速学习协调性、灵活性和其他技能，以导航、适应和与现实世界互动，并且绝不会导致机器人起义。 GR00T还将支持英伟达的新硬件，该芯片将包含基于NVIDIABlackwell架构的下一代GPU，并配备变压器引擎，提供800万亿次浮点AI性能，可运行GR00T等多模态生成式AI模型。集成功能安全处理器、高性能CPU集群和100GB以太网带宽，大大简化了设计和集成工作。图表5:GR00T人型机器项目资料来源:英伟达,交银国际图表6:运用GR00T的比亚迪仓库机器人资料来源:英伟达,交银国际深化与车企的合作，积极打造AI强化的自动驾驶技术公司在本次大会上还表示正深化与比亚迪等中国车企的合作。公司指出，比亚迪将采纳其下一代车载芯片DriveThor，以提升车辆自动驾驶及其他数字化功能。DriveThor预计明年将正式进驻比亚迪汽车。同时，公司宣布了与多家中国车企的合作扩展，包括比亚迪、小鹏以及广汽埃安旗下的Hyper品牌。此前，吉利旗下的极氪汽车和理想汽车已宣布将采用英伟达的DriveThor技术。此外，公司还宣布了英伟达与其他汽车和工业领域的新合作伙伴关系，如与美国软件公司Cerence合作，共同开发适用于车载计算的大型语言模型人工智能系统。交银国际香港中环德辅道中68号万宜大厦10楼评级定义分析员个股评级定义: 分析员行业评级定义：买入：预期个股未来12个月的总回报高于相关行业。领先：分析员预期所覆盖行业未来12个月的表现相对于大盘标竿指数具吸引力。中性：预期个股未来12个月的总回报与相关行业一致。沽出：预期个股未来12个月的总回报低于相关行业同步：分析员预期所覆盖行业未来12个月的表现与大盘标竿指数一致。无评级：对于个股未来12个月的总回报与相关行业的比较，分析员并无确信观点。落后：分析员预期所覆盖行业未来12个月的表现相对于大盘标竿指数不具吸引力。香港市场的标竿指数为恒生综合指数，A股市场的标竿指数为MSCI中国A股指数，美国上市中概股的标竿指数为标普美国中概股50（美元）指数总机:(852)37661899传真:(852)21074662 分析员披露本研究报告之作者﹐兹作以下声明﹕i)发表于本报告之观点准确地反映有关于他们个人对所提及的证券或其发行者之观点;及ii)他们之薪酬与发表于报告上之建议/观点幷无直接或间接关系;iii)对于提及的证券或其发行者﹐他们幷无接收到可影响他们的建议的内幕消息/非公开股价敏感消息。本研究报告之作者进一步确认﹕i)他们及他们之相关有联系者【按香港证券及期货监察委员会之操守准则的相关定义】幷没有于发表研究报告之30个日历日前处置/买卖该等证券;ii)他们及他们之相关有联系者幷没有于任何上述研究报告覆盖之香港上市公司任职高级职员;iii)他们及他们之相关有联系者幷没有持有有关上述研究报告

点击免费查看完整报告

你可能感兴趣

VR、机器人、自动驾驶：Blackwell之外业务不断发展

你可能感兴趣

全新Blackwell芯片亮相GTC，AI赋能机器人助力产业加速

英伟达（NVDA）：AIAgent与机器人结合构建AI工厂，继续利好Blackwell

【风口研报·洞察】A股半年报中的结构性亮点在哪；机器人产业化进度提速，除减速器之外，分析师看好这个行业作为高精密直线运动核心部件，特斯拉Optimus方案有望率先打开行业空间

电子行业：疫情抵消部分NAND产能过剩，CES关注自动驾驶、AR/VR

和英伟达/华为/百度合作ai自动驾驶+vr，诚迈科技。