您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[交银国际]:VR、机器人、自动驾驶:Blackwell之外业务不断发展 - 发现报告
当前位置:首页/公司研究/报告详情/

VR、机器人、自动驾驶:Blackwell之外业务不断发展

英伟达,NVDA2024-03-21王大卫、童钰枫交银国际c***
VR、机器人、自动驾驶:Blackwell之外业务不断发展

此报告最后部分的分析师披露、商业关系披露和免责声明为报告的一部分,必须阅读。下载本公司之研究报告,可从彭博信息:BOCM 或 https://research.bocomgroup.com交银国际研究 消息快报 科技 2024年 3月 20日 英伟达 (NVDA US)VR、机器人、自动驾驶 – Blackwell之外业务不断发展 英伟达 GTC于当地时间 3月 18日如期举行。此次活动万众期待,18000人的场地座无虚席。虽然外界对本次活动发布的内容早有预期,我们通过总结新硬件产品架构、软件服务模式和不同应用的前景,对生成式人工智能后续的技术发展和应用的铺开保持积极态度。 新产品架构 Blackwell符合市场预期:虽然具体的产品效果仍需实践检验,但 Blackwell新架构在性能上比之前的 Hopper架构有很大升级。Blackwell采用台积电 4nm制程,整合两个独立制造的裸晶。基于 Blackwell的 B200共有 2080亿个晶体管,通过 10TB/秒的芯片到芯片链路连接成单个统一的GPU。内存方面,Blackwell 搭载 192GB HBM3e,和之前 AMD 所发布的MI300 的配置相同。采用 Blackwell架构的 GPU系列产品包括 B100、B200和 GB200。其中 B100只适配于之前发布的 HGX和 DGX平台。GB200集成了两个 B200 GPU 与一个 Grace CPU,提供 20 PFLOPS 的 FP4 算力。基于Blackwell的AI算力将以名为DGX GB200的服务器芯片形态提供给用户,结合 36颗 CPU和 72颗 GPU。这些芯片通过 NVLink 5.0连接,NVLink5.0为1.8TB/s双向吞吐量,一个超级计算机或可配置 8块 DGX GB200,确保多达576个 GPU之间的无缝高速通信。 软件新产品加高护城河:微服务是软件的关键词。英伟达首次发布推理服务 NIM,公司的销售策略是让客户购买基于 NVDA服务器(搭载之前几代GPU产品)的推理微服务,价格为每个 GPU 4,500 美元/年。我们认为,NIM产品很好的解决了在GPU供给不足情况下推理应用不断增长的需求。另外,新发布的 CUDA-X微服务亦可以使得训练的微调更加便捷。 AR/VR/MR、人形机器人、自动驾驶等各类应用纷至沓来:英伟达深化与苹果的合作,NVDA Omniverse Cloud将可以连接到苹果 Vision Pro。该服务允许企业将 3D应用中的交互式通用场景描述串流传输到 Apple Vision Pro头显中,为数字孪生等应用服务。公司公布了 GR00T项目,旨在为人形机器人提供及一个基础模型。GR00T硬件基于英伟达 Thor SoC芯片,搭载Blackwell架构下 8比特 800TFLOPS算力。我们认为,人形机器人或是生成式人工智能算法在人机互动模式方面一个新的平台。英伟达同时发布了下一代车载计算芯片系统 DRIVE Thor,预计明年投产。公司宣布了与多家中国车企的合作扩展,包括比亚迪、小鹏以及广汽埃安旗下的 Hyper品牌。 我们依然保持乐观,认为 2025年下游需求依然强劲,相较 2024年或仍有20%增长。股价在最近一段时间震荡整理,或在 2025年有更明确需求的情况下出现进一步变化。交银国际研究海外科技系列英伟达 (NVDA US) - 成长性强,能见度高,市场或仍低估 (2024-02-28) 英伟达 (NVDA US) - VR、机器人、自动驾驶 – Blackwell之外业务不断发展 (2024-03-20) 英伟达 (NVDA US) -下游需求尚存分歧 – 英伟达报告客户反馈 (2024-03-20) 王大卫,PhD,CFADawei.wang@bocomgroup.com(852)37661867童钰枫Carrie.Tong@bocomgroup.com(852)37661804 2024年 3月 20日英伟达 (NVDA US)下载本公司之研究报告,可从彭博信息:BOCM 或 https://research.bocomgroup.com2GTC大会要点北京时间 3月 19日凌晨 4点,一年一度的英伟达 GTC开发者大会拉开帷幕。英伟达CEO发表了名为“见证AI的颠覆时刻”的主题演讲,也在会上推出了新一代架构 Blackwell、新款旗舰人工智能芯片 B200/GB200、推出企业软件订阅产品 NIM以及针对 Vision Pro的新服务、GR00T的人形机器人等见证 AI颠覆时刻的产品。我们对其中最为关键的产品和技术进行了梳理。推出新一代架构 BlackwellBlackwell作为本次大会的重磅产品,相比Hooper,在性能上有较为明显的进步。Blackwell 采用台积电 4nm 制程,整合两个独立制造的裸晶(Die),基于Blackwell的 B200共有 2080亿个晶体管,具有两个十字线极限 GPU芯片,通过 10TB/秒的芯片到芯片链路连接成单个统一的 GPU。基于 Blackwell的 AI算力将以名为 DGX GB200的完整服务器芯片形态提供给用户,结合 36颗 NVIDIA Grace CPU和 72块 Blackwell GPU。这些超级芯片或可通过 NVLink 5.0 连接成一台超级计算机,NVLink 为每个 GPU 提供了突破性的1.8TB/s双向吞吐量,确保多达 576个 GPU之间的无缝高速通信。性能上,每个 Blackwell Die 的浮点运算能力要比上一代 Hopper Die 高出 25%,而且每个封装中有两个 Blackwell芯片,总性能提高了 2.5倍。能效上,公司表示以前训练一个 1.8万亿个参数的模型,需要 8000个 Hopper GPU连续跑 90天,消耗 15兆瓦电力,相同的工作,只需要 2000个 Blackwell跑 90天就能完成,耗电量仅为 4兆瓦,能耗仅为之前的四分之一。公司表示 Blackwell拥有六项革命性的技术,可以支持多达 10万亿参数的模型进行 AI训练和实时 LLM推理。这六项技术为:第二代 Transformer引擎、全球最强大的芯片 Blackwell架构 GPU、第五代 NVLink、RAS引擎、安全人工智能、解压缩引擎。图表 1: DGX GB200 NVL72资料来源: 英伟达, 交银国际图表 2: 英伟达新一代 Blackwell架构资料来源: 英伟达, 交银国际 2024年 3月 20日英伟达 (NVDA US)下载本公司之研究报告,可从彭博信息:BOCM 或 https://research.bocomgroup.com3新款基于 Blackwell架构的旗舰人工智能芯片 B200和 GB200采用 Blackwell 架构的 GPU 系列产品包括 B200 和 GB200。公司表示,尽管Hopper H100仍具备十分出色的运算能力,但市场对较大型图像处理器有强烈需求,因此决定现时推出 GB200。GB200集成了两个B200 Blackwell GPU与一个基于Arm的Grace CPU,通过2080亿个晶体管提供高达 20 petaflops 的 FP4 吞吐量。与用于推理的相同数量的H100 Tensor Core图形处理单元(GPU)相比,全新GB200 NVL机架级系统具有36个 Grace Blackwell超级芯片,成本和能耗降低了大幅下降。算力方面,基于 Blackwell 架构的处理器 GB200 在 FP4 条件下 20 PFLOPS 训练算力(或者 40 PFLOPS推理算力),为 H100 4 PFLOPS的 5倍。同时,GB200的成本和能耗降至 25分之一。大模型(LLM)的大规模推理始终是一个挑战,并非适合单个 GPU 的任务。在具有 1750 亿个参数的 GPT-3 LLM 基准测试中,GB200 的性能是 H100 的 7 倍,并且训练速度是 H100的 4倍。B200配备 192GB HBM3e 内存,足以提供高达 8TB/s 的带宽。公司预计,包括亚马逊、谷歌、Meta Platforms、微软、OpenAI和特斯拉在内的主要客户将选择使用新芯片。英伟达此次还携手亚马逊、谷歌、微软以及Oracle等云服务巨头,将通过云服务出售 GB200的接入权。据介绍,亚马逊云服务 AWS将建立一个拥有 2万颗 GB200芯片的服务器集群。图表 3: 英伟达 B200资料来源: 英伟达, 交银国际图表 4: 英伟达 GB200资料来源: 英伟达, 交银国际 2024年 3月 20日英伟达 (NVDA US)下载本公司之研究报告,可从彭博信息:BOCM 或 https://research.bocomgroup.com4推出企业软件订阅产品 NIM以及针对 Vision Pro的新服务NIM(Nvidia Inference Microservice)可以更容易地使用旧的英伟达 GPU进行推理,并允许公司继续使用他们已经拥有的数亿个英伟达 GPU。推理服务 NIM策略是让客户购买基于 Nvidia 服务器的推理微服务,每个 GPU 的成本为 4,500 美元/年。同时,NVIDIA Omniverse Cloud将可以连接到苹果公司混合头显 Vision Pro。该服务允许企业将 3D 应用中的交互式通用场景描述(OpenUSD)串流传输到Apple Vision Pro混合现实头显中。这一技术的应用,标志着工业设计和仿真领域向高效、互动和沉浸式体验迈出了重要一步。推出名为 GR00T的人形机器人项目英伟达正在为最近涌现的人形机器人制造商提供一个名为GR00T的AI平台,其合作者包括 1X Technologies、Agility Robotics、Apptronik、波士顿动力、Figure AI、Fourier Intelligence、Sanctuary AI、宇树科技和小鹏鹏行等公司。由该平台提供支持的机器人,将被设计为通过观察人类行为来理解自然语言和模仿动作,使它们能够快速学习协调性、灵活性和其他技能,以导航、适应和与现实世界互动,并且绝不会导致机器人起义。GR00T还将支持英伟达的新硬件,该芯片将包含基于NVIDIA Blackwell架构的下一代 GPU,并配备变压器引擎,提供800万亿次浮点AI性能,可运行GR00T等多模态生成式 AI模型。集成功能安全处理器、高性能 CPU集群和 100GB以太网带宽,大大简化了设计和集成工作。图表 5: GR00T人型机器项目资料来源: 英伟达, 交银国际图表 6: 运用 GR00T的比亚迪仓库机器人资料来源: 英伟达, 交银国际 2024年 3月 20日英伟达 (NVDA US)下载本公司之研究报告,可从彭博信息:BOCM 或 https://research.bocomgroup.com5深化与车企的合作,积极打造 AI强化的自动驾驶技术公司在本次大会上还表示正深化与比亚迪等中国车企的合作。公司指出,比亚迪将采纳其下一代车载芯片 Drive Thor,以提升车辆自动驾驶及其他数字化功能。Drive Thor预计明年将正式进驻比亚迪汽车。同时,公司宣布了与多家中国车企的合作扩展,包括比亚迪、小鹏以及广汽埃安旗下的 Hyper品牌。此前,吉利旗下的极氪汽车和理想汽车已宣布将采用英伟达的 Drive Thor技术。此外,公司还宣布了英伟达与其他汽车和工业领域的新合作伙伴关系,如与美国软件公司 Cerence合作,共同开发适用于车载计算的大型语言模型人工智能系统。 2024年 3月 20日英伟达 (NVDA US)下载本公司之研究报告,可从彭博信息:BOCM 或 https://research.bocomgroup.com6交银国际香港中环德辅道中 68号万宜大厦 10楼总机: (852) 3766 1899