您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中泰证券]:通信行业英伟达GTC专题:新一代GPU、具身智能与AI应用 - 发现报告
当前位置:首页/行业研究/报告详情/

通信行业英伟达GTC专题:新一代GPU、具身智能与AI应用

信息技术2024-03-18陈宁玉中泰证券话***
通信行业英伟达GTC专题:新一代GPU、具身智能与AI应用

证券研究报告 2024年3月18日 英伟达GTC专题:新一代GPU、具身智能与AI应用 中泰通信 首席分析师:陈宁玉(S0740517020004) Email:chenny@zts.com.cn研究助理:佘雨晴Email:sheyq@zts.com.cn研究助理:杨雷 Email:yanglei01@zts.com.cn 1 核心观点 GTC2024召开在即,关注新一代GPU、具身智能、AI应用三大方向。GTC2024将于当地时间3月18-21日在美国加州圣何塞会议中心及线上举行,预计发布加速计算、生成式AI以及机器人领域突破性成果。建议关注三大方向:1)B100及后续芯片路线。B100预计采用BlackWell全新架构,与H200系列相比性能有望翻倍提升,GB200或于2024-2025年推出,芯片迭代周期缩短至1年,带动配套工艺及组件加速升级。2)具身智能:AgilityRobotics、波士顿动力公司、迪士尼和GoogleDeepMind等公司将参加GTC机器人相关会议,现场将展出25款机器人。黄仁勋曾表示具身智能是AI下一个浪潮,2024年初英伟达投资人形机器人公司FigureAI并成立通用具身智能体研究实验室GEAR,大会或将更新相关成果。3)AI应用。本次GTC共有亚马逊、Anthropic、Runway等1000多家参会企业,300多家参展商将展示英伟达平台在农业、汽车、云服务等行业的应用。多模态大模型助力AI赋能下游行业,提升推理侧算力与带宽要求,数据中心、CDN等或将受益AI应用带来的新一轮流量增长。 B100性能预计大幅提升,GB200有望超预期。英伟达将推出全新芯片架构BlackWell,或为英伟达首次采用多chiplet设计的架构。B100成为首款基于BlackWell架构的芯片,预计为MCM多芯片封装,台积电N3或N4P制程工艺,可能使用CoWoS-L,性能预计至少为H200的2倍,H100的4倍;首发内存或为200GHBM3e,约为H200的140%;或采用224Serdes。为了更快推向市场,B100前期版本或使用PCIe5.0和C2C式链接,功耗700W,方便直接沿用H100的现有HGX服务器,后续将推出1000W版本,转向液冷,并将通过ConnectX8实现每GPU网络的完整800G。根据英伟达芯片路线图,GB200将于2024-2025年推出,由CPU和GPU通过NVLinkC2C连接构成,或采用NVLink5.0及192GBHBM3e内存,性能有望超预期提升。 聚焦光通信与液冷产业链,关注新技术变革方向。AI芯片加速升级带动光模块、交换机等底层网络硬件迭代提速,2024年1.6T需求将现,速率升级同时伴随功耗成本增加等问题,硅光、LPO、CPO、薄膜铌酸锂等新技术方案导入有望加快。国内光模块厂商全球份额过半,市场竞争力较强,带动光通信产业链逐步向国内转移,上游光芯片国产替代预计加速。B100后续迭代版本功耗或达1000W,GB200或进一步增长至1200W,英伟达已联合行业伙伴布局混合液冷等创新散热方案。算力器件功耗持续增长对传统风冷带来挑战,AI算力将导致数据中心能耗不断抬升与PUE指标趋严将共同倒逼产业对液冷需求升级,冷板式液冷或率先放量,浸没式液冷为长期方向。温控、IDC、服务器、运营商等多方积极部署液冷路线。随着AI发展,液冷产业链参与者不断增加,上下游协同增强。 投资建议:重点关注光模块器件:中际旭创、天孚通信、新易盛、源杰科技、仕佳光子、腾景科技、光库科技、光迅科技、联特科技、太辰光等;液冷:英维克、申菱环境、高澜股份、佳力图、依米康、网宿科技等;ICT设备:菲菱科思、盛科通信、锐捷网络、紫光股份、中兴通讯等;数据中心:宝信软件、润泽科技、光环新网、奥飞数据等。 风险提示:AI发展不及预期、技术迭代不及预期、市场竞争加剧、海外贸易争端、市场系统性风险、研究报告使用的公开资料可能存在信息滞后或更新不及时等风险 GTC2024前瞻:见证AI的变革时刻 图表:GTC2024会议主题数量分布 GTC2022:硬件为主,发布全新Hopper架构H100GPU及GraceCPU超级芯片,第四代NVLink和第三代NVSwitch技术、DGXH100SuperPOD等。 GTC2023:侧重软件及服务更新,发布及更新H100NVLGPU,PCIeH100等硬件,以及AI超级计算服务DGXCloud、光刻计算库CuLitho、GPU加速量子计算系统等。 GTC2024:当地时间3月18-21日举行,黄仁勋将发表主题演讲“见证AI的变革时刻”,发布加速计算、生成式AI以及机器人领域突破性成果。 会议期间将举办超过1000场演讲、圆桌讨论、培训等各种活动,来自英伟达、Meta、微软、斯坦福等业界及学术界众多权威AI研究者将参加200多场会议。共有1000多家企业将参加本届GTC,包括但不限于亚马逊、OpenAI、微软、Meta、谷歌等AI巨头以及Anthropic、Cohere、Runway等AI初创企业。300多家参展商将展示企业如何在航空航天、农业、汽车和运输、云服务、金融服务、医疗和生命科学、制造、零售和电信等各行业部署英伟达平台。 来源:英伟达官网,中泰证券研究所3 关注一:BlackwellGPU架构及B100 英伟达有望在GTC2024上发布B100及B200系列。B100将首次采用Blackwell架构,基于更复杂的多芯片模块(MCM)设计,与现有采用Hopper架构的H200系列相比性能有望翻倍提升,预计使用台积电3nm或N4P工艺制程,功耗或达1000W,采用液冷方案,2024Q2/Q3开始规模生产。此外,根据英伟达最新官方路线图及IT之家报道,预计2024-2025年之间推出GB200,或采取差异化策略推动客户采购,加大其与B100/B200之间的配置差距,特别在NVLink和网络性能方面。 B100预计配套全新组件。此外根据路线图,英伟达将于2024年底前推出速度更快、功能更强大的InfiniBand和以太网NIC以及交换机,每个端口的带宽可达800Gb/s,本次大会上或将有所透露。 据Barron’s报道,英伟达将于2025年推出B200GPU,单张功耗达1000W,升级后的B200变体可能采用更快版本的HBM内存,以及更高的内存容量,升级规格和增强功能。 图表:英伟达芯片路线图 来源:英伟达官网,中泰证券研究所4 关注二:具身智能/人形机器人/自动驾驶 人形机器人:AgilityRobotics、波士顿动力公司、迪士尼和GoogleDeepMind等公司将参会,现场将展出25款机器人,包括人形机器人、工业机械手等。英伟达于2018年推出包含全新硬件、软件和虚拟世界机器人模拟器的NVIDIAIsaac,同时还推出专为机器人设计的计算机平台JetsonXavier和相关的机器人软件工具包,2023年发布多模态具身智能系统VIMA和自主移动机器人平台IsaacAMR。同时,英伟达通过仿真模拟平台Omniverse与AI结合,帮助建立训练数据集,23年3月OmniverseCloud托管至微软Azure,以扩大英伟达AI机器人开发和管理平台IsaacSim的接入范围。2024年2月英伟达向人形机器人公司FigureAI投资5000万美元并成立通用具身智能体研究实验室GEAR,人形机器人作为具身智能优良载体,有望迎来加速发展。 自动驾驶:2022年英伟达发布全新一代自动驾驶SoC芯片Thor,内部拥有770亿个晶体管,算力高达2000TFLOPS,较此前Orin提升8倍,计划2024年量产,极氪将于2025年搭载首发。 图表:英伟达IsaacAMR硬件配置图 图表:英伟达自动驾驶芯片路线图 来源:英伟达官网,中泰证券研究所5 关注三:AI推理/边缘计算 GTC2024有望更新以太网架构及产品、ASIC芯片计划等相关信息。英伟达FY2024数据中心业务收入40%来自AI推理,AI在汽车、医疗和金融服务等垂直领域广泛应用,其正在推出全新Spectrum-X端到端产品进入以太网领域,引入新技术为AI处理提供较传统以太网高1.6倍的网络性能。根据路透社报道,英伟达正在建立新业务部门,专注为云厂商及其他企业设计定制芯片(ASIC),包括先进的AI处理器。 本次GTC共有亚马逊、Anthropic、Runway等1000多家参会企业,会上将展示英伟达平台在农业、汽车、云服务等行业的应用,英伟达、 HuggingFace、Zalando、AWS、微软、Cloudflare、谷歌等将参加AI推理相关会议。 生成式AI在影视上的应用将被重点展示。中国游戏厂商腾讯、网易,以及传媒巨头奈飞、皮克斯、迪士尼动画工作室等均将参与游戏/传媒娱乐讨论,可能探讨如何利用生成式AI和路径追踪技术创造更加逼真的虚拟人物和世界,辅助游戏开发和影视制作;Runway、腾讯及Digitrax等有望介绍其文生图、文生视频模型及其他AI应用。其他可能被讨论的应用包括3D内容生成、云端创作游戏等。 2万亿美元可寻址市场(TAM):英伟达预计随着通用AI技术发展,目前1万亿美元数据中心基础设施安装量(可寻址市场,TAM)将在未来五年翻一番。AI设备有望替换掉所有的传统计算。 图表:ASIC芯片在边缘AI应用占比提升 图表:英伟达在GTC2023上推出4款AI推理平台图表:英伟达1万亿美元TAM结构 来源:英伟达官网,Bloomberg,中泰证券研究所6 英伟达每隔1-2年提出新的芯片架构以适应计算需求升级。2017年提出Volta架构,专注深度学习和AI应用,并引入TensorCore,2020年Ampere架构在计算能力、能效和深度学习性能方面大幅提升,采用多个SM和更大的总线宽度,提供更多CUDACore及更高频率,引入第三代TensorCore,具有更高的内存容量和带宽,适用于大规模数据处理和机器学习任务。2022年发布Hopper架构,支持第四代TensorCore,采用新型流式处理器,每个SM能力更强。 Blackwell:或为英伟达首次采用多chiplet设计的架构,一方面可能简化基于Blackwell架构的GPU硅片层面生产,最大限度提高小型芯片产量,另一方面,多芯片封装将更加复杂。预计SM和CUDA将采用新结构,光线追踪性能等将进一步优化和加强,RT单元有可能被PT单元所取代,以实现对AdaLovelace架构的性能翻倍。Blackwell架构GPU很可能会支持GDDR7内存,相比GDDR6X效率更高,鉴于第一代GDDR7SGRAMIC将具有32GT/s的传输数据速率,采用这些芯片的384位内存子系统将提供约1536GB/s的带宽。与Hopper/Ada架构不同,Blackwell或将扩展到数据中心和消费级GPU,但消费级场景或将延续单芯片设计,以实现时间可控及低风险。 BlackWell架构演进 图表:英伟达芯片架构演进 架构 Volta Turing Ampere Hopper 发布时间 2017 2018 2020 2022 核心参数 80个SM,每个SM包括32个FP64+64102核心92个SM,SM重新设计,每个SM108个SM,每个SM包含64个FP32+64个个Int32+64个FP32+8个TensorCore包含64个Int32+64个FP32+8个TensorCoreINT32+32个FP64+4个TensorCore 132个SM,每个SM包含128个FP32+64个INT32+64个FP64+4个TensorCore 特点 NVLink2.0,TensorCore第一代,支持AI运算 TensorCore2.0,RTCore第一代TensorCore3.0,RTCore2.0,NVLink3.0, TensorCore4.0,NVLink4.0,结构稀疏性