证英伟达发布DGXGH200超级计算机, 研 券提升通信带宽利好高速光模块 报 究增持(维持)主要观点 告今年年初以来,以ChatGPT为代表的生成式人工智能模型持续落地和 行业:通信 商业化,引发了业内对人工智能赛道的关注。人工智能技术的不断演 日期: 2023年06月02日 进,也对以算力和通信为代表的人工智能基础设施提出了更高的要求。 分析师:刘京昭 Tel: E-mail: SAC编号:S0870523040005 最近一年行业指数与沪深300比较 通信沪深300 % % 06/2208/2210/2201/2303/2306/23 45% 38% 31% 23% 16% 8 1 事-7% 件-14% 点 评 相关报告: 《市场行情疲软,通信行业细分板块出现分化行情》 ——2023年05月23日 《财报披露和节日后两天行情疲软,不改长期投资逻辑》 ——2023年05月11日 《稳健成长,紧抓数字经济新周期——通信行业2022及2023Q1财报总结》 ——2023年05月09日 近日,NVIDIA推出了新型AI超级计算机——DGXGH200。在算力和存储方面,DGXGH200组合了Arm架构的GraceCPU和Hopper架构的GPU,配备了96GBHBM高速显存、576GB显存和144TB共享内存。在通信方面,DGXGH200在GPU间可实现高达900GB/s的数据吞吐速率(带宽),是PCIeGen5.0通道传输速率的7倍。相较于此前推出的DGXH100SuperPOD,DGXGH200更适合生成式人工智能模型训练场景。 我们认为:除算力之外,为了适应生成式人工智能模型的持续迭代,AI数据中心需要更高的带宽和更大的内存。而GH200配置的高内存和大带宽,正是这一发展趋势的代表,这将有利于800G光模块在未来的导入与放量,利好在800G验证和量产方面进度领先的光模块行业头部公司。 投资建议 建议关注: 中际旭创:中高端数通市场龙头,2021年全球排名第一的光模块供应商。公司管理团队激励机制有望得到改善。根据iFinD机构一致预期,截至2023年5月29日,公司2023/2024年的预测PE分别为51/39倍,位于近五年的81%分位。 新易盛:光模块领域龙头,成本管控优秀,具备切入增量云计算/AI客户的能力。根据iFinD机构一致预期,截至2023年5月29日,公司2023/2024年的预测PE分别为39/28倍,位于近五年的46%分位。 天孚通信:光器件整体解决方案提供商。根据iFinD机构一致预期,截至2023年5月29日,公司2023/2024年的预测PE分别为59/46倍,位于近五年的100%分位。 源杰科技:技术成熟的国产激光器厂商。根据iFinD机构一致预期,截至2023年5月29日,公司2023/2024年的预测PE分别为104/76倍,位于近五年的90%分位。 风险提示 海外头部云厂商需求不及预期;人工智能技术落地和商业化不及预期;产业政策转变;宏观经济不及预期等。 目录 1人工智能基础设施更进一步,英伟达新型超级计算机发布3 1.1DGXGH200在共享内存和GPU间通信方面有提升3 1.2GPU间通信带宽增加,提振高速光模块增长空间5 2风险提示6 图 图1:DGXGH200组合了GraceCPU和Hopper架构GPU .......................................................................................3 图2:GraceHopper架构相对x86+Hopper在模型训练和高性能计算上有比较明显的计算能力优势4 图3:DGXGH200内存大幅增加(单位:GB)4 图4:DGXGH200连接NVLink的拓扑结构4 图5:DGXGH200大内存AI工作负载性能大幅优于DGXH1004 图6:GPU-GPU通过NVLink4连接5 表 表1:人工智能领域相关公司对比(截至5月29日,单位: 亿元)6 1人工智能基础设施更进一步,英伟达新型超级计算机发布 1.1DGXGH200在共享内存和GPU间通信方面有提升 今年年初以来,以ChatGPT为代表的生成式人工智能模型持续落地和商业化,引发了业内对人工智能赛道的关注。人工智能技术的不断演进,也对以算力和通信为代表的人工智能基础设施提出了更高的要求。 图1:DGXGH200组合了GraceCPU和Hopper架构GPU 资料来源:NVIDIADGXGH200技术文档,上海证券研究所 5月29日,NVIDIA宣布推出AI超级计算机DGXGH200。相比于2021年推出的DGXH100SuperPOD架构,DGXGH200超级计算机主要的改进有: (1)使用了全新的GraceHopper超级芯片。GraceHopper超级芯片整合了Arm架构的GraceCPU和Hopper架构的GPU,而DGXH100则使用单独的H100GPU。GraceHopper超级芯片相比于传统的X86+Hopper方式,在并行计算上优势明显,因此DGXGH200在模型训练场景下会有更高的计算效率; (2)DGXGH200拥有144TB共享内存,单块GPU最高配置96GB高速显存,相较DGXH100增加20%,因此DGX GH200在进行模型训练时,可以高效地使用更大的训练数据集; 图2:GraceHopper架构相对x86+Hopper在模型训练和高性能计算上有比较明显的计算能力优势 资料来源:NVIDIAGraceHopper架构白皮书,上海证券研究所 图3:DGXGH200内存大幅增加(单位:GB) 资料来源:NVIDIA开发者社区,上海证券研究所 (3)DGXGH200的GPU与GPU间通信使用NVLink4,可以在GPU与GPU间实现900GB/s的数据吞吐速率(带宽),是传统PCIeGen5.0通道传输速率的7倍,同样有助于提高模型训练效率。 综上所述,相比于此前的DGXH100SuperPOD,DGXGH200将更适合受到较大关注的生成式人工智能模型训练。 图4:DGXGH200连接NVLink的拓扑结构图5:DGXGH200大内存AI工作负载性能大幅优 于DGXH100 资料来源:NVIDIA开发者社区,上海证券研究所资料来源:NVIDIA开发者社区,上海证券研究所 DGXGH200在GraceCPU与GPU间使用NVLinkC2C技术进行通信,在GPU间通过NVLink交换机进行通信。所使用的NVLink交换机结合了第四代NVLink与第三代NVSwitch技术。如图4所示,DGXGH200第一级配置96台NVLink交换机,第二级配置36台NVLink交换机,每8个GraceHopper超级芯片为一组与3台第一级的NVLink交换机互相连接。结合800G光模块的封装方式和NVSwitch的端口数量,假设GraceHopper超级芯片与第一级的NVLink交换机通过线缆连接,而第一级的NVLink 交换机与第二级的NVLink交换机通过光通信连接,则DGXGH200中一块GPU对应9个800G光模块;假设GraceHopper超级芯片与第一级的NVLink交换机、第一级的NVLink交换机与第二级的NVLink交换机均通过光通信连接,DGXGH200中一块GPU对应约18个800G光模块。因此,DGXGH200中一块GPU对应的800G光模块约为9-18个。 图6:GPU-GPU通过NVLink4连接 资料来源:NVIDIAGraceHopper架构白皮书,上海证券研究所 考虑到NVIDIA推出的CUDA架构在高性能计算领域的重要地位,DGXGH200超级计算机的设计思路和具体实现,也将对后续面向模型训练场景的AI服务器的设计产生较大的影响。 1.2GPU间通信带宽增加,提振高速光模块增长空间 光通信是AI数据中心协同运转的重要通信手段,光模块则是光通信必不可少的组件。AI数据中心的网络通信建设,将进一步拓展以400G和800G光模块为代表的中高速光模块的应用前景,对目前处于400G光模块放量、800G光模块加速导入的周期起点的光模块行业具有重要意义。 我们认为:除算力之外,为了适应生成式人工智能模型的持续迭代,突破生成式人工智能模型训练时间较长的瓶颈,AI数据中心需要更高的带宽和更大的内存。而DGXGH200正是这一发展趋势的代表,这将有利于800G光模块在未来的导入与放量,利好在800G验证和量产方面进度领先的光模块行业头部公司。 表1:人工智能领域相关公司对比(截至5月29日,单位:亿元) 细分板块股票简称22营业 收入 22归母 净利润 23E23E归母 营业收入净利润 23E 估值 24E24E归母 营业收入净利润 24E近五年PE 估值分位数(%) 寒武纪7-1311-8--16-5---- 紫光国微712692342311945170 澜起科技371350155473213630 算力北京君正5485994970123627 芯原股份271342295432189-- 国科微瑞芯微 3620 23 5325 44 5177 6932 66 3757 4397 中科曙光 130 15 152 20 36 180 26 28 36 服务器 紫光股份 741 22 852 27 32 984 33 26 74 浪潮信息 695 21 823 26 22 959 32 18 44 中际旭创 96 12 112 15 51 145 20 39 81 新易盛 33 9 38 9 39 50 13 28 46 博创科技 15 2 20 3 31 25 3 25 40 光模块 58 剑桥科技 38 2 -- -- -- -- -- -- 华工科技 120 9 151 12 25 188 16 20 26 光迅科技 69 6 77 7 29 87 8 25 44 天孚通信 12 4 16 5 59 22 6 46 100 光芯片 源杰科技 3 1 4 2 104 5 2 76 90 仕佳光子 9 1 11 1 61 13 1 42 47 资料来源:iFinD,上海证券研究所 *盈利预测来自iFinD机构一致预期;仅列举各板块部分标的 2风险提示 海外头部云厂商需求不及预期;人工智能技术落地和商业化不及预期;产业政策转变;宏观经济不及预期等。 分析师声明 作者具有中国证券业协会授予的证券投资咨询资格或相当的专业胜任能力,以勤勉尽责的职业态度,独立、客观地出具本报告,并保证报告采用的信息均来自合规渠道,力求清晰、准确地反映作者的研究观点,结论不受任何第三方的授意或影响。此外,作者薪酬的任何部分不与本报告中的具体推荐意见或观点直接或间接相关。 公司业务资格说明 本公司具备证券投资咨询业务资格。 投资评级体系与评级定义 股票投资评级:分析师给出下列评级中的其中一项代表其根据公司基本面及(或)估值预期以报告日起6个月内公司股价相对于同期市场基准指数表现的看法。 买入股价表现将强于基准指数20%以上增持股价表现将强于基准指数5-20%中性股价表现将介于基准指数±5%之间减持股价表现将弱于基准指数5%以上 无评级由于我们无法获取必要的资料,或者公司面临无法预见结果的重大不确定性事 件,或者其他原因,致使我们无法给出明确的投资评级 行业投资评级:分析师给出下列评级中的其中一项代表其根据行业历史基本面及(或)估值对所研究行业以报告日起12个月内的基本面和行业指数相对于同期市场基准指数表现的看法。 增持行业基本面看好,相对表现优于同期基准指数中性行业基本面稳定,相对表现与同期基准指数持平减持行业基本面看淡,相对表现弱于同期基准指数 相关证券市场基准指数说明:A股市场以沪深300指数为基准;港股市场以恒生指数为基准;美股市场以标普500 或纳斯达