您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[光大证券]:光模块行业专题报告:AI使互联需求跃迁,高速率光模块市场方兴未艾 - 发现报告
当前位置:首页/行业研究/报告详情/

光模块行业专题报告:AI使互联需求跃迁,高速率光模块市场方兴未艾

电子设备2024-05-11刘凯、朱宇澍光大证券~***
AI智能总结
查看更多
光模块行业专题报告:AI使互联需求跃迁,高速率光模块市场方兴未艾

AI使互联需求跃迁,高速率光模块市场方兴未艾 ——光模块行业专题报告 作者: •电子通信行业首席分析师刘凯,执业证书编号:S0930517100002 •电子通信行业分析师朱宇澍,执业证书编号:S0930522050001 2024年5月11日 证券研究报告 核心观点 光模块产业趋势:AI驱动800G/1.6T/3.2T数通光模块快速成长,更高的互联速率+更多的互联数增长奠定了光模块广阔的市场空间。 英伟达推出Blackwell系列GPU,提振高速率光模块需求。 光模块未来路径:CPO、硅光。硅光光模块拥有更高的集成度、更低的规模量产成本,未来渗透率有望提升;3.2T和 6.4T时代,CPO或将成为主流方案。 中国光模块产业的崛起:2022年,全球光模块市场的前十大厂商中,国产厂商占据了七个席位;受到AI拉动,中国光模块出口额今年以来高速增长;受益于AI,光模块公司24Q1业绩实现高增。 投资建议:更高的互联速率+更多的互联数增长奠定了高速率光模块广阔的市场空间,叠加国内公司在全球的领先地 位,我们全面看好光模块行业投资机会,建议关注: (1)1.6T产业链的龙头:中际旭创、新易盛、天孚通信。 (2)光芯片国产化:源杰科技 (3)受益于国产算力发展:华工科技、光迅科技。 风险提示:AI行业发展低于预期、地缘政治风险、竞争加剧 1、光模块产业趋势:AI驱动800G/1.6T/3.2T数通光模块快速成长 2、英伟达推出Blackwell系列GPU,提振高速率光模块需求 3、光模块未来路径:CPO、硅光 4、中国光模块产业的崛起 5、投资建议:重点关注中际旭创、新易盛、天孚通信、源杰科技 6、风险提示 光模块是AI投资中网络端的重要环节,其与训练端GPU出货量强相关,同时推理段流量需求爆发也有望带动需求增长。在算力投资持续背景下,AI成为光模块数通市场的核心增长力。根据Lightcounting和Coherent预测,全球数通光模块市场23年-28年的CARG为18%,其中,AI用数通光模块市场CAGR为47%。 增长驱动力主要来自800G、1.6T、3.2T光模块需求。据Coherent数据,到2027年,整个数通市场800G及以上速率的光模块市场规模占比将超过50%。 图表1:2023-2028年全球数通光模块市场空间(单位:百万美金) 14000 12000 10000 8000 6000 4000 2000 图表2:2018-2028年全球数通光模块不同速率市场空间拆分(单位:百万美金) 0 2023E2024E2025E2026E2027E2028E 非AI用数通光模块AI用数通光模块 资料来源:Lightcounting,Coherent预测,光大证券研究所整理资料来源:Lightcounting,Coherent预测,(23-28年数据为预测值) 图表3:AI使得互联速率迭代周期加快 资料来源:Marvell 图表4:交换机密度提升进程 资料来源:FiberMall预测 AI已明确加快了光模块技术迭代,并且显著缩短了光模块周期,之前从100G过渡到400G用了超过3年,为了实现更高的传输速率以匹配 日渐提高的计算速度需求,从800G到1.6T的代际替换有望缩短至不到两年。 根据FiberMall数据预测,2021-2025年交换机密度预计大约每2年翻1倍,相对应光模块速率也将同步匹配。 图表5:GPU数量与光互连数量比较 资料来源:Marvell Marvell于2024年4月12日举办AIday投资者交流会,其中公司执行副总裁LoiNguyen在演讲中提到,模型规模变大带来的多卡并行,越来越多的交换网络层数使得连接数的上升幅度比GPU的增幅更快。 Scailinglaw下,大模型规模越来越大带来交换网络层数提升,光模块配比提升。GPT-3在1K个集群上训练,对应需要2500个光互连;GPT-4在25K个集群上训练,对应需要75000个光互连。未来的10万个超大计算集群,需要50万个光互联(5层架构,GPU与光模块的配比为1:5),随着Scailinglaw的演进,为了实现AGI未来甚至可能会出现1:10光模块配比的网络架构。 6 图表6:更多的互联数增长+更高的互联速率促使网络连接飞速发展 更多的GPU驱动更多的端口连接;同时,随着GPU算力愈来愈强,需要更多的带宽来保持它们处理数据,因此,更高算力的GPU需要更高速的端口。 这两个因素导致了超大规模数据中心连接需求的指数级增长,这是一个庞大且迅速增长的市场。 资料来源:Marvell 图表7:Marvell测算的其互联业务的潜在市场空间 7 资料来源:Marvell Marvell公司认为他们在互联业务的潜在市场空间将从23年的34亿美金增长到28年的111亿美金,CAGR为27%。 这其中包括数据中心内部互联光互联,CAGR为25%;数据中心内部有源电缆DSP,CAGR为59%;数据中心间互联(DCI),CAGR为25%。剔除掉AEC,潜在市场空间也将从23年的33亿美金增长到28年的101亿美金,CAGR为25%。 800G光模块 单通道100G电口&光口 大规模量产 单通道100G电口,单通道200G光口 LPO 1.6T&3.2T光模块 1.6T(8*200G电口&光口) 大规模量产 LPO 3.2T(16*200G电口&光口) CPO 图表8:高速率数通光模块量产节奏路线图 资料来源:Coherent,光大证券研究所 根据Coherent对于行业未来的产品路线图预测,50Tb/s交换机时代,单通道100G的800G光模块于23年开始大规模量产 (已量产);单通道200G的800G光模块于24年批量出货;LPO方案于24年H2批量出货。 100Tb/s交换机时代,单通道200G的1.6T光模块将于24年年底量产,LPO方案也于24年年底开始量产;单通道200G的3.2T光模块将于26年年初量产,可应用于100Tb/s交换机,也可用于下一代200Tb/s交换机。 图表9:2023年全球数通光模块市场按激光器分类占比 (单位:十亿美金,%) 图表10:2028年全球数通光模块市场按激光器分类占比 (单位:十亿美金,%) 资料来源:Coherent资料来源:Coherent预测 VCSEL激光器用在多模光模块中,由于AI训练集群中GPU间互联需求大幅提升,预计其会快速增长。Coherent预计AI用VCSEL光模块市场规模将从23年的3亿美金增长至28年的16亿美金,占比从6%提升至14%。 EML激光器应用在单模光模块中,适用于长距离互联,多用于上层交换机互联以实现大规模AI集群,Coherent预计AI用EML光模块 市场规模将从23年的6亿美金增长至28年的20亿美金,占比从12%提升至18%。 硅光由于在硅基衬底上集成光子和电子器件,实现了光模块的高集成度、小型化和低功耗,预计1.6T及以上速率硅光光模块占比会越来越高,Coherent预测AI用硅光光模块市场规模将从23年的2亿美金增长至28年的34亿美金,占比从3%提升至29%。 图表11:2023年全球数通市场激光器分类占比(单位:百万美金,%)图表12:2028年全球数通市场激光器分类占比(单位:百万美金, %) 资料来源:Coherent资料来源:Coherent预测 Coherent预测,AI用激光器占比将从23年的22%增长至28年的62%。 其中,AI用VCSEL激光器市场规模将从23年的2500万美金增长至28年的1.35亿美金,占比从5%提升至11%;AI用EML激光器市场规模将从23年的8100万美金增长至28年的2.47亿美金,占比从14%提升至21%;AI用硅光芯片市场规模将从23年的1900万美金增长至28年的3.46亿美金,占比从3%提升至30%. 1、光模块产业趋势:AI驱动800G/1.6T/3.2T数通光模块快速成长 2、英伟达推出Blackwell系列GPU,提振高速率光模块需求 3、光模块未来路径:CPO、硅光 4、中国光模块产业的崛起 5、投资建议:重点关注中际旭创、新易盛、天孚通信、源杰科技 6、风险提示 请务必参阅正文之后的重要声明11 英伟达于24年3月发布了新一代人工智能芯片BlackwellGPU,新的B200GPU拥有2080亿个晶体管,可提供高达20petaflops的FP4算力,而GB200将两个GPU和一个GraceCPU结合在一起,可为LLM推理工作负载提供30倍的性能,同时还可能大大提高效率,与H100相比,它的成本和能耗最多可降低25倍。 英伟达声称,训练一个1.8万亿个参数的模型以前需要8000个HopperGPU和15兆瓦的电力。如今,2000个BlackwellGPU就能完成这项工作,耗电量仅为4兆瓦。 在具有1750亿个参数的GPT-3LLM基准测试中,GB200的性能是H100的7倍,而英伟达称其训练速度是H100的4倍。 图表13:GB200构成 图表14:过去8年英伟达AIGPU算力呈指数级增长 资料来源:Nvidia 资料来源:Nvidia 12 AI和HPC工作负载的一大限制因素是不同节点之间通信的多节点互连带宽。随着GPU数量的增加,通信成为严重的瓶颈,占用的资源和时间高达60%。通过B200,英伟达推出了第五代NVLink和NVLinkSwitch7.2T。新的NVLink芯片具有1.8TB/s的全对全双向带宽,支持576个GPUNVLink域。 在Blackwell这一代采用了224GSerdes,即sub-link的传输速率为200Gbps*4(4对差分线)/8=100GB/s,从网络来看单向带宽为400Gbps。B200总共有18个sublink,因此构成了100GB/s*18=1.8TB/s的带宽,而从网络的视角来看等同于9个单向400Gbps的接口。同理,在NVSwitch的介绍中声明的是Dual200Gb/secSerDes构成一个400Gbps的Port。 整个NVL72系统由ComputeTray和SwitchTray构成,一个ComputeTray包含两颗GB200子系统,累计4颗BlackwellGPU。一个SwitchTray则包含两颗NVLINKSwitch芯片,累计提供72*2=144个NVLINKPort,单颗芯片结构如下,可以看到上下各36个Port,带宽为7.2TB/s。每个B200有18个NVLINKPort,9个SwitchTray刚好共计18颗NVLINKSwtich芯片,因此每个B200的Port连接一个NVSwitch芯片,累计整个系统单个NVSwitch有72个Port,故整个机器刚好构成NVL72,把72颗B200芯片全部连接起来。 图表15:NvlinkSwitch芯片图表16:NVL72的计算节点和互联节点 资料来源:Nvidia 13资料来源:Nvidia 根据英伟达的产品技术规格信息,NVL72和DGXB200初期仍配备ConnectX-7的网卡,搭配上一代的Quantum-2QM9700交换机,部署初期仍主要配备800G光模块。 根据英伟达GTC大会资料,未来的GB200系统将引入ConnectX-8网卡和Quantum-X800InfiniBand交换机(800Gb/s),届时1.6T光模块需求有望放量。 图表17:NVL72和DGXB200部分技术规格 图表18:英伟达新一代Quantum-X800InfiniBand交换机 资料来源:Nvidia 资料来源:Nvidia官网 14资料来源:Nvidia官网 右表分别展示了搭建DGXH100和NVL72集群,搭配交换机Quantum-2QM9700 (C