您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:800G LPO:AI时代最具潜力的技术路线 - 发现报告
当前位置:首页/行业研究/报告详情/

800G LPO:AI时代最具潜力的技术路线

信息技术2023-05-16宋嘉吉、黄瀚、赵丕业国盛证券更***
800G LPO:AI时代最具潜力的技术路线

通信 800GLPO:AI时代最具潜力的技术路线 LPO方案:低功耗、低延迟、低成本、可插拔。LPO通过线性直驱技术替换传统的DSP,将其功能集成到交换芯片中,只留下driver和TIA芯片。LPO光模块中用到的TIA、driver芯片性能也有所提升,从而实现更好的线性度。 目前主流方案有进一步性能提升空间。目前主流的PAM4+DSP解决方案具有较好的信号处理能力,表现在电口适应性强、光电性能好等,但在功耗和 证券研究报告|行业专题研究 2023年05月16日 增持(维持) 行业走势 成本上有进一步提高空间。在400GZR中DSP模块功耗占比49%。在成本上,DSP价格较高,400G光模块中,DSP的BOM成本约占20-40%。 LPO方案解决了高功耗、高成本、高延迟的问题。LPO功耗相较可插拔光模块下降50%,与CPO接近。根据Macom的数据,具有DSP功能的800G多模光模块的功耗可超过13W,而利用MACOMPUREDRIVE技术的800G 多模光模块功耗低于4W。延迟上,去掉DSP芯片后,系统减少了对信号复 64% 48% 32% 16% 0% -16% 通信沪深300 原的时间,延迟大幅降低。另外,相比于CPO,LPO采用可插拔模块,便于维护,并且可以充分利用现有的成熟技术。 AI算力需求爆发带动800G光模块放量。大模型、大数据、大算力日益成为AIGC应用的核心制约。大模型和数据集是AIGC发展的软件基础,而算 力是最为重要的基础设施。AI以并行计算为主,核心处理器主要为GPU,但除了GPU性能外,通信因素也会成为制约超算的短板,只要有一条链路出现网络阻塞,就会产生数据延迟。因此,AI服务器对于底层数据传输速率和延时要求非常苛刻,需要高速率的光模块匹配。 我们认为,LPO技术是800G时代最具潜力路线。DSP芯片由7nm制程向5nm制程演进,设计、制造成本水涨船高。而LPO方案能够大幅降低功耗和延时,并具有成本优势。而其系统误码率和传输距离较短的缺陷,在AI 计算中心短距离应用场景下也得到弥补。因此,LPO方案能够高度契合AI 计算中心短距离、大带宽、低功耗、低延时的需求。 LPO有望在2024年底迎来量产。LightCounting预计业内将在2024年底首次部署LPO光模块。目前新易盛、剑桥科技等已发布相关产品,中际旭创已有技术储备和产品开发,海信推出800G线性互联光缆。高线性度的 TIA、Driver芯片作为LPO技术的核心零部件,目前有Macom、Semtech、美信等主要供应商,博通也在推进相关产品研发。目前,剑桥科技与Macom深入合作,且正在向微软供货高速光模块,我们认为,北美云厂商正在积极扩充算力资源,未来微软、Meta、AWS、谷歌都有可能逐步接受LPO方案,建议持续关注。 风险提示:光模块市场需求不及预期;相关技术研发进度不及预期。 2022-052022-092023-012023-05 作者 分析师宋嘉吉 执业证书编号:S0680519010002邮箱:songjiaji@gszq.com 分析师黄瀚 执业证书编号:S0680519050002邮箱:huanghan@gszq.com 分析师赵丕业 执业证书编号:S0680522050002邮箱:zhaopiye@gszq.com 相关研究 1、《通信:算力——AI从玩具向工具的使能者》 2023-05-14 2、《区块链:OpenAI创始人的Web3愿景:Worldcoin打造AI数字通行证》2023-05-10 3、《通信:AI调整之后的思考》2023-05-08 重点标的 股票代码 股票名称 投资评级 EPS(元) PE 2022A 2023E 2024E 2025E 2022A 2023E 2024E 2025E 300308.SZ 中际旭创 买入 1.53 1.76 2.52 3.01 49.56 43.09 30.09 25.19 300502.SZ 新易盛 买入 1.78 1.66 2.81 3.98 35.26 37.81 22.34 15.77 300394.SZ 天孚通信 买入 1.02 1.32 1.73 2.18 51.57 39.85 30.40 24.13 资料来源:Wind,国盛证券研究所 请仔细阅读本报告末页声明 内容目录 1.800GLPO:AI时代最具潜力的技术路线3 2.行业:量产将至,800G光模块最具潜力方案7 3.风险提示9 图表目录 图表1:不同速率的光模块技术现状3 图表2:QSFP56-DD、OSFP、CFP8封装的400G光模块对比3 图表3:NRZ技术与PAM4技术对比4 图表4:PAM4原理图4 图表5:简化的接收端PAM4+DSP架构4 图表6:400GZR光模块中各器件功耗占比4 图表7:LPO原理图5 图表8:DSPvsLinear-drive功耗对比6 图表9:传统光模块、LPO、CPO特性比较6 图表10:国内光模块厂商的LPO进展6 图表11:新易盛800GLPO产品系列7 图表12:全球前15名云厂商资本支出预测7 图表13:NVLinkNetwork+IB网络架构拓扑7 图表14:光模块市场空间预测(单位:百万美元)8 图表15:叶脊架构与传统三层拓扑结构对比8 1.800GLPO:AI时代最具潜力的技术路线 LPO简介:LPO(lineardrivepluggableoptics,线性驱动可插拨光模块),主要运用于高速光模块领域,就是通过线性直驱技术替换传统的DSP,实现系统降功耗、降延迟的优势,但系统误码率和传输距离有所牺牲。该技术适用于数据中心等短距离传输场景。 LPO技术主要用于高速率光模块中。光模块传输速率涵盖很大的范围,根据传输速率的不同,光模块可分为155M、622M、1.25G、2.5G、8G、10G、16G、25G、32G、40G、 50G、100G、200G、400G等。传输速率越高的光模块,结构越复杂。根据封装类型的不同,光模块可分为SFP、eSFP、SFP+、XFP、SFP28、QSFP28、QSFP+、CXP、CFP、CSFP等。 图表1:不同速率的光模块技术现状 资料来源:中国信通院:《5G承载光模块》白皮书,国盛证券研究所 400G及以上速率的光模块主要有QSFP-DD、CFP8和OSFP封装。随着5G建设、数据要素规模的演进以及AIGC对海量数据传输的需求,电信、数通领域需要更强性能的光交换机,也因此需要更高速率的光模块。目前主流的200G/400G/800G的产品都是基于PAM4技术+DSP芯片来实现高速信号的调制、传输和恢复。 图表2:QSFP56-DD、OSFP、CFP8封装的400G光模块对比 资料来源:鲜枣课堂,国盛证券研究所 PAM4(4-LevelPulseAmplitudeModulation,四电平脉冲幅度调制)是一种调制技术,采用4个不同的信号电平来进行信号传输,每个信号周期可以传输2bit信息。而传统数字信号通过不归零编码(Non-Return-to-Zero,NRZ)来传输信号,只有高、低电平代表1、0两种信号,每个信号周期能够传输1bit信息。这样一来,PAM4就能携带NRZ两倍的信息量,从而实现传输速率的倍增。PAM4的优势在于可以在不增加带宽的情况下提高传输速率,缺陷在于对噪声更敏感,其眼图开口更小,难以将原始信号区分开来。 图表3:NRZ技术与PAM4技术对比图表4:PAM4原理图 资料来源:Tektronix,国盛证券研究所资料来源:Fibermall,国盛证券研究所 PAM4的调制方法包括基于DSP的数字DAC实现方法和基于模拟的组合方法。主流模拟模式可以通过添加两个NRZ信号通道来工作,数字模型基于高速DAC,可实现0/1/2/3电平的快速输出。DSP是数字信号处理技术,主要用于解决光通信系统中的数字时钟恢 复、色散、带宽不足引起的低通滤波效应、偏振旋转等问题,消除噪声和非线性干扰。对于100G以上的单波应用,目前的电驱动芯片和接收端光器件无法达到50GHz以上的带宽,相当于在发射端引入低通滤波器,造成码间干扰,使得接收器无法恢复正确信号。引入DSP后,信号可以在发送端进行压缩,在接收端通过自适应非递归(FIR)滤波器恢复,从而减少对光器件带宽的要求。PAM4+DSP解决方案具有较好的信号处理能力,表现在电口适应性强、光电性能好等,但具有更高的功耗和成本。下图可以看到,在400GZR中DSP模块功耗占比49%。 图表5:简化的接收端PAM4+DSP架构图表6:400GZR光模块中各器件功耗占比 资料来源:R.Nagarajan,et.al.,"LowPowerDSP-BasedTransceiversforDataCenterOpticalFiberCommunications",JournalofLightwaveTechnology39,5221(2021),国盛证券研究所 资料来源:R.Nagarajan,et.al.,"LowPowerDSP-BasedTransceiversforDataCenterOpticalFiberCommunications",JournalofLightwaveTechnology39,5221(2021),国盛证券研究所 LPO方案相较于PAM4+DSP有何优势? 为了降低DSP的功耗和延迟,LPO概念应运而生。LPO技术去掉了DSP芯片,将其功能集成到交换芯片中,只留下驱动(Driver)和跨阻放大(TransimpedanceAmplifier,TIA)芯片。LPO光模块中用到的TIA、driver芯片性能有所提升,从而实现更好的线性度。但是,LPO的系统误码率和传输距离有所影响,因此这项技术只适用于短距离的应用场景,例如数据中心服务器到架顶交换机的链接。 图表7:DSP与LPO原理对比 资料来源:Dell,OFC2023,国盛证券研究所 LPO技术具有以下几个优点: (1)低功耗。LPO功耗相较可插拔光模块下降50%,与CPO接近。图表8显示采用 Linear-drive方案后,硅光、VCSEL、薄膜铌酸锂功耗均下降50%左右。根据Macom的 数据,具有DSP功能的800G多模光模块的功耗可超过13W。而利用MACOMPUREDRIVE技术的800G多模光模块功耗低于4W,下降70%。低功耗不仅节省电能,而且能够减少模块内组件的发热。 (2)低延迟。去掉DSP芯片后,系统减少了对信号复原的时间,延迟大幅降低。DSP/ 重定时功能增加了延迟,以MACOMPUREDRIVE技术为例,因采用信号串行方案,LPO 光模块可以做到皮秒级别的延迟时间。 (3)低成本。DSP价格较高,400G光模块中,DSP的BOM成本约占20-40%;LPO 的Driver和TIA里集成了EQ功能,成本会较DSP上浮少许,但LPO方案还是可以将光 模块成本下降许多。 (4)可热插拔。相比于CPO,LPO没有显著改变光模块的封装形式,采用可插拔模块,便于维护,并且可以充分利用现有的成熟技术。 图表8:无需DSP的Linear-drive可以节省25%功耗图表9:LPO、CPO特性比较 资料来源:Arista,国盛证券研究所资料来源:Dell,OFC2023,国盛证券研究所 半导体厂商Macom已发布LPO解决方案MACOMPUREDRIVE,与标准的DSP架构相比具有以下优势:(1)将光互连功耗降低50%以上;(2)最小化链路延迟,对机器学习和人工智能应用至关重要;(3)消除了成本高昂且冗余的信号重定时模块;(4)解决了独立的DSP芯片发热的问题;(5)简化了模块实现,具有更大的灵活性;(6)减少占地面积以满足空间受限的设计要求;(7)可扩展至1.6T速率。 LPO产业进度:国内外并驾齐驱。LPO作为一种新技术,预计2024年年底量产,目前新易盛、剑