证券研究报告|行业点评报告 2023年12月10日 谷歌OCS全光交换机,相关投资有望加强 评级及分析师信息 行业评级:推荐行业走势图 48%36%23%11%-2% -14% 2022/122023/032023/062023/092023/1 通信沪深300 分析师:马军邮箱:majun@hx168.com.cnSACNO:S1120523090003联系电话:分析师:宋辉邮箱:songhui@hx168.com.cnSACNO:S1120519080003联系电话:分析师:柳珏廷邮箱:liujt@hx168.com.cnSACNO:S1120520040002联系电话: 通信行业 1、谷歌大模型底层基础,自研网络架构Apollo 北京时间12月6日,谷歌正式发布多模态大模型Gemini和TPU系统CloudTPUv5p。同时谷歌自研TPU和光电路交换机OCS进入大众视野,相关投资有望加强。 谷歌的OCS系统代号为Apollo,基于自研OCS,意图取代Clos拓扑架构,降低相关电力及资本支出成本。其三大核心硬件包括光开关PalomarOCS、WDM光模块和光环形器(集成在光模块内)。 受益于当前AI需求的紧俏,相关应用需求有望对光模块整体需求量存在一定拉升效益。我们认为,两大方案仍在很长时间段内共存,但是谷歌的Apollo结构对于脊交换机(Spine层)等的替换,使得相关高速率光模块需求是不如NVIB形式的,长期看伴随制造及微镜调配的工艺升级,通过增加更多端口数的系统,相关OCS架构可能会向更下一层渗透,从而降低光模块需求。 当前时点,OCS方案对于光模块数量拉动不大,但是其集成光环形器的波分复用光模块对于单个光模块ASP将明显提升,相关受益标的为中际旭创; 此外系统中采用大量光纤准直器、透镜等光学基本材料,相关受益标的包括天孚通信、腾景科技、光迅科技等; 光纤环形器及跳线主要厂商为传统通信侧相关设备厂商;AOC有源光缆替代DAC直连电缆相关受益标的包括博创科技等。 2、通信板块观点 当前时点,面临全球地缘政治冲突及中美科技博弈的多重不确定性情况,TMT行业对国产替代、自主可控等政策发展具有阶段性影响,从而催化包括算力租赁、卫星通信、鲲鹏体系等热点主题;当前算力相关板块回调,市场分歧,中长期我们仍坚定看好相关行业的高成长与大空间。 1)电信运营商:中国移动、中国电信、中国联通等; 2)持续推荐算力&通信基础设施 无线通信&服务器等设备商:中兴通讯、紫光股份(华西通信&计算机联合覆盖)等; 相关配套服务商:英维克(液冷)、新能源(电源); 算力第三方租赁:光环新网、奥飞数据、中贝通信、网宿科技、数据港等。 3)光网络升级 光模块及光放大器:光迅科技、天孚通信、德科立、中际旭创、新易盛; 请仔细阅读在本报告尾部的重要法律声明 激光器受益标的:源杰科技、长光华芯。4)军工通信:烽火电子(华西通信&军工联合覆盖)、海格通信 (华西通信&军工联合覆盖)、七一二等; 5)工业互联:金卡智能(华西通信&机械联合覆盖)、威胜信息等; 6)液晶面板:TCL科技(华西通信&电子联合覆盖)等。 3、风险提示 相关技术应用推广不及预期;设备生产良率不及预期;生态拓展不及预期;系统性风险。 1.谷歌大模型底层基础,自研网络架构Apollo 北京时间12月6日,谷歌正式发布多模态大模型Gemini和TPU系统CloudTPUv5p。 Gemini是一个多模态大模型,意味着它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。Gemini有三个版本:Ultra、Pro和Nano,分别适用于不同的场景。其中,Ultra版适用于大型数据中心等处理高复杂度任务的场景;Pro版则适用于各种扩展任务,属于日常使用的模型,并且已经被搭载在谷歌的对话机器人Bard中;而Nano版则是应用于智能手机等移动设备终端上的模型。 谷歌同时发布了迄今为止“最强大、最高效、可扩展的TPU系统”CloudTPUv5p,专为训练尖端的人工智能模型而设计。新一代TPU在性能上有了显著提升,使得模型训练速度相比前一代提高了2.8倍,将加速Gemini的发展,帮助开发人员和企业客户更快地训练大规模生成式AI模型,让新产品和新功能更快地与客户见面。 另外,谷歌自研TPU和光电路交换机OCS进入大众视野,相关投资有望加强。谷歌很早就开始在其数据中心中部署OCS。2022年谷歌发表论文“Mission Apollo:LandingOpticalCircuitSwitchingatDatacenterScale”,文章详细介 绍了OCS和基于自研OCS实现的Apollo网络架构。 1.1.Apollo核心:自研OCS,意图取代Clos拓扑架构,降低相关电力及资本支出成本 在传统Clos拓扑结构中,数据中心的升级一般按照服务器、机架顶交换机、汇聚区块的逐步升级。在网络的Spine层通常采用EPS型交换机,这些EPS通常小号大量电力。此外,在网络速率每2-3年翻倍的增长速度背景下,整体数据中心部署需要预先部署非常大的Spine层,否则后续逐步增加Spine层将需要重新为整体数据中心布线,都会产生大量新的资本支出。 图1在原100Gb/s汇聚块新增200Gb/s端口的扩容 资料来源:谷歌云,华西证券研究所 谷歌发布Apollo项目,通过引入自研的OpticalCircuitSwitch光路交换机(简称OCS),意图取代传统Clos架构。通俗理解,OCS不再需要在主干层(Spine层)多次进行光电信号转换,而是全光路实现光交叉互联。 图2OCS架构 资料来源:Google,华西证券研究所 1.2.Apollo架构的三大核心硬件:光开关PalomarOCS、WDM光模块和光环形器(OpticalCirculators) 1.2.1.光开关PalomarOCS:创新全光交换设计 OCS主要是基于3DMEMS技术的opticalswitch,其系统的核心原理即光通过光纤进入到OCS系统后,光路交换机通过两组2D的MEMS镜像阵列(可在两个维度上旋转的微机电系统),动态地将光线输入端口映射到输出端口,从而实现任意端口对端口的映射。 图3单个OCS设备通过MEMS镜面将N个输入光纤映射到N个输出光纤的过程 资料来源:Google云,华西证券研究所 在谷歌自研的PalomarOCS系统中,输入输出为两个光纤准直器阵列(fibercollimatorarray)。每个光纤准直器阵列由NxN光纤阵列(fiberarray)和微透镜阵列(2Dlensarray)组成。 而OCS核心为两组2DMEMS镜像阵列组成。每个MEMS阵列含有176个独立可控微镜,目前由于校准工艺等为体最终选定136个可控微镜用于精确调节光的传播方向, 因此输入输出均为136个通道。信号光的传播方向如图中的绿线所示。 此外,系统中还包含两个监控通道,对应图中的红色粗线。监控通道使用850nm波长的光,经过MEMS反射后进入到监控相机处。通过图像处理来反馈控制MEMS阵列,优化链路插损。 图4PalomarOCS光芯设计及光路示意图&光芯招牌及相关关键器件 资料来源:Google,华西证券研究所 在PalomarOCS系统中,MEMS反射镜、光纤准直器及其他组成配件是OCS产品大规模量产的核心要件,此外组装过程中MEMS阵列对齐尤为重要,否则很容易造成数据中断传输。 1.2.2.光环形器:内部集成到CWDM4光模块中 为降低OCS端口和光纤数量,Palomar采用光环形器来建立双向链路。根据Google论文数据,它将需要的OCS端口和光纤电缆数量减少了一半。 图5光环形器作用示意图 资料来源:Google,华西证券研究所 光环形器(OpticalCirculators)是一种具有循环连接的三端口非互易性设备,输入端口1指向端口2,输入端口2指向端口3。其主要依靠双折射晶体 (birefringentcrystals)、磁光法拉第旋转器和偏振器(polarizers)实现。其与波分复用结合广泛应用于通信网络中。尤其在5GMassiveMIMO的大量增加,被广泛应用于DWDM系统。谷歌通过适当的光学涂层和光学重新设计允许环形器的波长范围由c波段扩展到o波段/CWDM4波长区间操作。 图6光环形器结构示例 注:PBS:偏振分束光栅;FR:法拉第旋转器;HWP:半波片 资料来源:Google,华西证券研究所 1.2.3.WDM波分复用技术:与光环形器结合,通信侧技术迁移至机房 波分复用(WDM)是一种利用不同波长的光将多个光信号传输到一根光纤中的技术,在电信应用较为广泛。伴随数据中心中带宽的拓展,采用WDM对于提高布线效率和不断拓展的大型架构也非常重要。 谷歌在过去十年中采用不同的WDM模组。最早采用40Gb/sLR单模CWDM4解决方案。 图7WDM单模互联回顾与未来路线图 资料来源:Google,华西证券研究所 谷歌最早采用40Gb/sLR4单模CWDM4解决方案作为AB间互联设计基准,并逐渐随应用深入升级相关技术,主要包含光学、电学和信号处理三大方面。 (1)对于光学器件,为保持谷歌与业界共同开发更快的光学元件(包括激光器 /光电探测器)等,考虑更高速率及消光比需求,目前已逐渐由DML转移至EML激光器; (2)对于高速IC/电气技术,从模拟CDR向基于ASICs的DSP方案转换; (3)利用新发现的数字功能开发算法,以减轻双向链路中的固有MPI损伤,其中包括前向纠错(FEC)技术的开发。 图8内部集成光环路器的DSP方案CWDM4光模块 资料来源:Google,华西证券研究所 1.3.Apollo网络架构的优缺点 与EPS相比,OCS带来了数据中心网络结构的革新,其主要特征有:①可配置的网络拓扑结构;②灵活的网络拓展与升级。此次OCS被配置进TPU,64个TPU芯片形成一个cube,最外侧六个面上的TPU与48个OCS相连,内部的TPU之间通过电缆连接。48个OCS可以与4096个TPU芯片相连,形成一个大型的超算系统。这使得系统的稳定性得到大幅提升,还可以根据计算任务的大小,灵活地选取所需调用TPU的切片大小,提高计算效率。 OCS的成本占整个TPU的5%,功耗占整个系统的3%。而对于Apollo系统,OCS降低30%的成本和40%的功耗。同时,对于交换机和光学器件升级,也不再需要更换网络主干,OCS使用寿命比传统EPS长的多。 除了能耗与成本优势,OCS系统由于不需要解码数据包,具备低延迟特性。图9在数据中心中采用OCS的优势 料来源:SIGCOMM2023,Google,华西证券研究所 不过,OCS仍具备资源利用率较低、适应性差和插入损耗等缺点。对于OCS系统,通道在数据传输期间相对固定,在通信需求较低时,OCS可能导致带宽浪费,与之相比,光分组交换(OPS)可以动态分配网络资源,从而提高资源利用率;适应性方面,面对多样化、不规律的通信需求可能表现不佳,比如大量小数据包传输等;插入损耗 指光信号切换到其传输介质时损失的信号功率量,比如从激光器到硅光子芯片或从光纤到光电探测器等,插入损耗越大,信号就越弱,谷歌正在研究基于压电的开关技术,以取代当前基于MEMS的系统,前者在插入和回波损耗方面比MEMS系统具有固有优势,切换速度也可能更快。 2.投资机会及逻辑 谷歌推出Gemini,受益于当前AI需求的紧俏,相关应用需求有望对光模块整体需求量存在一定拉升效益。我们认为,两大方案仍在很长时间段内共存,但是谷歌的Apollo结构对于脊交换机(Spine层)等的替换,使得相关高速率光模块需求是不如NVIB形式的,长期看伴随制造及微镜调配的工艺升级,通过增加更多端口数的系统,相关OCS架构可能会向更下一层渗透,从而降低光模块需求。 根据LightCountin