您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华创证券]:通信行业周报:关注国内外AI训练算力平台,光模块光器件有望核心受益 - 发现报告
当前位置:首页/行业研究/报告详情/

通信行业周报:关注国内外AI训练算力平台,光模块光器件有望核心受益

信息技术2023-10-09欧子兴华创证券G***
通信行业周报:关注国内外AI训练算力平台,光模块光器件有望核心受益

行情回顾。本周通信行业(申万)上涨了0.15%,跑赢沪深300指数涨幅(-1.32%)1.48个百分点,跑赢创业板指数涨幅(-0.47%)0.62个百分点。今年以来通信行业(申万)上涨了34.61%,跑赢沪深300指数涨幅(-4.70%)39.32个百分点,跑赢创业板指数涨幅(-14.61%)49.22个百分点。本周通信行业涨幅(0.15%)在所有一级行业中排序第六,全年涨幅排序第一。截至本周末,通信行业(申万)估值PE- TTM 为30.40,同期沪深300 PE- TTM 为11.52,创业板指数PE- TTM 为29.37。本周通信板块涨幅前五分别为精伦电子(+46.7%)、中贝通信(+27.2%)、菲菱科思(+23.4%)、元道通信(+19.5%)、佳讯飞鸿(+14.5%); 本周通信板块跌幅前五分别为*ST新海(-15.3%)、天邑股份(-9.9%)、中兴通讯(-6.0%)、德科立(-5.7%)、ST高升(-4.8%)。 Tesla Dojo进入量产阶段,华为Atlas 900迭代出全新版本。2019年4月,Dojo相关信息首次披露,经过4年的技术完善,于2023年7月前后正式投入量产,并计划于2024年10月达到100 exaFLOPs算力水平。Dojo搭载特斯拉自主研发的神经网络训练芯片-D1 Die,单个D1 Die集合354个Training nodes(类似GPU核心),算力性能达到362 TFlops BF16/CFP8,单个训练模块则包含25个D1 Die。借助超强算力,特斯拉将主要在自动驾驶领域应用Dojo训练,采用路况、驾驶情况等数据对自动驾驶软件进行迭代升级。华为Atlas 900方面,2019华为发布AI训练集群Atlas 900,时隔四年,华为于近日发布了全新架构的昇腾AI计算集群Atlas 900 Super Cluster,用来支持超万亿参数的大模型训练。Atlas 900 AI搭载数千颗昇腾910 AI处理器,总算力达到256P~1024P FLOPS @FP16。Atlas 900 Super Cluster新集群采用华为星河AI智算交换机Cloud Engine XH16800,借助其高密的800GE端口能力,两层交换网络即可实现2250节点超大规模无收敛集群组网。Atlas 900 AI集群主要为大型数据集神经网络训练提供超强算力,协助进行图像、视频和语音等AI模型训练,助力探索宇宙奥秘、预测天气、勘探石油,并加速自动驾驶的商用进程。 超大型AI训练集群引发算力高需求,光模块光器件有望核心受益,建议关注中际旭创、天孚通信、光迅科技。单个Dojo Cabinet包含2个System Tray,每个System Tray由6个Training Tiles和20个DIP所组成,其中单个DIP需对外提供50GB/s(即400Gbs)的TTP over Ethernet接口,以实现Z-plane连接,因此单个Dojo Cabinet将产生40个400GbE接口需求。若此类接口需求均通过光模块实现连接,Dojo的量产将释放大量400G/800G光模块需求。今年新发布的Atlas 900 SuperCluster采用了全新的华为星河AI智算交换机CloudEngine XH16800,并借助其高密的800GE端口提升数据处理速度。华为CloudEngine-X系列最多支持288个800GE端口,以实现交换机和交换机之间、存储设备与交换机之间、以及存储区域网络,服务器和交换机之间的连接。由此可以推测,Atlas 900 SuperCluster的发布与生产将会对800G光模块产生较大规模需求空间。我们认为光模块光器件行业有望在此背景下核心受益,建议关注中际旭创、天孚通信、光迅科技。 运营商重点推荐中国电信、中国移动、中国联通;设备及代工企业重点推荐共进股份,建议关注紫光股份、中兴通讯、锐捷网络;光模块光器件光芯片建议关注中际旭创、天孚通信、光迅科技、新易盛、源杰科技;光纤光缆建议关注长飞光纤、亨通光电、中天科技;IDC建议关注奥飞数据、光环新网、科华数据;物联网模组重点推荐广和通、移为通信,建议关注威胜信息;控制器重点推荐拓邦股份、和而泰;卫星通信重点推荐铖昌科技;军工通信重点推荐七一 二、上海瀚讯;会议系统重点推荐亿联网络;5G消息重点推荐梦网科技;通信网络管维建议关注润建股份。 风险提示:宏观经济下滑风险,下游算力需求不及预期,光模块光器件行业竞争加剧,AI训练集群对国内算力产业链的传导不及预期。 一、AI算力建设浪潮下,AI训练集群网络成为布局重点 AI训练集群中,Tesla Dojo与华为Atlas 900受到广泛关注。在当前算力建设高速起步阶段,国内外多家厂商已启动算力领域布局。Tesla在算力领域已经有所成绩,其在2021已经建设投用三个HPC(高性能计算机)集群,含有10,000个GPU。马斯克宣布2024年投入Dojo建设的金额将超过10亿美元,使得Dojo成为算力领域的关注焦点之一。而华为开发的Atlas 900集群网络由于其强悍的训练能力以及极致的处理速度成为国内AI训练集群的代表网络之一。 (一)Tesla Dojo训练模型投入量产,自动驾驶成为关键应用领域 Tesla Dojo于今年7月正式上线,预期于2024年初跻身全球算力Top5。2019年4月,马斯克于Tesla Autonomy Investor Day官宣特斯拉正在研发超强性能的训练计算网络,正式披露名称为“Dojo”。经过4年的研发改进,Dojo于2023年7月前后正式投产,特斯拉同时预计Dojo将会成为全球前五的大型超级计算机。 图表1 Dojo相关信息演进时间线 Tesla Dojo架构始于Training node,最终形成网络系统。对Dojo进行微观结构的细分,其物理架构可以拆解的最小单元为Training nodes,可以类比为GPU核心。单个Training node拥有1.25 MB SRAM(静态随机存储器),具有400 GBps的加载速度, 270 GBps的存储速度。在每个链接方向上能够达到1TFlop的BF16 /CFP8算力值,单个node直接与相邻的4个nodes相互连接,nodes间双向带宽达到256 GB/s。 图表2 Training node的微观组织架构 Training nodes组成D1 Die,进一步组装形成Training Tile。354个Training nodes以2D形式排布组成D1 Die,D1 Die的SRAM共440 MB,算力性能达到362 TFlops BF16/CFP8,22 TFlops FP32 @2GHz,具有完整的取指、译码、执行功能。25个D1 Die按照5*5的矩阵式排布组成单个Training Tile,单个Tile的功率为15kw,是供电与冷却的核心单元。 图表3单个D1 Die由354个Training nodes组成 图表4单个Training Tile由25个D1 Die组成 Training Tile边缘配备Dojo Interface Processor(DIP),共同组成System Tray,进一步形成Dojo机柜。据2022 Tesla AI open day中的介绍,DIP将排布在6个Tile组成的2*3矩阵周围,主要功能为存储量扩容,形成共享的DRAM和单独的D1核心SRAM,DIP提供了800GBps的内存带宽,32 GB的HBM内存,其次提供与Host System(主要以CPU为主)相连接的接口。单个Dojo机柜则由两层System Tray和Host System组成,由此则形成Dojo的最小的集群单元。 图表5 System Tray由6个Tile,以及其周围的DIP组成(上为Tile,下为DIP) 图表6两个System Tray构成Dojo机柜 Tesla Dojo将主要用于训练自动驾驶相关软件。在2023年第二季度盈利报告中,特斯拉披露了大规模解决自动所需的“四大技术支柱”:超大现实世界数据集、神经网络训练、车辆硬件和车辆软件。公司在报告中同时表示将生产Dojo超级计算机用于自动驾驶相关软件的训练,向更优质的神经网络训练前进。 图表7训练的数据集来源于多种场景 (二)华为Atlas 900 AI集群网络经过多年积累沉淀,性能达到新高峰 华为Atlas 900布局良久,2023年发布更高性能迭代版本。2019年9月18日,在第四届HUAWEI CONNECT 2019(华为全联接大会)上,华为发布当时全球最快AI训练集群Atlas 900,并表达华为坚定不移地投入计算产业的决心。时隔四年,在HUAWEI CONNECT 2023期间,华为正式发布了全新架构的昇腾AI计算集群Atlas 900 Super Cluster,用来支持超万亿参数的大模型训练。 Atlas 900作为算力巅峰代表,搭载多颗昇腾处理器。Atlas 900 AI作为算力巅峰代表之一,由数千颗昇腾910 AI处理器构成,整合HCCS、PCIe4.0和100G RoCE三种高速接口,总算力达到256P~1024P FLOPS @FP16,相当于50万台PC的计算能力。Atlas 900在衡量AI计算能力的金标准ResNet-50图片分类模型下,训练仅耗59.8秒,在同等精度下领先世界纪录10秒。而Atlas 900 Super Cluster新集群采用华为星河AI智算交换机Cloud Engine XH16800,借助其高密的800GE端口能力,两层交换网络即可实现2250节点(等效于18000张卡)超大规模无收敛集群组网。 图表8 Atlas 900系统网络联接架构示意图 Atlas 900借助强大计算能力,应用领域广泛。Atlas 900 AI集群主要为大型数据集神经网络训练提供超强算力,可广泛应用于科学研究与商业创新,协助研究人员更快进行图像、视频和语音等AI模型训练,更高效地探索宇宙奥秘、预测天气、勘探石油,并加速自动驾驶的商用进程。尤其是在天文领域,华为联合上海天文台与SKA(Square Kilometre Array)共同打造星体识别平台,借助Atlas 900对含有特定特征的星体进行识别,只需10秒即可从20万颗星星中检索出相应特征的星体,相较以往的借助人力识别大大提高识别效率。 图表9 Atlas 900系统应用领域(部分) 二、超大型AI训练集群引发算力高需求,光模块光器件有望核心受益 以Dojo和Atlas为代表的超大型AI训练集群引发算力高需求,预计在此背景下,光模块光器件行业有望核心受益。 从Dojo网络架构视角来看:单个Dojo Cabinet包含2个System Tray,每个System Tray由6个Training Tiles和20个DIP所组成,其中单个DIP需对外提供50GB/s(即400Gbs)的TTP over Ethernet接口,以实现Z-plane连接,因此单个Dojo Cabinet将产生40个400GbE接口需求。TTP通过以太网交换机实现所有DIP的连接,从而实现每个Training Tiles之间实现高速无阻塞通信,我们判断其中的以太网交换机将使用fat-tree架构进行组网。ExaPOD由120个Training Tiles所组成,即由10台Dojo Cabinet组成集群实现,其中将使用到多台以太网交换机实现连接,从而产生大量的400GbE接口需求。若此类接口需求均通过光模块实现连接,Dojo的量产将释放大量400G/800G光模块需求。 Atlas 900的不断迭代,有望提高高速光模块需求:今年新发布的Atlas 900 SuperCluster采用了全新的华为星河AI智算交换机CloudEngine XH16800,并借助其高密的800GE端口提升数据处理速度。华为CloudEngine-