行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

通信行业周报：关注国内外AI训练算力平台，光模块光器件有望核心受益

信息技术 2023-10-09 欧子兴华创证券 GHK

投资必备研报查询平台发现报告，官网地址www.fxbaogao.com。这里汇集市场绝大多数研报资料，宏观、行业、个股、财报类报告一应俱全，整体报告储备量级远超同行平台。长期拥有庞大稳定用户流量，依靠扎实技术实力保障数据时效，极简体验提升用户信息检索整体效率。

本篇研报主要关注国内外AI训练算力平台，光模块光器件有望核心受益。Tesla Dojo进入量产阶段，华为Atlas 900 迭代出全新版本。这两个超大型AI训练集群将引发算力高需求，光模块光器件有望核心受益。建议关注中际旭创、天孚通信、光迅科技。此外，运营商方面，中国电信、中国移动、中国联通是重点推荐。

行情回顾。本周通信行业（申万）上涨了0.15%，跑赢沪深300指数涨幅（-1.32%）1.48个百分点，跑赢创业板指数涨幅（-0.47%）0.62个百分点。今年以来通信行业（申万）上涨了34.61%，跑赢沪深300指数涨幅（-4.70%）39.32个百分点，跑赢创业板指数涨幅（-14.61%）49.22个百分点。本周通信行业涨幅（0.15%）在所有一级行业中排序第六，全年涨幅排序第一。截至本周末，通信行业（申万）估值PE- TTM 为30.40，同期沪深300 PE- TTM 为11.52，创业板指数PE- TTM 为29.37。本周通信板块涨幅前五分别为精伦电子（+46.7%）、中贝通信（+27.2%）、菲菱科思（+23.4%）、元道通信（+19.5%）、佳讯飞鸿（+14.5%）；本周通信板块跌幅前五分别为*ST新海（-15.3%）、天邑股份（-9.9%）、中兴通讯（-6.0%）、德科立（-5.7%）、ST高升（-4.8%）。 Tesla Dojo进入量产阶段，华为Atlas 900迭代出全新版本。2019年4月，Dojo相关信息首次披露，经过4年的技术完善，于2023年7月前后正式投入量产，并计划于2024年10月达到100 exaFLOPs算力水平。Dojo搭载特斯拉自主研发的神经网络训练芯片-D1 Die，单个D1 Die集合354个Training nodes（类似GPU核心），算力性能达到362 TFlops BF16/CFP8，单个训练模块则包含25个D1 Die。借助超强算力，特斯拉将主要在自动驾驶领域应用Dojo训练，采用路况、驾驶情况等数据对自动驾驶软件进行迭代升级。华为Atlas 900方面，2019华为发布AI训练集群Atlas 900，时隔四年，华为于近日发布了全新架构的昇腾AI计算集群Atlas 900 Super Cluster，用来支持超万亿参数的大模型训练。Atlas 900 AI搭载数千颗昇腾910 AI处理器，总算力达到256P～1024P FLOPS @FP16。Atlas 900 Super Cluster新集群采用华为星河AI智算交换机Cloud Engine XH16800，借助其高密的800GE端口能力，两层交换网络即可实现2250节点超大规模无收敛集群组网。Atlas 900 AI集群主要为大型数据集神经网络训练提供超强算力，协助进行图像、视频和语音等AI模型训练，助力探索宇宙奥秘、预测天气、勘探石油，并加速自动驾驶的商用进程。超大型AI训练集群引发算力高需求，光模块光器件有望核心受益，建议关注中际旭创、天孚通信、光迅科技。单个Dojo Cabinet包含2个System Tray，每个System Tray由6个Training Tiles和20个DIP所组成，其中单个DIP需对外提供50GB/s（即400Gbs）的TTP over Ethernet接口，以实现Z-plane连接，因此单个Dojo Cabinet将产生40个400GbE接口需求。若此类接口需求均通过光模块实现连接，Dojo的量产将释放大量400G/800G光模块需求。今年新发布的Atlas 900 SuperCluster采用了全新的华为星河AI智算交换机CloudEngine XH16800,并借助其高密的800GE端口提升数据处理速度。华为CloudEngine-X系列最多支持288个800GE端口，以实现交换机和交换机之间、存储设备与交换机之间、以及存储区域网络，服务器和交换机之间的连接。由此可以推测，Atlas 900 SuperCluster的发布与生产将会对800G光模块产生较大规模需求空间。我们认为光模块光器件行业有望在此背景下核心受益，建议关注中际旭创、天孚通信、光迅科技。运营商重点推荐中国电信、中国移动、中国联通；设备及代工企业重点推荐共进股份，建议关注紫光股份、中兴通讯、锐捷网络；光模块光器件光芯片建议关注中际旭创、天孚通信、光迅科技、新易盛、源杰科技；光纤光缆建议关注长飞光纤、亨通光电、中天科技；IDC建议关注奥飞数据、光环新网、科华数据；物联网模组重点推荐广和通、移为通信，建议关注威胜信息；控制器重点推荐拓邦股份、和而泰；卫星通信重点推荐铖昌科技；军工通信重点推荐七一二、上海瀚讯；会议系统重点推荐亿联网络；5G消息重点推荐梦网科技；通信网络管维建议关注润建股份。风险提示：宏观经济下滑风险，下游算力需求不及预期，光模块光器件行业竞争加剧，AI训练集群对国内算力产业链的传导不及预期。一、AI算力建设浪潮下，AI训练集群网络成为布局重点 AI训练集群中，Tesla Dojo与华为Atlas 900受到广泛关注。在当前算力建设高速起步阶段，国内外多家厂商已启动算力领域布局。Tesla在算力领域已经有所成绩，其在2021已经建设投用三个HPC（高性能计算机）集群，含有10,000个GPU。马斯克宣布2024年投入Dojo建设的金额将超过10亿美元，使得Dojo成为算力领域的关注焦点之一。而华为开发的Atlas 900集群网络由于其强悍的训练能力以及极致的处理速度成为国内AI训练集群的代表网络之一。（一）Tesla Dojo训练模型投入量产，自动驾驶成为关键应用领域 Tesla Dojo于今年7月正式上线，预期于2024年初跻身全球算力Top5。2019年4月，马斯克于Tesla Autonomy Investor Day官宣特斯拉正在研发超强性能的训练计算网络，正式披露名称为“Dojo”。经过4年的研发改进，Dojo于2023年7月前后正式投产，特斯拉同时预计Dojo将会成为全球前五的大型超级计算机。图表1 Dojo相关信息演进时间线 Tesla Dojo架构始于Training node，最终形成网络系统。对Dojo进行微观结构的细分，其物理架构可以拆解的最小单元为Training nodes，可以类比为GPU核心。单个Training node拥有1.25 MB SRAM（静态随机存储器），具有400 GBps的加载速度, 270 GBps的存储速度。在每个链接方向上能够达到1TFlop的BF16 /CFP8算力值，单个node直接与相邻的4个nodes相互连接，nodes间双向带宽达到256 GB/s。图表2 Training node的微观组织架构 Training nodes组成D1 Die，进一步组装形成Training Tile。354个Training nodes以2D形式排布组成D1 Die，D1 Die的SRAM共440 MB，算力性能达到362 TFlops BF16/CFP8，22 TFlops FP32 @2GHz，具有完整的取指、译码、执行功能。25个D1 Die按照5*5的矩阵式排布组成单个Training Tile，单个Tile的功率为15kw，是供电与冷却的核心单元。图表3单个D1 Die由354个Training nodes组成图表4单个Training Tile由25个D1 Die组成 Training Tile边缘配备Dojo Interface Processor（DIP），共同组成System Tray，进一步形成Dojo机柜。据2022 Tesla AI open day中的介绍，DIP将排布在6个Tile组成的2*3矩阵周围，主要功能为存储量扩容，形成共享的DRAM和单独的D1核心SRAM，DIP提供了800GBps的内存带宽，32 GB的HBM内存，其次提供与Host System（主要以CPU为主）相连接的接口。单个Dojo机柜则由两层System Tray和Host System组成，由此则形成Dojo的最小的集群单元。图表5 System Tray由6个Tile，以及其周围的DIP组成（上为Tile，下为DIP）图表6两个System Tray构成Dojo机柜 Tesla Dojo将主要用于训练自动驾驶相关软件。在2023年第二季度盈利报告中，特斯拉披露了大规模解决自动所需的“四大技术支柱”：超大现实世界数据集、神经网络训练、车辆硬件和车辆软件。公司在报告中同时表示将生产Dojo超级计算机用于自动驾驶相关软件的训练，向更优质的神经网络训练前进。图表7训练的数据集来源于多种场景（二）华为Atlas 900 AI集群网络经过多年积累沉淀，性能达到新高峰华为Atlas 900布局良久，2023年发布更高性能迭代版本。2019年9月18日，在第四届HUAWEI CONNECT 2019（华为全联接大会）上，华为发布当时全球最快AI训练集群Atlas 900，并表达华为坚定不移地投入计算产业的决心。时隔四年，在HUAWEI CONNECT 2023期间，华为正式发布了全新架构的昇腾AI计算集群Atlas 900 Super Cluster，用来支持超万亿参数的大模型训练。 Atlas 900作为算力巅峰代表，搭载多颗昇腾处理器。Atlas 900 AI作为算力巅峰代表之一，由数千颗昇腾910 AI处理器构成，整合HCCS、PCIe4.0和100G RoCE三种高速接口，总算力达到256P～1024P FLOPS @FP16，相当于50万台PC的计算能力。Atlas 900在衡量AI计算能力的金标准ResNet-50图片分类模型下，训练仅耗59.8秒，在同等精度下领先世界纪录10秒。而Atlas 900 Super Cluster新集群采用华为星河AI智算交换机Cloud Engine XH16800，借助其高密的800GE端口能力，两层交换网络即可实现2250节点(等效于18000张卡)超大规模无收敛集群组网。图表8 Atlas 900系统网络联接架构示意图 Atlas 900借助强大计算能力，应用领域广泛。Atlas 900 AI集群主要为大型数据集神经网络训练提供超强算力，可广泛应用于科学研究与商业创新，协助研究人员更快进行图像、视频和语音等AI模型训练，更高效地探索宇宙奥秘、预测天气、勘探石油，并加速自动驾驶的商用进程。尤其是在天文领域，华为联合上海天文台与SKA（Square Kilometre Array）共同打造星体识别平台，借助Atlas 900对含有特定特征的星体进行识别，只需10秒即可从20万颗星星中检索出相应特征的星体，相较以往的借助人力识别大大提高识别效率。图表9 Atlas 900系统应用领域（部分）二、超大型AI训练集群引发算力高需求，光模块光器件有望核心受益以Dojo和Atlas为代表的超大型AI训练集群引发算力高需求，预计在此背景下，光模块光器件行业有望核心受益。从Dojo网络架构视角来看：单个Dojo Cabinet包含2个System Tray，每个System Tray由6个Training Tiles和20个DIP所组成，其中单个DIP需对外提供50GB/s（即400Gbs）的TTP over Ethernet接口，以实现Z-plane连接，因此单个Dojo Cabinet将产生40个400GbE接口需求。TTP通过以太网交换机实现所有DIP的连接，从而实现每个Training Tiles之间实现高速无阻塞通信，我们判断其中的以太网交换机将使用fat-tree架构进行组网。ExaPOD由120个Training Tiles所组成，即由10台Dojo Cabinet组成集群实现，其中将使用到多台以太网交换机实现连接，从而产生大量的400GbE接口需求。若此类接口需求均通过光模块实现连接，Dojo的量产将释放大量400G/800G光模块需求。 Atlas 900的不断迭代，有望提高高速光模块需求：今年新发布的Atlas 900 SuperCluster采用了全新的华为星河AI智算交换机CloudEngine XH16800,并借助其高密的800GE端口提升数据处理速度。华为CloudEngine-

点击免费查看完整报告

通信行业周报：关注国内外AI训练算力平台，光模块光器件有望核心受益

你可能感兴趣

通信行业周观点：光模块光器件继续领涨，关注算力景气度传导

通信行业跟踪周报：国内外5G共建共享，PCB、光模块等环节业绩持续超预期，关注运营商、硬件供应商受益机会

通信行业2024年度中期投资策略：重点关注确定受益AI和国产算力需求的核心标的

【风口研报·公司】铟金属为光器件磷化铟战略原料，这家公司今年铟锭产量有望增长750pct，同时参股PCB钻针企业受益AI PCB微钻需求；高质量训练数据是AI规模化应用“燃料”，这家公司客户覆盖行业龙头-20260514

通信行业：字节旗下火山引擎升级大模型训练云平台，关注AI算力基础设施投资机会

通信行业周报：ChatGPT有望推动算力基础设施需求增长，建议关注通信设备与光模块产业链

安信通信基础设施系列报告之光模块需求测算：AI训练及推理有望带动高速率光模块用量

无源+有源光器件平台化布局，全面受益AI算力建设浪潮

【公告全知道】CPO+光模块+AI算力+数据中心+芯片+国企改革！光通信全产业链龙头光器件行业排名全球前四

【风口研报·公司】苹果+华为的核心供应商实现消费电子+通信业务双轮驱动，有望受益关税缓和+AI算力服务器、端侧设备放量预期，对应明-年PE不到10倍