通信 算力调优——未来算力网络的重要拼图 算力资源有限,调度优化问题紧迫。OpenAI此前在技术博客《ScalingKubernetesto2,500nodes》中提到,OpenAIk8s集群从500nodes扩展到2500nodes时遇到诸 证券研究报告|行业点评 2023年07月11日 增持(维持) 多存储、网络和资源初始化问题,通过可视化监控工具Datadog发现ETCD(一种 Key-Value存储服务)写数据存在几百毫秒延迟,listAPI被频繁调用、Fluentd和 DataDog频繁侵占资源等问题。 什么是算力调度?在云计算中,资源调度是一个非确定性多项式优化问题,往往会出现“拆东墙补西墙”这样的情况,因此云计算的算力调度必须考虑每个算力资源请求的需求边界,比如OpenAI团队使用“balloons”占位策略解决资源排队问题: 用一个低优先级pod占着整个节点,要用节点的时候被自动驱逐掉;使用污点策略手动分配每个训练请求能使用的节点。 GPU超算集群中,暴露出的不只是算力调度问题。在此前对英伟达AI超算的研究中,我们的结论是:通信网络是制约数据中心算力高低的关键因素。在多线程并行 计算下,通信成为制约算力的短板,只要有一条交换链路出现网络阻塞或丢包,就 行业走势 64% 48% 32% 16% 0% -16% -32% 通信沪深300 会产生I/O延迟;又如GH200新增显存互联功能,我们认为,相对于无显存互联的超算,GH200对APIserver的并发访问量是指数级增长,将对硬件资源调度提出更高挑战。 多点硬件部署监控效率更高。我们注意到,OpenAI在针对网络监控进行优化时发现Prometheus这类监控系统时常会导致OOM(OutofMemory,内存溢出),从而不得不削减查询频率;每次初始化pod,Prometheus都要重写WAL(Write-ahead logging,预写式日志)拉长启动时间。我们认为,以上问题都可以通过嵌入式的多点硬件层监控系统避免上述问题。我们认为,在传统的计算式和I/O式云计算中,外部串接监控服务器即可满足监控需求,而GPU集群时代,需要并接部署“联邦集群”并进行不同监控服务器的功能划分,最后进行北向汇聚,有望提升监控采集效率、降低超算本身的资源侵占。 网络可视化技术在国内外均处于探索迭代过程中,国内相关厂商的潜在机会巨大。在北美,目前主流的监控工具是Netscout、Prometheus、Datadog等,都是基于在超算本地化部署;但在多点硬件部署的AI超算中,软硬件结合的厂商成长性有望更 为充分,经过多年经验积累的相关国内DPI厂商,形成了高容量下的数据监控能力,有望成为全球算力调优的上游关键角色。 投资建议: 1)重视GPU超算集群中交换网络性能的重要性,而光通信是现有技术下几乎无法替代的交换网络方案,关注光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、德科立、联特科技、华工科技、源杰科技、剑桥科技;算力设备:中兴通讯、 紫光股份、锐捷网络、菲菱科思、恒为科技、工业富联、寒武纪、震有科技。 2)重视网络可视化及算力资源调优策略的软硬件厂商,该品种目前存在较大预期差,关注恒为科技、浩瀚深度、中新赛克。 风险提示:AI发展不及预期,算力需求不及预期。 2022-072022-112023-032023-07 作者 分析师宋嘉吉 执业证书编号:S0680519010002邮箱:songjiaji@gszq.com 分析师黄瀚 执业证书编号:S0680519050002邮箱:huanghan@gszq.com 分析师赵丕业 执业证书编号:S0680522050002邮箱:zhaopiye@gszq.com 分析师邵帅 执业证书编号:S0680522120003邮箱:shaoshuai@gszq.com 相关研究 1、《通信:AI超算下的光互联:光模块、AOC与DAC》 2023-07-09 2、《通信:推特竞品Threads发布,海外流量或迎巨量级拉动》2023-07-07 3、《通信:算力为🖂,逐“光”而行——2023年中期策略》2023-07-02 重点标的 股票代码 股票名称 投资评级 EPS(元) PE 2022A 2023E 2024E 2025E 2022A 2023E 2024E 2025E 300308.SZ 中际旭创 买入 1.53 1.76 2.52 3.01 93.86 81.59 56.98 47.71 300502.SZ 新易盛 买入 1.78 1.66 2.81 3.98 36.43 39.07 23.08 16.29 300394.SZ 天孚通信 买入 1.02 1.32 1.73 2.18 95.95 74.14 56.57 44.89 300570.SZ 太辰光 买入 0.87 1.08 1.25 58.48 47.11 40.70 资料来源:Wind,国盛证券研究所 请仔细阅读本报告末页声明 2023年07月11日 免责声明 国盛证券有限责任公司(以下简称“本公司”)具有中国证监会许可的证券投资咨询业务资格。本报告仅供本公司的客户使用。本公司不会因接收人收到本报告而视其为客户。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。 本报告的信息均来源于本公司认为可信的公开资料,但本公司及其研究人员对该等信息的准确性及完整性不作任何保证。本报告中的资料、意见及预测仅反映本公司于发布本报告当日的判断,可能会随时调整。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息及资料保持在最新状态,对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本公司力求报告内容客观、公正,但本报告所载的资料、工具、意见、信息及推测只提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,本公司不就报告中的内容对最终操作建议做出任何担保。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素。 投资者应注意,在法律许可的情况下,本公司及其本公司的关联机构可能会持有本报告中涉及的公司所发行的证券并进行交易,也可能为这些公司正在提供或争取提供投资银行、财务顾问和金融产品等各种金融服务。 本报告版权归“国盛证券有限责任公司”所有。未经事先本公司书面授权,任何机构或个人不得对本报告进行任何形式的发布、复制。任何机构或个人如引用、刊发本报告,需注明出处为“国盛证券研究所”,且不得对本报告进行有悖原意的删节或修改。 分析师声明 本报告署名分析师在此声明:我们具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,本报告所表述的任何观点均精准地反映了我们对标的证券和发行人的个人看法,结论不受任何第三方的授意或影响。我们所得报酬的任何部分无论是在过去、现在及将来均不会与本报告中的具体投资建议或观点有直接或间接联系。 投资评级说明 投资建议的评级标准 评级 说明 评级标准为报告发布日后的6个月内公司股价(或行业指数)相对同期基准指数的相对市场表现。其中A股市场以沪深300指数为基准;新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准;香港市场以摩根士丹利中国指数为基准,美股市场以标普500指数或纳斯达克综合指数为基准。 股票评级 买入 相对同期基准指数涨幅在15%以上 增持 相对同期基准指数涨幅在5%~15%之间 持有 相对同期基准指数涨幅在-5%~+5%之间 减持 相对同期基准指数跌幅在5%以上 行业评级 增持 相对同期基准指数涨幅在10%以上 中性 相对同期基准指数涨幅在-10%~+10%之间 减持 相对同期基准指数跌幅在10%以上 国盛证券研究所 北京上海 地址:北京市西城区平安里西大街26号楼3层邮编:100032 传真:010-57671718 邮箱:gsresearch@gszq.com 地址:上海市浦明路868号保利One561号楼10层邮编:200120 电话:021-38124100 邮箱:gsresearch@gszq.com 南昌深圳 地址:南昌市红谷滩新区凤凰中大道1115号北京银行大厦邮编:330038 传真:0791-86281485 邮箱:gsresearch@gszq.com 地址:深圳市福田区福华三路100号鼎和大厦24楼邮编:518033 邮箱:gsresearch@gszq.com P.2请仔细阅读本报告末页声明