您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[西部证券]:AI行业跟踪20期:OFC2024光通信技术创新升级,开源大模型能力再上台阶240401 - 发现报告
当前位置:首页/行业研究/报告详情/

AI行业跟踪20期:OFC2024光通信技术创新升级,开源大模型能力再上台阶240401

2024-04-01-西部证券等***
AI行业跟踪20期:OFC2024光通信技术创新升级,开源大模型能力再上台阶240401

· 行业周报|通信 OFC2024光通信技术创新升级,开源大模能力再上台阶 证券研究报告 AI行业跟踪20期(20240325-20240329) 核心结论 行业要闻追踪 OFC-2024:光通信产业链加速升级。多家厂商纷纷推出1.6T光模新品; 陈彤S0800522100004 分析师 2024年04月01日 光芯片技术持续升级,多家厂商推出200G芯片和硅光技术新品;全光交换机、液冷、薄膜铌酸锂等新技术趋势崭露头角,创新不断。AI发展加速光模技术升级迭代速度,为高速光模市注入新动力。建议持续关注光通信 产业链环节优质标的:中际旭创、新易盛、天孚通信、华工科技、光迅科技源杰科技等。 MoE大模DBRX上线,开源大模能力再上台阶。Databricks开源了DBRX通用大模,其拥有1320亿参数,并采用混合专家(MoE)架构,多项评测结果优异,超越目前的开源模。马斯克更新Grok1.5,大模 迅速迭代升级。Grok1.5相比上一代显著提升推理与解决问题的能力,并新增长文本理解能力,内存容量增加至上一代的16倍。我们认为,开源大模推进大模加速发展,AI训练和推理需求有望进一步升级,建议关注美AI算力A股益标的,关注光模产业链的中际旭创、天孚通信、新 易盛;PCB环节的沪电股份;AI服务器环节的工业富联等。行情顾 本周(03.25-03.29),我们构建的西部AI股票池中,其中109家A股公司整 体周平跌幅9.01%,53家美股公司整体周平涨幅0.25%。A股公司中AI服务器板跌幅最小,为3.53%,其他板呈不同跌幅。涨幅居前五的个股为浪潮信息(+5.38%)、赛为智能(+4.59%)、飞荣达(+1.29%)、光迅科技(+0.73%)、中兴通讯(+0.39%)。美股公司中,存储芯片板上涨4.48%,排名第一,涨幅居前五的个股为BuzzFeed(+26.22%)、西部数据(+6.73%)、希捷科技(+4.54%)、超微电脑(+3.83%)、CoinbaseGlobal(+3.76%)。 投资建议:AIGC和数字中共振,算力托底。建议关注运营商(中移动中电信、中联通);IDC及AI算力租赁(奥飞数据、光环新网、润泽科 技等);ICT设备商(紫光股份、中兴通讯(已覆盖)、锐捷网络、菲菱科思共进股份);光模(中际旭创(已覆盖)、新易盛、天孚通信(已覆盖)、源杰科技(已覆盖)等);散热领域(英维克(已覆盖)、申菱环境)。 AI应用的发展是影响AI板估值的核心矛盾。AI产业高速成长初期,投资逻辑上来看核心关注应用端增量需求的创造,投资节奏来看,前期是算力 基础设施建设和大模训练先行,后期重点关注应用持续强化带来机会。 风险提示:技术落不及预期、硬件设备市接度不及预期、监管政策风险、中美贸易摩擦风险 chentongg@research.xbmail.com.cn 相关研究 通信:GTC大会发布Blackwell平台,AMD、微软升级AIPC—AI行业跟踪20期 (20240318-20240322)2024-03-24 通信:星舰第三次试飞实现重大突破,重视低轨卫星互联网机会—卫星互联网行业重大事件点评2024-03-17 通信:OpenAI大模赋能机器人,全球首位 AI程序员上线—AI行业跟踪18期 (20240311-20240315)2024-03-17 索引 内容目录 一、AI行业重点事件点评3 1.1OFC-2024:光通信产业链加速升级3 1.2DBRX上线、Grok更新1.5,开源大模型能力再上台阶4 1.2.1MoE大模型DBRX上线,开源大模型能力大幅提升4 1.2.2马斯克更新Grok1.5,大模型迅速迭代升级6 二、AI行业动态一览7 2.1国外行业动态7 2.2国内行业动态8 2.3行业展会/大会前瞻梳理8 三、AI行情回顾:美股存储芯片板块涨幅明显,其他板块呈不同涨跌幅9 四、行业重点公司公告9 五、投资建议:持续关注AI应用和算力基础设施10 六、风险提示11 图表目录 图1:DBRX在语言理解(MMLU)、编程(HumanEval)和数学(GSM8K)基准上均优于目前的开源模型5 图2:DRBX在推理效率上仅次于模型Mixtral-8x785 图3:在长文本能力中,DBRXInstruct表现优于GPT-3.5Turbo6 图4:在RAG基准测试中,DBRXInstruct的表现具有竞争力6 图5:与Grok-1相比,Grok-1.5在数学方面的能力跃升6 图6:Grok-1.5在NIAH评估测试中,可检索长度达128K字节的上下文中的嵌入文本,准确率为100%7 图7:A股AI行业细分板块周涨跌幅对比(03.25-03.29)9 图8:美股AI行业细分板块周涨跌幅对比(03.25-03.29)9 表1:多家企业推出1.6T产品3 表2:光芯片技术升级主要相关产品3 表3:数据中心互连、全光交换机技术、光模块产品以及液冷技术主要更新情况4 一、AI行业重点事件点评 1.1OFC-2024:光通信产业链加速升级 事件:2024年3月26日至28日,OFC2024(光网络与通信研讨会及博览会)在美国举行。 点评: 亮点1:光模块升级至1.6T,显著提升数据中心网络带宽和处理能力。随着AI等技术的发展及应用,数据中心对高吞吐和大带宽的需求越发迫切,以太网/IB等网络速度已经从 25G/50G增长到400G/800G,并有望很快达到1.6T;单通道信号速率逐渐升级到112G,正在向224G领域演进。多家企业在OFC2024上推出了1.6T产品,AI浪潮驱动下,1.6T的迭代周期有望缩短,预期2024年内1.6T有望迎来小批量出货。 表1:多家企业推出1.6T产品 企业名称展示内容 Marvell 展出业界首款1.6TDSP“Nova2”,每通道200G电气和光学I/O,Nova2已经向客户送样 中际旭创演示1.6T-LPO-DR8OSFP模块 新易盛展示业界首款4x200GLPO并宣布8x100GLPO进入量产阶段天孚通信展出适配800G/1.6T和CPO光引擎系列组件产品 光迅科技联合思科推出1.6TOSFP-XD硅光模块 索尔思光电推出业界首款800G4×200GDR4/FR4/LR4OSFP系列产品 资料来源:Marvel官网、iccsz、天孚通信官网,西部证券研发中心 亮点2:光芯片技术持续升级,多家厂商推出200G芯片和硅光技术新品。硅光技术路线作为光I/O技术的一种先进实现形式,通过在硅基芯片上高度集成光电子元件,实现光信 号的高效生成、调制、检测和传输,不仅显著减小了模块体积,还进一步降低了成本。这种技术的发展,不仅解决了数据传输速率的瓶颈问题,还因其良好的性能和低成本潜力,成为光模块技术演进,如CPO(Co-PackagedOptics)等方向的核心技术之一。此次OFC2024,多家企业展示了其最新研究进展,对未来信息技术领域的整体发展,具有重要的意义。 企业名称展示内容 表2:光芯片技术升级主要相关产品 Coherent推出200GVCSEL Marvell发布3DSiPho(硅光)引擎,具备200GI/O带宽,较100G接口产品相比,每比特能降低 30%的功耗 英特尔展出最新OpticalI/O方案——光计算互连(OCI),通过光连接实现计算芯片的互联博通演示200GVCSEL光芯片、用于200G硅光子调制的CW激光器等 资料来源:Coherent官网、Marvel官网、英特尔官网、iccsz,西部证券研发中心 亮点3:全光交换机、液冷、薄膜铌酸锂等新技术趋势崭露头角。本届OFC2024,多家厂商在以上方面更新产品技术,凸显光通信领域在提高数据传输速率、降低能耗、提升系统可靠性和材料技术创新等方面的持续进步。 企业名称展示内容 表3:数据中心互连、全光交换机技术、光模块产品以及液冷技术主要更新情况 中际旭创与Marvell联合推出用于数据中心互连的800GZR/ZR+光模块光迅科技发布OCS全光交换机 Coherent首发全光交换机 新易盛发布SFP112光模块产品组合,为100G数据连接提供最高的单端口密度;发布浸没式800G光模块进军液冷市场 光库科技携手HyperLight联合主办薄膜铌酸锂论坛 资料来源:中际旭创官网、Coherent官网、iccsz,西部证券研发中心 我们认为,AI发展加速光模块技术升级迭代速度,为高速光模块市场注入新动力。本次OFC2024的技术升级路径表明,在AI时代,面对激增的算力需求,光通信企业如何提效降本完成技术迭代是关键。 投资建议:建议持续关注光通信产业链环节优质标的:中际旭创、新易盛、天孚通信、华工科技、光迅科技、源杰科技等。 1.2DBRX上线、Grok更新1.5,开源大模型能力再上台阶 1.2.1MoE大模型DBRX上线,开源大模型能力大幅提升 事件:3月27日,Databricks开源了DBRX通用大模型,其拥有1320亿参数,并采用混合专家(MoE)架构。DBRX的基础和微调版本已在GitHub和HuggingFace上公开 发布,供研究和商业用途使用。 点评: 亮点1:DBRX采用细粒度的专家混合(MoE)架构,大幅提高模型性能和质量。DBRX是一款基于Transformer架构的大型语言模型(LLM)。它采用了细粒度的专家混合(MoE)方法,共有1320亿个参数,其中36亿个参数在任何输入上都处于激活状态。该模型是在12万亿个文本和代码数据token上进行预训练的,最大上下文长度高达3.2ktoken。与其他开源MoE模型如Mixtral和Grok-1相比,DBRX采用了更细粒度的专家设计,共 有16个专家模型,可以从中选择4个进行组合使用。这种组合方式的可能性高达65倍,大幅提高了模型的性能和质量。此外,DBRX还采用了一系列先进的技术,包括旋转位置编码(RoPE)、门控线性单元(GLU)和分组查询注意力(GQA)等,进一步增强了模型的能力。在数据方面,DBRX使用了GPT-4分词器,这是tiktoken存储库中提供的。 亮点2:DBRX多项评测结果优异,超越目前的开源模型。DBRX在语言理解、编程、数学和逻辑等方面轻松击败了目前业内领先的开源大模型,如LLaMA2-70B、Mixtral和 Grok-1。同时,DBRX也在大多数基准测试上超过了GPT-3.5。 图1:DBRX在语言理解(MMLU)、编程(HumanEval)和数学 (GSM8K)基准上均优于目前的开源模型 图2:DRBX在推理效率上仅次于模型Mixtral-8x78 资料来源:量子位,西部证券研发中心资料来源:量子位,西部证券研发中心 亮点3:DBRX在模型质量和推理效率上实现双重提升。DRBX在模型质量上可与Gemini 1.0Pro和MistralMedium竞争,同时速度大大加快,托管在MosaicAIModelServing上时,速度达到了150token/s/用户。一般来说,推理效率和模型质量通常是矛盾的:较大的模型一般质量都会高,但较小的模型推理效率更高。使用MoE架构可以在模型质量和推理效率之间实现比密集模型更好的权衡。此外,DBRX基于斯坦福MegaBlocks开源项目构建,平均只需激活360亿参数来处理token,实现了极高的每秒处理速度。相较于LLaMA2-70B,DBRX的推理速度几乎快两倍,同时其总参数和活动参数数量比Grok小约40%。 亮点4:DBRX在长文本任务中展现较强性能,与业界领先模型相比具有一定竞争力。在长上下文基准测试中,GPT-4Turbo表现最佳,而DBRXInstruct的表现优于GPT-3.5Turbo,与MixtralInstruct整体性能相似。在两个RAG基准(NaturalQuestions和HotPotQA)上,DBRXInstruct与一些开源模型(如MixtralInstruct和LLaMA2-70BChat) 以及GPT