您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[西部证券]:AI行业跟踪25期:Computex+2024百花齐放,Mamba架构第二代发布 - 发现报告
当前位置:首页/行业研究/报告详情/

AI行业跟踪25期:Computex+2024百花齐放,Mamba架构第二代发布

信息技术2024-06-13西部证券测***
AI行业跟踪25期:Computex+2024百花齐放,Mamba架构第二代发布

· 行业周报|通信 Computex2024百花齐放,Mamba架构第二代发布 AI行业跟踪25期(20240603-20240607) 核心结论 证券研究报告 2024年06月13日 行业要闻追踪 Computex2024开幕,各大厂商纷纷推出重磅发布。1)英伟达公布未来架构路线图,发布多方面新产品推动AI产业商业化;2)AMD发布一系列CPU、 GPU产品及路线图,包括全新Zen5架构的Ryzen9000系列CPU、AIPC芯片、数据中心芯片等;3)英特尔发布新笔记本处理器架构LunarLake,提前布局AIPC。 新架构Mamba更新第二代,论文作者发现transformer与SSM高度相关。Mamba2在处理长序列数据方面展现出了显著的优势,对Transformer和SSM两大主流技术的统一为未来深度学习模型的设计与优化提供了新的理论基础。 大模型架构的变化可能会给AI领域带来一系列的更新和迭代。 投资建议:多模态大模型发展推动智能体性能提升,AI训练和推理需求将进一步升级,带动数据中心升级和GB200NVL72的部署。建议关注美国AI算力A股受益标的,光模块关注中际旭创、天孚通信等;液冷关注英维克等。 行情回顾 本周我们构建的西部AI股票池中,其中108家A股公司整体周平均跌幅6.42%,53家美股公司整体周平均涨幅0.70%。A股公司中,PCB板块涨幅最大,为3.81%。涨幅居前十的个股分别是胜宏科技(+11.56%)、云天励飞 (+8.87%)、工业富联(+7.07%)、新易盛(5.06%)、沪电股份(+4.8%)、紫光股份(+4.09%)、寒武纪(+3.55%)、鹏鼎控股(+2.81%)、神州泰岳(+2.13%)、海康威视(+1.56%)。美股市场中涨幅居前五的个股分别是Coherent(+15.46%)、慧与(+13.48%)、CrowdStrikeHoldings(+11.30%)、英伟达(+10.27%)、台积电 (+8.84%)。 投资建议:AIGC和数字中国共振,算力托底。国内智算中心的加速部署,催化AI服务器、交换机、光模块、光芯片、温控设备等核心环节需求增长和技术加速升级。建议关注运营商、IDC及AI算力租赁、ICT设备商、光模块(中 际旭创、天孚通信等);散热领域(英维克等)。 AI应用的发展是影响AI板块估值的核心矛盾。AI行业目前仍处在产业初期,整体处在行业曲线的上升阶段。在AI产业高速成长初期,投资逻辑上来看核心关注应用端增量需求的创造,投资节奏来看,前期是算力基础设施建设和大模型训练先行,后期重点关注应用持续强化带来机会。 风险提示:技术落地不及预期、硬件设备市场接受度不及预期、监管政策风险、中美贸易摩擦风险 分析师 陈彤S0800522100004 chentongg@research.xbmail.com.cn 相关研究 通信:戴尔业绩增收不增利,芯片巨头共推“UALink”—AI行业跟踪24期 (202405027-202405031)2024-06-02 通信:英伟达财报超预期,微软AIPC体验升级—AI行业跟踪23期 (20240520-20240524)2024-05-27 通信:看好品牌出海和制造出海,关注时间、空间和比较优势—通信行业出海专题2024-05-20 索引 内容目录 一、AI行业重点事件点评3 1.1Computex2024开幕,头部玩家重磅新品发布3 1.2新架构Mamba更新第二代,transformer与SSM高度相关7 二、AI行业动态一览8 2.1国外行业动态8 2.2国内行业动态9 2.3行业展会/大会前瞻梳理9 三、AI行情回顾:A股PCB板块涨幅明显,其他板块呈不同涨跌幅10 四、投资建议:持续关注AI应用和算力基础设施11 五、风险提示11 图表目录 图1:Blackwell比起上一代Hopper性能明显提升4 图2:英伟达GPU路线图4 图3:RyzenAI300系列芯片概况5 图4:CPU核心Zen5各项规格5 图5:MI325X和H200的比较5 图6:InstinctGPU路线图5 图7:LunarLake概况6 图8:英特尔处理器路线图6 图9:A股AI行业细分板块周涨跌幅对比(06.03-06.17)11 图10:美股AI行业细分板块周涨跌幅对比(06.03-06.17)11 表1:英伟达产品路线表3 表2:Transformer竞争者介绍8 一、AI行业重点事件点评 1.1Computex2024开幕,头部玩家重磅新品发布 事件:全球第二、亚洲最大的国际电脑展Computex2024于6月4号到7号在台北世界贸易中心举办,各大厂商带来众多新品发布。 点评: 亮点1:英伟达公布未来架构路线图,发布多方面新产品推动AI产业商业化 在大会上,黄仁勋不仅宣布了现在最强大GPUBlackwell已经投入量产的消息,还公开了直到2027年的技术路线图,其中包括GPU、CPU、NVlink、NIC网卡以及交换芯片。 计算芯片方面,黄仁勋表示英伟达将保持一年一次的更新节奏,确保所有产品实现100% 架构兼容。 BlackwellUltra系列GPU将于2025年发布,搭载8个HBM3e内存堆栈; 下一代RubinGPU预计将在2026年推出,搭载8个HBM4内存堆栈,配对的新一代Arm数据中心CPUVara也将问世。 RubinUltra系列预计将于2027年推出,将搭载12个HBM4内存堆栈。网络互联方面,英伟达在2024-2026年每年也将推出一代Spectrum-X新品。 2024年3月份,英伟达在GTC开发者大会上推出Quantum-X800平台(包括QuantumQ3400交换机和ConnectX-8SuperNIC网卡)和Spectrum-X800平台(包括SpectrumSN5600800Gb/s以太网交换机和BF3400GSuperNIC网卡),主要用于万卡算力集群互联; 2025年,预计推出以太网SpectrumUltraX800(51.2T)以太网交换机、CX8800GSuperNIC网卡,可用于实现十万卡算力集群互联; 2026年,预计将推出InfiniBand和以太网的X1600(102.4T)交换机、CX91600GSuperNIC网卡,将支持百万卡集群互联。同时,英伟达第6代NVLinkswitch也将在2026年推出,带宽容量高达3600GB/s,卡间互联速率持续增长。 表1:英伟达产品路线表 英伟达新品计划表2025年 2026年 2027年 计算芯片 GPUBlackwellUltra RubinGPU RubinUltra 数据中心ArmCPUVara 网络互连 SpectrumUltraX80051.2T以太网交换机和CX8800GSuperNIC网卡 Quantum-X1600平台(用于IB网络) / Spectrum-X1600平台(用于以太网网络) / 第6代NVLinkswitch 资料来源:机器之心,西部证券研发中心 单服务器功耗提升促使液冷应用大势所趋。英伟达持续推出性能更强劲的新品以及配套设 施以支持AI产业发展,助力AI组网向着万卡、十万卡等大规模集群发展,同时随着单个服务器功耗不断提高,原有风冷散热模组体积巨大,空间利用率差的问题逐渐凸显,液冷转型势在必行。 图1:Blackwell比起上一代Hopper性能明显提升图2:英伟达GPU路线图 资料来源:机器之心,西部证券研发中心资料来源:机器之心,西部证券研发中心 除此之外,英伟达还有三项比较重要的发布: 1、为PC游戏和应用提供基于上下文感知帮助的游戏助手ProjectG-Assist。ProjectG-Assist可以接收玩家的语音或文本输入,同时还可以获取游戏窗口中的快照作为输入。这些输入给模型提供上下文感知和特定于应用程序的理解,之后ProjectG-Assist输出文本或AI语音作为响应。ProjectG-Assist在游戏指导和性能调优方面非常有用。 2、NVIDIANIM(NVIDIAInferenceMicroservice)是英伟达推出的一项AI模型推理服务。这项服务允许英伟达开发者通过NIM将AI模型部署在云、数据中心或工作站上, 从而轻松构建生成式AI应用。NIM的推出大大缩短了部署AI模型的时间,从数周缩短至几分钟,显著提高了开发者的工作效率。 3、NVIDIAIsaacROS3.0机器人平台,黄仁勋展示了Foxconn如何利用NVIDIAOmniverse、Isaac和Metropolis创建数字孪生,通过结合视觉AI与机器人开发工具 来实现增强的机器人设施。NVIDIAIsaac平台为开发者构建AI机器人提供强大的套件,包括由AI模型以及JetsonOrin、Thor等超级计算机驱动的AMR、工业机械臂和人形机器人。黄仁勋说,机器人和物理AI正在成为现实。 亮点2:AMD发布一系列CPU、GPU产品及路线图,包括全新Zen5架构的Ryzen9000系列CPU、AIPC芯片、数据中心芯片等。 AMD发布了全新的Zen5CPU架构,并基于该架构推出了两个系列的PC芯片:面向笔记本电脑端的RyzenAI300系列和桌面端的Ryzen9000系列处理器。Zen5是AMD迄今设计的性能和能效均最高的核心,该核心拥有一个新的并行双管道前端,旨在提高分 支预测准确性并减少延迟,并能够在每个时钟周期提供更高的性能。此外,Zen5具有更宽的CPU引擎指令窗口,可以并行运行更多指令,以实现领先的计算吞吐量和效率。与Zen4相比,Zen5的指令带宽增加了一倍,缓存和浮点单元之间的数据带宽增加了一倍,AI性能增加了一倍,同时具有完整的AVX512吞吐量。 1、RyzenAI300系列芯片集成了独立的NPUAI引擎和GPU内核。NPU采用了全新的 XDNA2架构,并引入了全新的BlockFP16浮点精度技术,进一步提升了性能。锐龙AI300系列采用了XDNAAINPU,号称移动端最强NPU,算力达50TOPS,超过了高通骁龙XElite的45TOPS、英特尔LunarLake的40-45TOPS。 2、Ryzen99950X拥有16个核心和32个线程,加速后运行速度可以高达5.67GHz。Zen5的平均每个核心指令比之前的Ryzen芯片以及「Genoa」Epyc9000系列处理器中使用的Zen4核心多16%。此外,TDP为170W,L2+L3缓存为80MB。预计产品今年七月上市。 图3:RyzenAI300系列芯片概况图4:CPU核心Zen5各项规格 资料来源:科创板日报,西部证券研发中心资料来源:机器之心,西部证券研发中心 一同发布的还有号称全球最强数据中心CPU的第五代「Turin」EPYC霄龙芯片。从基础信息参数来看,Turin具有192个Zen5核心和384个线程,采用与GenoaEpyc 9004s相同的SP5插槽适配。从放出的比较效果来看,128核心的Turin芯片是64核心英特尔「EmeraldRapids」XeonSP-8592+工作量的约3.1倍。在基于MetaLlama27B模型的AI吞吐量基准测试中,128核心的Turin芯片是英特尔竞品CPU性能的 2.5倍到5.4倍之间,具体数值取决于工作负载。 最后值得提到的是InstinctGPU,它是AMD未来产品战略的一个重要抓手。今年推出的MI325X,内存增加了2倍达288GB;带宽增加了30%达6TB/秒,MI325X最快将在今年第四季度推出。为了在与英伟达系列GPU的竞争中取得优势,AMD提前了MI350X的发布时间,MI350X采用了全新CDNA4架构、台积电3纳米工艺、288GB的HBM3E内存以及FP6、FP4数据类型。在推理性能方面,CDNA4架构是CDNA3的35倍。MI350的内存容量将是英伟达2025年推出