证 券 研2024年06月09日 究 报英伟达下一代RUBIN架构性能阶跃式提升,迭代 告速度打破摩尔定律 推荐(维持)投资要点 —计算机行业周报 分析师:宝幼琛S1050521110002baoyc@cfsc.com.cn 行业相对表现 表现 1M 3M 12M 计算机(申万) -10.0 -16.1 -35.7 沪深300 -2.5 0.8 -6.8 市场表现 (%)计算机沪深300 20 10 0 -10 -20 -30 -40 -50 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业周报:Mistral发布首个AI代码模型Codestral,有望成为开源编程大模型先锋》2024-06-02 2、《计算机行业周报:微软推出COPILOT+PC,“主动式AI”或将开启个人电脑新时代》2024-05-26 3、《计算机行业周报:GPT–4o场景理解力阶跃式提升,“贾维斯时刻”或即将到来》2024-05-20 行业研究 ▌算力:A100-80G租赁价格有所下降,英伟达下一代RUBIN架构性能阶跃式提升 本周算力租赁平台显卡配置为A100-80G中,恒源云13核 +128G价格为8.50元/时,租赁价格有所下降。产业动态上,6月2日英伟达CEO兼创始人黄仁勋于Computex2024上预告了将于2026年、2027年分别推出Blackwell的下一代Rubin架构的首款产品R100与RubinUltra系列产品。新一代Rubin平台架构采用X1600IB/EthernetSwitch,与上一代BlackwellUltra相比,可实现GPU数量由十万个到百万个的阶跃式提升。 ▌AI应用:智谱AI开源GLM-49B系列模型,智能体能力显著增强 6月5日,智谱AI宣布开源其GLM-4-9B系列模型,本次开源的GLM-4-9B系列包括:基础版本GLM-4-9B(8K),对话版本GLM-4-9B-Chat(128K),超长上下文版本GLM-4-9B-Chat-1M (1M)和多模态版本GLM-4V-9B-Chat(8K)。 GLM-4在多个方面实现了显著改进,提升推理速度,大幅降低推理成本。此外,GLM-4-9B显著增强了智能体能力,能够自主根据用户意图,自动理解,规划复杂指令,并灵活调用网页浏览器,代码解释器和多模态文图大模型,以高效完成复杂任务。 ▌AI融资动向:Cohere获4.5亿美元D轮融资 本期AI初创公司的融资中,Cohere/Pika融资额前二,分别为4.5亿/0.8亿美元。Cohere专注于构建NLP模型平台,并采用API技术用于编写和理解自然语言,从而实现人类与机器的语言交互,致力于为开发者提供相关的机器语言处理解决方案。Pika聚焦于生成式视频模型,本次融资过后,Pika计划对软件进行升级,新版本支持生成更高质量、更长时间的视频片段。 ▌投资建议 英伟达将以“一年一代”的节奏推出新的AI芯片,行业龙头 正驱动全球AI芯片产业开启“技术性洗牌”。AI芯片加速迭代的背后是AI服务器市场在2024年将保持强劲增长势头,预计多数ODM厂商的AI服务器出货量和市场份额将实现两位数的增长,特别是搭载高端AI芯片,如英伟达H系列和AMDMI系列的机型等出货量有望实现翻倍。 建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)等。 ▌风险提示 2024-06-09 EPS PE 公司代码 名称 投资评级 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 股价 2023 2024E 2025E 2023 2024E 2025E 002230.SZ科大讯飞 41.51 0.28 0.40 0.56 148.25 103.78 74.13 买入 002368.SZ太极股份 20.08 0.79 1.01 1.28 25.42 19.88 15.69 买入 603918.SH金桥信息 10.54 0.33 0.49 0.80 31.94 21.51 13.18 买入 资料来源:Wind,华鑫证券研究 正文目录 1、算力动态:A100-80G租赁价格有所下降,英伟达下一代RUBIN架构性能阶跃式提升4 1.1、数据跟踪:A100-80G租赁价格有所下降4 1.2、产业动态:英伟达宣布新一代Rubin架构,容量与性能实现阶跃式提升4 2、AI应用动态:智谱AI开源GLM-49B系列模型,智能体能力显著增强6 2.1、流量跟踪:5月360AI搜索访问量环比+332.79%6 2.2、产业动态:智谱AI开源GLM-49B系列模型,进一步推动大模型渗透布局8 3、AI融资动向:COHERE获4.5亿美元D轮融资9 4、行情复盘10 5、投资建议12 6、风险提示12 图表目录 图表1:本周算力租赁情况4 图表2:英伟达智能芯片路线图4 图表3:BlackwellPlatform产品展示5 图表4:RubinPlatform产品展示5 图表5:Blackwell平台与Rubin平台产品对比5 图表6:Spectrum-X扩展节奏曲线6 图表7:2024.5.28-2024.5.31AI相关网站流量6 图表8:2024年5月全球AI增速榜7 图表9:对话模型典型任务测评结果9 图表10:基座模型典型任务测评结果9 图表11:GLM-4V-9B多模态能力展示9 图表12:本周AI初创公司的融资动态10 图表13:本周指数日涨跌幅11 图表14:本周AI算力指数内部涨跌幅度排名11 图表15:本周AI应用指数内部涨跌幅度排名11 图表16:重点关注公司及盈利预测12 1、算力动态:A100-80G租赁价格有所下降,英伟达下一代Rubin架构性能阶跃式提升 1.1、数据跟踪:A100-80G租赁价格有所下降 本周恒源云A100-80G租赁价格有所下降,其余环比持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G的价格为9.00元/时。 图表1:本周算力租赁情况 显卡配CPU 置 内存 磁盘大小(G) 平台名称 价格(每小时) 价格环比上周 A100-40G16 96 可自定,额外收费 腾讯云 28.64/元 0.00% 12核 94G 可自定,额外收费 阿里云 31.58/元 0.00% A100-80G 13核128系统盘:20G数据盘:50GB 恒源云8.50/元-5.56% 16核125G可自定,额外收费阿里云34.74/元0.00% A800-80G16256系统盘:20G 数据盘:50GB 资料来源:腾讯云,阿里云,恒源云,华鑫证券研究 恒源云9.00/元0.00% 1.2、产业动态:英伟达宣布新一代Rubin架构,容量与性能实现阶跃式提升 6月2日,英伟达CEO兼创始人黄仁勋于Computex2024上分享了新半导体路线图,预告了将于2026年、2027年分别推出Blackwell的下一代Rubin架构的首款产品R100与RubinUltra系列产品。同时,英伟达承诺将以“一年一代“的节奏推出新的AI芯片,更新频率相比之前明显增快,凸显其在激烈的AI芯片市场军备竞赛中保持领先地位的决心。 图表2:英伟达智能芯片路线图 资料来源:IT之家,华鑫证券研究 Rubin架构实现高宽带储存技术新跃升。将于2025年推出的Blackwell使用的仍是8层HBM3e标准的高带宽内存,每个堆栈仅有1024位接口。与此前推出的BlackwellGPU架构相比,Rubin架构的一大创新是其首次集成了8层HBM4高带宽储存技术,而RubinUltra系列则进一步升级,支持12层HBM4储存技术。新一代HBM4高带宽内存技术采用更宽的2048位内存接口,这意味着Rubin架构将实现容量与性能双项提升。 图表3:BlackwellPlatform产品展示图表4:RubinPlatform产品展示 资料来源:NVIDIA,华鑫证券研究资料来源:NVIDIA,华鑫证券研究 Rubin平台产品全面更新,超级芯片VeraRubin性能倍增。CPU方面,此前英伟达公布的于2024-2025年推出的BlackwellGPU仍与GraceCPU融合,而RubinGPU将与新一代的VeraCPU融合并同步推出,共同构成VeraRubin超级芯片,实现由GraceBlackwell到VeraRubin的芯片迭代,其目标是超越现有的GraceHopper超级芯片。传输速率方面,Rubin架构将采用新一代NVLink6Switch,连接速率高达3600Gpbs,速率是NVLink5的两倍。同时,Rubin平台还采用CX9SuperNIC组件,其速率可达1600Gpbs,数据传输效率比之Blackwell平台有所提升。新一代Rubin平台架构采用X1600IB/EthernetSwitch,与上一代BlackwellUltra相比,可实现GPU数量由十万个到百万个的阶跃式提升。 图表5:Blackwell平台与Rubin平台产品对比 Blackwell架构Rubin架构 GPU储存技术BlackwellGPU 8SHBM3e RubinGPU 8SHBM4 CPUGraceCPUVeraCPU NVLinkNVLink5Switch 1800GB/sec NVLink6Switch3600GB/sec SuperNICCX8SuperNICCX9SuperNIC1600GB/sec Spectrum-XSpectrum-X800EthernetSwitchQuantum-X800Switch Ultra系列GPUBlackwellUltraGPU8SHBM3e12H Spectrum-X1600IB/Ethernet RubinUltraGPU12SHBM4 Ultra系列 Spectrum-X 资料来源:NVIDIA,华鑫证券研究 Spectrum-X800 EthernetSwitch512-Radix- 图表6:Spectrum-X扩展节奏曲线 资料来源:NVIDIA,华鑫证券研究 2、AI应用动态:智谱AI开源GLM-49B系列模型,智能体能力显著增强 2.1、流量跟踪:5月360AI搜索访问量环比+332.79% 本期(2024.5.28-2024.5.31)AI相关网站流量数据:访问量前三位分别为ChatGPT (694.7M)、Bing(308.4M)和Discord(259.0M);访问量环比增速前三位分别为文心一言(8.42%)、Character.AI(5.17%)和NotionAI(1.66%);平均停留时长前三位分别为Character.AI(0:15:11)、Canva(0:10:02)和Midjourney(0:10:02);平均停留时长环比增速前三位分别为天工AI(1.92%)、文心一言(1.09%)和Character.AI(0.89%)。 图表7:2024.5.28-2024.5.31AI相关网站流量 应用 应用类型 归属公司 周平均 访问量(M) 访问量环比 平均停留时 长 时长环比 694.7M 0:06:50 Bing 搜索 微软 308.4M -0.80% 0:06:54 -0.72% Discord 游戏社区 微软 259.0M -1.37% 0:06:31 -0.26% Canva 在线设计 Canva 141.2M -2.22% 0:10:02 -0.17% Github 代码托管 微软 103.0M -