您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华鑫证券]:计算机行业周报:AMD公布MI325X同台竞技英伟达,“年更”预示AI芯片竞争趋于白热化 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业周报:AMD公布MI325X同台竞技英伟达,“年更”预示AI芯片竞争趋于白热化

信息技术2024-06-16宝幼琛华鑫证券H***
计算机行业周报:AMD公布MI325X同台竞技英伟达,“年更”预示AI芯片竞争趋于白热化

证 券 研2024年06月16日 究 报AMD公布MI325X同台竞技英伟达,“年更”预 告示AI芯片竞争趋于白热化 推荐(维持)投资要点 —计算机行业周报 分析师:宝幼琛S1050521110002baoyc@cfsc.com.cn 行业相对表现 表现 1M 3M 12M 计算机(申万) -3.8 -15.1 -37.1 沪深300 -2.7 -0.8 -10.6 市场表现 (%)计算机沪深300 10 0 -10 -20 -30 -40 -50 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业动态研究报告:车路一体化项目接连启动,智慧交通市场有望提质增速》2024-06-11 2、《计算机行业周报:英伟达下一代RUBIN架构性能阶跃式提升,迭代速度打破摩尔定律》2024-06-103、《计算机行业周报:Mistral发布首个AI代码模型Codestral,有望成为开源编程大模型先锋》2024-06-02 行业研究 ▌算力:算力租赁价格平稳,AMDInstinct产品线更新MI325X同步英伟达 本周算力租赁价格环比持平。在产业动态方面,近期,AMD董事长兼CEO苏姿丰在Computex2024展会的开幕主题演讲中公布了今年将会推出InstinctMI325X,2025年推出MI350,2026年推出MI400。MI325X将具有更大的算力规模,并转向第四代高带宽内存HBM3E。容量大幅提升至288GB,内存带宽提升至6TB/s。与英伟达相比,MI325X内存大小和单服务器可运行模型参数规模是英伟达H200的2倍。内存带宽、理论FP16算力峰值、理论FP8峰值则是英伟达H200的1.3倍,可谓是AMD史上最大的AI性能提升。同时,MI350的内存容量将是英伟达2025年推出的B200芯片的1.5倍,AI算力是B200芯片的1.2倍。AMD预计将在2026年推出基于CDNA"Next"架构的InstinctMI400加速器系列,一年一更同步英伟达。 ▌AI应用:苹果发布AppleInteligence智能系统,正式开启端侧AI新时代 当地时间6月10日,苹果发布了AppleIntelligence,一款深度集成于iOS18,iPadOS18和macOSSequoia的全新个性化智能系统。AppleIntelligence由多种智能生成模型组成,端侧云端混合并行,专为用户日常任务设计。端侧上,AppleIntelligence拥有约30亿参数的语言模型。在设备端和私有云上,苹果对模型生成的第一个token和后续token的推理过程进行了优化,采用分组查询注意力机制、共享的输入和输出词汇嵌入表。设备端模型词汇量为49000,服务器模型为100000,在iPhone15Pro上,从接收到提示词到生成第一个token所需时间约为0.6毫秒,生成速率为每秒30个token。在AppleIntelligence的加持下,Siri的智能化水平进一步提升,具备更丰富的语言理解能力和用户交互体验。 ▌AI融资动向:MistralAI获6.4亿美元B轮融资 本期AI初创公司的融资中,MistralAI/Cognigy融资额前二,分别为6.4亿/1.0亿美元。MistralAI是欧洲最强的LLM大模型公司, 在多模态、检索增强生成(RAG)等大模型突破方向有着丰富经验,曾开发Mistral7B、Mixtral8x22B等模型,是OpenAI的强劲对手。Cognigy作为AI客服巨头,专注于对话式AI和生成式AI的研究与开发工作,本次融资用于加速AI自动化技术的研发,并推动其全球扩张。 ▌投资建议 巨头入场加速端侧AI发展。2024年AIPC和AI手机的加速落地标志着AI发展的重点逐步向端侧转移,特别是此次WWDC大会上苹果发布的AppleIntelligence体现了AI颠覆传统消费电子设备体验的潜力。基于此,我们建议关注:1)端侧AI优化手机等产品使用体验,大幅提升生产力,有望加速3C换机周期,建议关注AIPC、AI手机硬件产业链;2)AppleIntelligence推理采用端侧和云侧相结合的方案,有望进一步拉动推理算力需求。 建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)等。 ▌风险提示 2024-06-16 EPS PE 公司代码 名称 投资评级 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 股价 2023 2024E 2025E 2023 2024E 2025E 002230.SZ科大讯飞 43.40 0.28 0.40 0.56 155.00 108.50 77.50 买入 002368.SZ太极股份 21.80 0.79 1.01 1.28 27.59 21.58 17.03 买入 603918.SH金桥信息 11.18 0.33 0.49 0.80 33.88 22.82 13.98 买入 资料来源:Wind,华鑫证券研究 正文目录 1、算力动态:算力租赁价格平稳,AMDINSTINCT产品线更新MI325X同步英伟达4 1.1、数据跟踪:算力租赁价格平稳4 1.2、产业动态:Instinct产品线一年一更同步英伟达,新款MI325X算力峰值较H200快1.3倍4 2、AI应用动态:苹果发布APPLEINTELIGENCE智能系统,正式开启端侧AI新时代6 2.1、流量跟踪:天工AI访问量环比+16.37%6 2.2、产业动态:苹果发布AppleInteligence智能系统,正式开启端侧AI新时代7 3、AI融资动向:MISTRALAI获6.4亿美元B轮融资11 4、行情复盘12 5、投资建议13 6、风险提示13 图表目录 图表1:本周算力租赁情况4 图表2:2024-2026年InstinctGPU路线图4 图表3:MI325X性能展示图5 图表4:MI325X与H200性能对比表5 图表5:MI350性能展示图6 图表6:CDNA4与CDNA3推理能力对比图6 图表7:MI350与B200性能对比图6 图表8:2024.6.5-2024.6.11AI相关网站流量7 图表9:摘要用例评估响应占比8 图表10:苹果基础模型与可比较模型回答首选占比8 图表11:敏感有害内容违规率8 图表12:安全性prompt回答首选率9 图表13:指令跟踪评估(IFEval)基准对比结果9 图表14:在各设备上使用Siri从多个应用程序中获取信息10 图表15:本周AI初创公司的融资动态11 图表16:本周指数日涨跌幅12 图表17:本周AI算力指数内部涨跌幅度排名12 图表18:本周AI应用指数内部涨跌幅度排名12 图表19:重点关注公司及盈利预测13 1、算力动态:算力租赁价格平稳,AMDInstinct产品线更新MI325X同步英伟达 1.1、数据跟踪:算力租赁价格平稳 本周算力租赁价格环比持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G的价格为9.00元/时。 图表1:本周算力租赁情况 显卡配 置 CPU 内存磁盘大小(G) 平台名称 价格(每 小时) 价格环比上周 A100-40G1696可自定,额外收费腾讯云28.64/元0.00%12核94G可自定,额外收费阿里云31.58/元0.00% A100-80G 13128系统盘:20G数据盘:50GB 恒源云8.50/元0.00% 16核125G可自定,额外收费阿里云34.74/元0.00% A800-80G16256系统盘:20G 数据盘:50GB 资料来源:腾讯云,阿里云,恒源云,华鑫证券研究 恒源云9.00/元0.00% 1.2、产业动态:Instinct产品线一年一更同步英伟达,新款MI325X算力峰值较H200快1.3倍 近期,AMD董事长兼CEO苏姿丰在Computex2024展会的开幕主题演讲中,公布了全新云端AI加速芯片路线图,路线图显示今年将会推出InstinctMI325X,2025年推出MI350,2026年推出MI400,以满足对AI算力日益增长的需求。 图表2:2024-2026年InstinctGPU路线图 资料来源:澎湃新闻,华鑫证券研究 MI325X将具有更大的算力规模,并转向第四代高带宽内存HBM3E。容量大幅提升至288GB,内存带宽提升至6TB/s,整体的性能将进一步提升。其他方面的规格基本保持与MI300X一致,其可视为MI300更换HBM3E内存的刷新版本,便于客户的产品升级过渡。AI性能提升幅度为AMD史上最大。MI325X内存大小和单服务器可运行模型参数规模是英伟达H200的2倍。内存带宽、理论FP16算力峰值、理论FP8峰值则是英伟达H200的1.3倍。 图表3:MI325X性能展示图 资料来源:澎湃新闻,华鑫证券研究 图表4:MI325X与H200性能对比表 MI325X Advantagevs.H200 Memory 288GBHBM3e 2x MemoryBandwidth 6TB/s 1.3x PeakTheoreticalFP16 1.3PF 1.3x PeakTheoreticalFP8 2.6PF 1.3x ModelSizeperserver 1trillion 2x 资料来源:澎湃新闻,华鑫证券研究 2025年提前推出MI350X以应对英伟达量产H200。InstinctMI350系列的首款产品MI350X加速器基于CDNA4架构,预计将于2025年上市。它将使用与其他MI300系列加速器相同的行业标准通用基板服务器设计,并将使用先进的3nm工艺技术构建,支持FP4和FP6AI数据类型,并拥有高达288GB的HBM3E内存。在推理性能方面,CDNA4架构是 CDNA3的35倍。MI350的内存容量将是英伟达2025年推出的B200芯片的1.5倍,AI算力是B200芯片的1.2倍。其次,AMD预计将在2026年推出基于CDNA"Next"架构的InstinctMI400加速器系列,一年一更同步英伟达。 图表5:MI350性能展示图 资料来源:澎湃新闻,华鑫证券研究 图表6:CDNA4与CDNA3推理能力对比图图表7:MI350与B200性能对比图 资料来源:澎湃新闻,华鑫证券研究资料来源:澎湃新闻,华鑫证券研究 2、AI应用动态:苹果发布AppleInteligence智能系统,正式开启端侧AI新时代 2.1、流量跟踪:天工AI访问量环比+16.37% 本期(2024.6.5-2024.6.11)AI相关网站流量数据:访问量前三位分别为ChatGPT (694.9M)、Bing(307.4M)和Discord(263.9M);访问量环比增速前三位分别为天工 AI(16.37%)、Character.AI(8.33%)和Discord(1.89%);平均停留时长前三位分别为Character.AI(0:15:19)、Canva(0:10:03)和Deepl(0:08:40);平均停留时长环比增速前三位分别为天工AI(2.26%)、CatGPT(1.22%)和Character.AI(0.88%)。 图表8:2024.6.5-2024.6.11AI相关网站流量 应用 应用类型 归属公司 周平均访问量 (M) 访问量环比 平均停留时长时长环比 ChatGPT聊天机器人OpenAI694.9M0.03%0:06:551.22% Bing搜索微软307.4M-0.32%