2024年01月17日 电子 证券研究报告 AI浪潮势不可挡,昇腾发力铸造国产算力基石 投资评级领先大市-A维持评级 从“性能指标”到“性能密度指标”,海外高端芯片进口受限范围扩大:999563344 首选股票目标价(元)评级 2023年10月17日,美国商务部出台了出口管制清单的ECNN 3A090和4A090要求,以进一步限制高性能AI芯片的出口,同时将13家中国公司列入实体清单。在新规发布之前,超过旧规性能指标限制的芯片仅为英伟达A100,但当加入性能密度指标后,新规不仅限制了厂商出略低于性能标准的芯片以规避限制情况,同时针对数据中心芯片与非数据中心芯片进行了不同的限制约定,使更多的英伟达芯片受到禁令限制。修改后的出国管制设计产品包括但不限于:英伟达A100、A800、H100、H800、L40、L40S以及RTX 4090产品。实际上,任何集成了一个或多个及以上的芯片的系统,包括但不限于英伟达DGX、HGX系统,都在新规涵盖范围之内。 全球科技巨头纷纷布局算力芯片,AI浪潮势不可挡: AMD推出的“MI系列+Infinity Fabric+ROCm平台”,性能强劲,成为英伟达全球范围内最强劲的对手。特斯拉自研Dojo超算服务器助力自动驾驶,在芯片间互连技术上独具特色,具备强大的扩展性。Intel推出GPU系列芯片和oneAPI开发平台,不断完善其AI数据中心布局。Google推出Cloud TPU解决方案,在机器学习领域。Meta布局自研AI生态,2020年正式推出第一代MTIA方案,侧重于处理低/中复杂度模型。英伟达在GPU领域深耕数十年,根据Jon PeddieResearch(JPR)报告显示,2023年Q1,英伟达GPU市场份额达到84%,Q2达到80%,但全球各大科技巨头结合其自身优势纷纷布局算力芯片。 马良分析师SAC执业证书编号:S1450518060001maliang2@essence.com.cn 朱思分析师SAC执业证书编号:S1450523090002zhusi1@essence.com.cn 相关报告 CES展会新品纷呈,AI与显示交互成为焦点2024-01-14高 端 国 产 替 代 系 列--光 刻胶:半导体制造核心材料,国产替代突围在即2024-01-10高通推出第二代骁龙XR2+平台,原生鸿蒙生态有望迎来快速发展2024-01-07华为、小米新车相继发布,全球首款商务AI PC亮相2024-01-01苹果MR发售在即,美光业绩超预期2023-12-24 完整的芯片生态“软件+硬件”缺一不可,华为推出全系列昇腾解决方案: 一个完整的芯片生态中仅有硬件芯片是不够的,软件系统开发的便捷性以及现有系统的迁移难度同样至关重要。现阶段英伟达通过其“芯片+NVLINK+CUDA”构建产品高护城河,在GPU市场长期占据全球市场领导地位。华为推出全系列昇腾解决方案,包括自研的昇腾芯片+高速芯片间接口+AI计算架构,从软硬件上和主流厂商对标,昇腾芯片基于自研的达芬奇架构,功耗低,产品性能优异,从官方披露的数据来看,2019年推出的昇腾910,在半精度FP16运算速度可达 320TFLOPS,整型INT8算力可达640TOPS,英伟达A100的FP16运算性能为312TFLOPS。 相关公司:兴森科技、新益昌、天承科技、德邦科技、华海诚科、英维克、飞荣达、思泉新材、恒铭达、华丰科技、沪电股份、世运电路、胜宏科技、方正科技。 风险提示:宏观因素波动影响下游需求;市场开拓不及预期;行业竞争加剧; 内容目录 1.美国加强限制规则,海外高性能芯片进口受限...................................61.1.从“性能指标”到“性能密度指标”,英伟达高端芯片进口受限范围扩大...........61.2.人工智能大势所趋,各地政策推进实施...................................72.构建完整的芯片生态系统,“硬件+软件”缺一不可.................................83.华为昇腾软硬件全面布局,构建国产AI算力基石...............................113.1.昇腾生态包括全栈的AI计算基础设施、行业应用及服务....................113.2.基于“自研芯片+自研接口+自研软件生态”,华为推出全系列解决方案.........144.科技巨头纷纷布局算力芯片,AI浪潮势不可挡.................................184.1. AMD的“MI系列+Infinity Fabric+ROCm平台”,成为英伟达全球范围内最强劲的对手.......................................................................184.2.特斯拉自研Dojo超算服务器,芯片间高带宽互连为其一大特色..............204.3. Intel推出GPU系列芯片和oneAPI开发平台,完善其AI数据中心布局.......214.4. Google推出Cloud TPU解决方案,更专注于机器学习领域..................225. AI产业带动国内算力数据中心建设,大规模招标陆续启动.......................256.相关公司..................................................................286.1.兴森科技............................................................286.2.新益昌..............................................................286.3.天承科技............................................................296.4.德邦科技............................................................296.5.华海诚科............................................................306.6.英维克..............................................................316.7.飞荣达..............................................................316.8.思泉新材............................................................326.9.恒铭达..............................................................336.10.华丰科技...........................................................336.11.飞荣达.............................................................346.12.世运电路...........................................................346.13.方正科技:.........................................................357.风险提示..................................................................367.1.宏观因素波动影响下游需求............................................367.2.市场开拓不及预期....................................................367.3.行业竞争加剧........................................................36 图表目录 图1.“CPU+GPU+DPU”三芯布局....................................................8图2.Grace Hopper架构........................................................8图3.NVLink与PCIE带宽对比..................................................10图4.NVLink版本迭代.........................................................10图5.CUDA架构...............................................................10图6.昇腾生态全景...........................................................12图7.CANN生态...............................................................14图8.Atlas 900 AI集群.......................................................17图9.AMDROCm软件堆栈框架...................................................19图10.特斯拉Dojo的整体算力规模将达到100EFLOPs..............................21 图11.Dojo未来路线图........................................................21图12.英特尔®至强产品的路线图...............................................22图13.英特尔数据中心GPUmax系列参数.........................................22图14.OneAPI架构............................................................22图15.TPU v5e芯片互联效率提升...............................................23图16.TensorFlow详细架构....................................................24图17.MITA V1...............................................................24图18.MTIA的深度学习推荐模型(DLRM)端到端性能结果.........................24图19.AI RSC与基于V100的集群的运算速度对比.................................25图20.RSC计算性能...........................................................25图21.2022年中国人工智能芯片规模占比....................................