您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[信达证券]:电子行业:Dojo性能强劲,AI应用场景拓展 - 发现报告
当前位置:首页/行业研究/报告详情/

电子行业:Dojo性能强劲,AI应用场景拓展

电子设备2023-09-22信达证券阿***
电子行业:Dojo性能强劲,AI应用场景拓展

Dojo性能强劲,AI应用场景拓展 电子 2023年09月22日 信达证券股份有限公司 CINDASECURITIESCO.,LTD 北京市西城区闹市口大街9号院1号楼邮编:100031 韩字杰联系人 邮箱:hanzijie@cindasc.com 莫文宇电子行业首席分析师 执业编号:S1500522090001 联系电话:13437172818 邮箱:mowenyu@cindasc.com 看好 上次评级 看好 投资评级 证券研究报告 行业研究 行业专题研究 电子 Dojo完善AI闭环,持续看好硬件潜力 2023年09月22日 本期内容提要: D1芯片对标英伟达A100,ExaPOD算力可达1.1EFLOPS。特斯拉D1 芯片采用台积电7nm制程,面积约为645mm²,包含500亿颗晶体管, BF16/CFP8算力可达362TFLOPS,FP32算力可达22.6TFLOPS。25个 D1芯片组成了一个TrainingTile多晶片模组(MCM),6个TrainingTile组成一个tray,再由两个Tray组成一个机柜,10个机柜组成ExaPOD,BF16/CFP8峰值算力达到1.1EFLOPS(百亿亿次浮点运算),并拥有1.3TB高速SRAM和13TB高带宽DRAM。 D1芯片需要高速的互联支撑,台积电SoW封装技术提供土壤。在单个 Trainingtile上,由于并未将芯片切下,为了提高效率和降低成本,特斯拉未在片上集成DRAM等器件,这与许多通用GPU有所不同。集群节点之间以2Dmesh连接,边缘则通过Interface-processors负责内存池数据搬运,因此高速互联是必要的,台积电SoW封装技术提供了土壤。InFO_SoW取消了衬底和PCB的使用,使得多个芯片阵列使解决方案获得晶圆级优势,以获得低延时、高带宽等优势。此外除了异构芯片集成外还支持基于小芯片的设计,以实现更大的成本节约和设计灵活性。在部分模型上,Dojo能实现相对A100更高的性能。例如在图像分类模型ResNet-50上,Dojo可以实现比英伟达A100更高的帧率。而在用于预测汽车周围物体所占空间的神经网络模型OccupancyNetworks上,相比英伟达A100,Dojo能实现性能的倍增。 特斯拉将大力投资基础设施,2024年有望达100Exa-Flops算力。特斯 拉目前AI基础设施较少,仅约4000个V100和约16000个A100。而Microsoft和Meta等公司拥有超过10万个GPU。据特斯拉规划,2024年有望达100Exa-Flops算力。特斯拉拥有自身车型收集的海量数据,但受限于硬件限制无法充分挖掘数据价值。我们认为,大力投资AI基础硬件设施之后,除加速自身智驾进程外,或可拓展至其他商用领域,如智能机器人等;此外,特斯拉未来也可能成为一家云服务提供商,向相关厂商提供自身算力或模型服务。 投资建议:第一,看好服务器定制化趋势。从特斯拉Dojo上我们看到AI 在专业领域的价值,而相似案例有望在教育、医疗、办公等场景拓展,服务器定制化趋势或蔚然成风。建议关注算力产业链:工业富联/沪电股份第二,受益AI强势赋能,特斯拉产业链或迎成长良机。基础硬件限制解决,AI大模型性能提升,在特斯拉体系内形成良性循环,特斯拉智能驾驶机器人、零部件等相关厂商或持续受益,建议关注:东山精密/领益智造/舜宇光学/世运电路/胜宏科技等。 风险因素:宏观经济下行风险;AI发展不及预期风险;短期股价波动风险 目录 Dojo性能强劲,AI应用场景拓展4 风险因素7 图目录 图1:D1芯片4 图2:TrainingTile结构4 图3:6个TrainingTile组成一个tray5 图4:2个Tray组成一个Cabinet5 图5:TrainingTile互联5 图6:2Dmesh互联5 图7:InFO_SoW封装5 图8:ResNet-50上Dojo实现比英伟达A100更高的帧率6 图9:OccupancyNetworks上Dojo能实现性能的倍增。6 图10:特斯拉算力规划6 图11:Model3硬件配置7 Dojo性能强劲,AI应用场景拓展 D1芯片对标英伟达A100。D1采用台积电7nm制程,面积约为645mm²,包含500亿颗晶体管,BF16、CFP8算力可达362TFLOPS,FP32算力可达22.6TFLOPS。特斯拉D1芯片对标英伟达A100,英伟达A100同样采用台积电7nm制程,面积为826mm²,晶体管数量达542亿颗,FP32峰值算力为19.5TFLOPS。 图1:D1芯片 资料来源:EDN,信达证券研发中心 D1芯片依次组成Traniningtile、Tray、机柜、ExaPOD。特斯拉并未将SoC从晶圆上切下来,而是将所有SoC连接。25个D1芯片组成了一个TrainingTile多晶片模组(MCM),每个D1芯片功耗400W,一个TrainingTile功耗为15kW。此外,6个TrainingTile组成一个tray,再由两个Tray组成一个机柜,10个机柜组成ExaPOD,BF16/CFP8峰值算力达到1.1EFLOPS(百亿亿次浮点运算),并拥有1.3TB高速SRAM和13TB高带宽DRAM。 图2:TrainingTile结构 资料来源:EDN,信达证券研发中心 图3:6个TrainingTile组成一个tray图4:2个Tray组成一个Cabinet 资料来源:芯东西,信达证券研发中心资料来源:芯东西,信达证券研发中心 Dojo的设计思想是通过较高的对称性来实现scaleout能力。在单个Trainingtile上,由于并未将芯片切下,为了提高效率和降低成本,特斯拉并未在片上集成DRAM等器件,这与许多通用GPU有所不同。集群节点之间以2Dmesh连接,边缘则通过Interface-processors负责内存池数据搬运。 图5:TrainingTile互联图6:2Dmesh互联 资料来源:芯东西,信达证券研发中心资料来源:chipandcheese,信达证券研发中心 显而易见,D1芯片需要高速的互联来实现,台积电SoW封装技术提供了这一条件。InFO_SoW取消了衬底和PCB的使用,使得多个芯片阵列使解决方案获得晶圆级优势,以获得低延时、高带宽等优势。此外除了异构芯片集成外,其wafer-field处理能力还支持基于 小芯片的设计,以实现更大的成本节约和设计灵活性。 图7:InFO_SoW封装 资料来源:EETOP,信达证券研发中心 在部分模型上,Dojo能实现相对A100更高的性能。例如在图像分类模型ResNet-50上,Dojo可以实现比英伟达A100更高的帧率。而在用于预测汽车周围物体所占空间的神经网络模型OccupancyNetworks上,相比英伟达A100,Dojo能实现性能的倍增。 图8:ResNet-50上Dojo实现比英伟达A100更高的帧率图9:OccupancyNetworks上Dojo能实现性能的倍增。 资料来源:芯东西,信达证券研发中心资料来源:芯东西,信达证券研发中心 特斯拉将大力投资基础设施,2024年有望达100Exa-Flops算力。特斯拉目前AI基础设施较少,仅约4000个V100和约16000个A100。而Microsoft和Meta等公司拥有超过10万个GPU。据特斯拉规划,2024年有望达100Exa-Flops算力。 图10:特斯拉算力规划 资料来源:42号车库,信达证券研发中心 特斯拉拥有海量数据库,数据价值亟待挖掘。Model3传包含8个摄像头,1个毫米波雷达,12个超声波雷达,位置分别为:1-车牌的上方装有一个摄像头;2-超声波传感器(如果配备)位于前后保险杠中;3-各门柱均装有一个摄像头;4-后视镜上方的挡风玻璃上装有三个摄像头;5-每块前翼子板上装有一个摄像头;6-雷达(如果配备)安装在前保险杠后面。特斯拉车型销量形势良好,通过传感器件建立了庞大的数据库,但受限于硬件限制,无法充分挖掘数据价值,Dojo量产有望突破瓶颈。 自建AI基础设施,AI或赋能特斯拉快速成长。特斯拉Dojo性能强大,我们认为,除加速自身智驾进程外,或可拓展至其他应用领域,如机器人等。此外,特斯拉也可能成为一家云 服务提供商,向相关厂商提供自身算力或模型服务。 图11:Model3硬件配置 资料来源:特斯拉官网,信达证券研发中心 风险因素 宏观经济下行风险; AI发展不及预期风险;短期股价波动风险。 研究团队简介 莫文宇,毕业于美国佛罗里达大学,电子工程硕士,2012-2022年就职于长江证券研究所,2022年入职信达证券研发中心,任副所长、电子行业首席分析师。 郭一江,电子行业研究员。本科兰州大学,研究生就读于北京大学化学专业。2020年8月入职华创证券电子组,后于2022年11月加入信达证券电子组,研究方向为光学、消费电子、汽车电子等。 韩字杰,电子行业研究员。华中科技大学计算机科学与技术学士、香港中文大学硕士。研究方向为半导体设备、半导体材料、集成电路设计。 吴加正,电子行业研究员。复旦大学工学学士、理学博士,德国慕尼黑工业大学2年访问研究经验。2020年9月入职上海微电子装备(集团)股份有限公司,任光刻机系统工程师,于2022年12月加入信达证券电子组,研究方向为精密电子仪器、半导体设备及零部件、半导体工艺等。 王义夫,电子行业研究员。西南财经大学金融学士,复旦大学金融硕士,2023年加入信达证券电子组,研究方向为存储芯片、模拟芯片等。 李星全,电子行业研究员。哈尔滨工业大学学士,北京大学硕士。2023年加入信达证券电子组,研究方向为服务器、PCB、消费电子等。 分析师声明 负责本报告全部或部分内容的每一位分析师在此申明,本人具有证券投资咨询执业资格,并在中国证券业协会注册登记为证券分析师,以勤勉的职业态度,独立、客观地出具本报告;本报告所表述的所有观点准确反映了分析师本人的研究观点;本人薪酬的任何组成部分不曾与,不与,也将不会与本报告中的具体分析意见或观点直接或间接相关。 免责声明 信达证券股份有限公司(以下简称“信达证券”)具有中国证监会批复的证券投资咨询业务资格。本报告由信达证券制作并发布。 本报告是针对与信达证券签署服务协议的签约客户的专属研究产品,为该类客户进行投资决策时提供辅助和参考,双方对权利与义务均有严格约定。本报告仅提供给上述特定客户,并不面向公众发布。信达证券不会因接收人收到本报告而视其为本公司的当然客户。客户应当认识到有关本报告的电话、短信、邮件提示仅为研究观点的简要沟通,对本报告的参考使用须以本报告的完整版本为准。 本报告是基于信达证券认为可靠的已公开信息编制,但信达证券不保证所载信息的准确性和完整性。本报告所载的意见、评估及预测仅为本报告最初出具日的观点和判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会出现不同程度的波动,涉及证券或投资标的的历史表现不应作为日后表现的保证。在不同时期,或因使用不同假设和标准,采用不同观点和分析方法,致使信达证券发出与本报告所载意见、评估及预测不一致的研究报告,对此信达证券可不发出特别通知。 在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议,也没有考虑到客户特殊的投资目标、财务状况或需求。客户应考虑本报告中的任何意见或建议是否符合其特定状况,若有必要应寻求专家意见。本报告所载的资料、工具、意见及推测仅供参考,并非作为或被视为出售或购买证券或其他投资标的的邀请或向人做出邀请。 在法律允许的情况下,信达证券或其关联机构可能会持有报告中涉及的公司所发行的证券并进行交易,并可能会为这些公司正在提供或争取提供投资银行业务服务。 本报告版权仅为信达证券所有。未经信达证券书面同意,任何机构和个人不得以任何形式翻版、复制、发布、转发或引用本报告的任何部分。若