AI+汽车智能化系列之四—— FSD入华或加速车企淘汰赛进程 证券研究报告·行业研究·汽车与零部件 证券分析师:黄细里 执业证书编号:S0600520010001联系邮箱:huangxl@dwzq.com.cn联系电话:021-60199793 2024年5月13日 投资要点 特斯拉与国内车企智能化进展比较:特斯拉引领行业变革,国内华为/小鹏率先跟进,其余随后。 行业维度:智能驾驶软件算法架构历经两次框架变化:1)2D+CNN小模型向Transformer大模型进化,智驾迭代由工程师驱动转为数据驱动,向L3迭代;2)模块化端到端进化为全栈端到端WorldModel逐步完善,数据驱动变为认知驱动,向L4迭代。 公司维度:2020年特斯拉BEV上车,数据后融合变为特征级融合,数据标注由人工转为自动;2022年占用网络落地,实现感知端到端;2023年规控环节端到端落地,rule-base比例降低;2024年DiT上车,实现全栈端到端。国内来看,华为/小鹏最领先,感知端到端落地,规控端到端即将落地;百度/理想/蔚来其次,感知端到端上车;小米/长城/上汽/比亚迪/吉利等车企相对靠后。 FSD入华对国内汽车行业具体影响预估:1)加速消费者智能化教育,类似M3国产化加速了消费者电动化教育。4月我们集中测试比较了【特斯拉北美V12表现和国内一线车企无图城市NOA表现】,V12表现惊艳,领先国内,接管率大幅下降,实现质的飞跃。2)加速L3智能化渗透率提升。2024Q1,L3智能化渗透率约5%(以国内新能源汽车销量为基数),2025-2026年有望实现重大拐点,突破30%。3)留给国内车企追赶特斯拉窗口缩短。目前国内车企中华为/小鹏领先,其他车企需加快端到端大模型上车进度。4)国内车企格局或将迎来新一轮重塑,淘汰赛加速了 投资建议:L3智能化相关受益标的:1)整车板块:智能化领先车企(小鹏汽车+华为系赛力斯+长安+江淮+北汽等)等。2)智能化增量零部件:域控制器(德赛西威+华阳集团+均胜电子+经纬恒润等)+线控底盘(伯特利+耐世特等)。3)特斯拉产业链硬件供应商:新泉+拓普+旭升+爱柯迪等。 风险提示:智驾政策推出不及预期;乘用车价格战幅度超出预期;下游乘用车需求复苏不及预期。 目录 特斯拉智能化进展梳理 国内车企智能化进展梳理 FSD入华:加速L3渗透率+淘汰赛进程 投资建议及风险提示 一、特斯拉智能化进展梳理 数据来源:盖世汽车,汽车之心,东吴证券研究所绘制 5 外采转自研,特斯拉FSD引领全球智驾软硬件升级 2020年为特斯拉“硬件为先,软件随后”策略的重要窗口,【大模型】是特斯拉引领本次变革的核心抓手。【HydraNet/FSD芯片+Transformer/Dojo】等6次硬件变化升级+3次软件架构的重大创新变革,均体现特斯拉第一性原理的经营思想。 图:特斯拉边缘端/云端软硬件历史迭代 2014.10 2016.10 2017.07 2019.04 2021.07 2022.04 2023Q2 2024Q1 边缘端 FSD历史重要阶段(软件) Autopilot1.0 Autopilot2.0 Autopilot3.0 FSDBetav9 FSDBeta v10.11 FSDBeta v11.3 FSDv12 硬件解决方案 名称 HW1.0 HW2.0 HW2.5 HW3.0 HW4.0 芯片 MobileyeQ3 英伟达drivePX2 英伟达drivePX2+ 自研FSD1.0 自研FSD2.0,算力五倍 传感器 1摄像头+1毫米波雷达+12超声波雷达 8摄像头+1毫米波雷达 (2.5升级)+12超声波雷达 8摄像头+1毫米波雷达+12超声波雷达 12摄像头+1毫米波雷达 软件解决方案 标注 人工标注 BEV+Transformer架构,数据驱动深度学习,使得自动标注落地 感知 外采Mobileye 黑盒 自研图像识别+多传感器后融合策略 自研芯片硬件,HydraNet驱动多头任务实现,进一步提效 BEV+Transformer上车,特征级融合落地,实现感知大模型,无图城市领航功能上车 占用网络上车,泛化能力增强,功能维度统一高速与城市领航辅助 感知+规控全 域端到端落地 规控 自研rule-base rule为主,开发learning-base 备注 2015.04开启自研软件 2017.03自研算法,硬件升级但功能降级 2018年开发更好实现多传感器融合的策略 硬件储备完成 感知能力升级驱动无图化 泛化能力增强驱动传感器简化 硬件再次迭代,支持软件进一 步升级 北美开放,即将入华 云端 - 2021年8月官宣Dojo,利用海量的数据,做无监督的标注和仿真训练,更好驱动大模型;世界模型加速大模型仿真 数据来源:公司官网,东吴证券研究所 6 边缘硬件:自研FSD(NPU),保障算力及功能领先 特斯拉自动驾驶硬件解决方案持续升级,2016年10月由Mobileye黑盒转为英伟达开放,逐步掌握智驾算法后,2019年全自研FSD芯片上车,2023年新一代FSD方案上车,芯片再升级。 自研智驾芯片保障成本与性能双领先。特斯拉自2016年2月组建智驾芯片研发团队,2019年4月FSD芯片正式搭载上车,单车搭载2颗FSD芯片;每颗配置4个三星2GB内存颗粒,单FSD总计8GB,同时每颗FSD配备一片东芝的32GB闪存以及一颗Spansion的64MBNORflash用于启动。凭借NPU针对AI计算更好的专业适用性,3.0时代FSD芯片以14nm制程+260mm²面积实现144TOPS算力,相比英伟达12nm制程+350mm²支持30TOPSAI算力更为领先。 图:特斯拉硬件解决方案迭代 版本 HW1.0 HW2.0 HW2.5 HW3.0 HW4.0 推出时间 2014年9月 2016年10月 2017年7月 2019年4月 2023Q2起,2024普及 计算平台 MobileyeEyeQ3 NvidiadrivePX2 NvidiadrivePX2+ TeslaFSD TeslaFSD 核心处理器 1-MobileyeEyeQ3 1-NvidiaTegra3 1-NvidiaParkerSoC(1-NvidiaPascalGPU+1-InfineonTriCoreCPU) 2-NvidiaParkerSoC(1-NvidiaPascalGPU+1-InfineonTriCoreCPU) 2-FSD1.0(14nm制程, 12个CPU核+2个NPU) 2-FSD2.0芯片(7nm制程,20个CPU核 +3个NPU) 算力(TOPS) 0.256Tops 12Tops 144Tops 720Tops 传感器配置 摄像头 1颗EQ3系列前视摄像头 8颗摄像头,3颗前置+2颗侧置前视+2颗侧置后视+1颗后置(分辨率为120万像素) 12个摄像头,其中1个为备用(分辨率升级至 500万像素) 毫米波雷达 1个(160m) 1个(170m)(2023.09后新款移除) 1个 超声波雷达 12个(5m) 12个(8m)(2023.09后新款移除) 0个 边缘硬件:HW4.0强化摄像头视觉,留毫米波雷达 特斯拉坚持视觉主导的周身智驾传感器解决方案,当前HW4.0采用12个摄像头(其中1个为备用 )+1个毫米波雷达解决方案,相比2019年推出的HW3.0增加3颗摄像头,包括2个侧摄像头(L-FF-Side和R-FF-Side摄像头)和1个前保险杠摄像头(F-SVC),加上原本就有的1个倒车影像摄像头、4个侧向ADAS摄像头,以及座舱内的1颗摄像头,合计11颗,但前视ADAS摄像头由3目变为2目。除摄像头外,HW4.0还新增了Phoenix高精度雷达(相比2023年的新款),12颗超声波雷达则依然保持去除状态。 图:特斯拉HW3.0周身传感器解决方案 数据来源:公司官网,东吴证券研究所7 数据来源:汽车之心,东吴证券研究所绘制 8 边缘软件:Transformer大模型逐步覆盖各环节 HydraNet赋能多传感器融合,特斯拉基于全自研软硬件实现有限范围的智能领航辅助驾驶,追平行业。2016年起特斯拉自研软件算法上车,2D网络的CNN架构+人工数据标注的迭代模式下,特斯拉智驾功能表现逊于长期深耕的Mobileye;2019年4月配合自研FSD芯片,HydraNet九头蛇架构实现更好的特征提取以及多头任务并行,催化特斯拉追平MobileyeL2+级别智驾功能。 BEV+Transformer开启大模型时代,软件能力跨时代跃迁,引领行业变革。1)Transformer 赋能2D图像升维实现BEV转换,占用网络(加入时序的BEV)进一步泛化异形场景,实现无高精度地图化及传感器精简化;2)特征级融合取代后融合,减少信息损耗,还原更真实的场景信息;3)人工标准转向自动标注,庞大数据预训练大模型,进行云端预标注,车端蒸馏筛选得证。 FSD升级,全栈端到端落地。车端感知规控全融合,大模型覆盖范围深化,数据赋能加速迭代。 图:特斯拉自动驾驶算法迭代历程 WorldModel世界模型是端到端方案的核心技术支撑 特斯拉早于2023年提出世界模型WorldModel,即通过神经网络结构化表示事物,并预测未来,将自动驾驶决策问题转为预测视频的下一帧。世界模型用于理解世界,不仅能用于自动驾驶也能用于机器人,是特斯拉自身端到端智驾解决方案的基础原理,自动驾驶是世界模型的具身智能。 Sora的发布是催化产业内实现世界模型技术路线收敛的重要时刻。Sora文生视频首次实现在视频长度和质量上的跨越,包括编码+序列分割+学习生成(DiT)+解码四个步骤。其技术创新点在于时空编码以及DiT模型的应用,高效进行特征提取训练大量视频数据,并生成强相关预测值。 DiT(DiffusionTransformer)是继模型结合了Diffusion扩散模型和Transformer模型的优点 ,将传统扩散模型中采用的U-Net网络结构替换成Transformer,使得模型更擅长捕捉长距离的相关关系,并且随计算输入的数据量越大,模型的输出预测值越加接近真实值。 图:AGI的发展路径 云:放弃通用GPU自研专用D1芯片,强化计算+传输 可扩展+强计算,特斯拉D1性能表现业内领先。1)基础性能方面,特斯拉D1由台积电代工,采用7nm制程工艺,芯片面积为645mm²,小于英伟达A100(826mm²);D1芯片拥有多达354个训练节点,是特斯拉专门设计的特别用于AI训练相关的8×8乘法的芯片,浮点计算性能FP32算力22.6TFLOPS(英伟达A100为19.5),对应热功耗仅为400W;D1芯片集成四个64位超标量CPU核心,支持完整向量以及矩阵计算,灵活性远超众核架构的GPU。2)高带宽+低延迟保障强可扩展性:D1芯片采用带宽最高可达10TB/s的“延迟交换结构”进行互连,加速数据传输。D1芯片运行频率2GHz,拥有440MBSRAM,是存算一体架构,降低过程数据缓存压力。Tile角度,每个D1训练模块由5x5的D1芯片阵列排布而成,以二维Mesh结构互连,片上跨内核SRAM达11GB,每个训练模块外部边缘的40个I/O芯片达36/10TB/s的聚合/横跨带宽,保障信息传输 过程的低损耗。 图:特斯拉D1Chip图:特斯拉D1Tile Dojo超算中心高算力+低功耗+高带宽,行业领先 Dojo从底层开始由Core、D1、Tile、Tray、Cabinet、ExaPOD构成:D1芯片由354个Core构成 ,强算力+高带宽;Tile由25个D1芯片打造,通过InFO_SoW封测技术实现低延迟、高带宽,4边对外传输带宽均为9TB/s;ExaPOD由3000个D1芯片构成,在BF16精度下算力高达1.1EFLOPs 。特斯拉预计将Dojo打造成全球五台最先进的超级计算