FSD的V12正式版即将问世,或将加快进入中国市场,海量数据加速FSD迭代演进。 2023年6月底,马斯克在社媒表示FSD的V12版本将不再是测试版"Version 12 won't be Beta"。随着6月马斯克访华,不断有消息传出特斯拉FSD完全版或将加快进入中国;百度智能汽车事业部总经理储瑞松认为,特斯拉FSD可能会在2024年入华。特斯拉FSD未来有望展现出更加完善的产品形态,海量数据加速FSD迭代演进。 硬件+算法+算力全面推进,FSD持续迭代进化。 硬件端:HW1.0逐渐迭代至HW4.0,摄像头接口丰富至12个。算法端:BEV+Transformer,自动驾驶进入大模型时代,引入占用网络算法持续升级。 算力端:Dojo超级计算机已投入生产,预计24年有望成为全球最先进5台计算机之一,跑自动标注算法、预测汽车周围所有物体空间占用率的神经网络模型Occupancy Networks时,相比英伟达A100,Dojo能实现性能的倍增。 FSD与人形机器人底层模块打通,感知+决策+控制三个维度助力商业化加速。 5月17日的特斯拉股东日,马斯克表示,特斯拉已经打通了FSD和机器人的底层模块,实现了一定程度的算法复用,随着人形机器人Tesla Bot的出现,特斯拉FSD将加速迎来自己的‘ChatGPT时刻’。FSD算法主要依赖于神经网络和计算机视觉技术,均会对机器人的感知、决策和控制技术迭代起到重要作用,自动驾驶与人形机器人业务有望产生强协同效应。 催化时点:FSD正式版本发布;FSD入华;Dojo算力研发进展披露;特斯拉AI Day 投资建议:建议关注三花智控(天风家电团队覆盖)、拓普集团(天风汽车团队覆盖)、双环传动(天风汽车团队和中小市值团队联合覆盖)、鸣志电器、江苏雷利(天风电新团队联合覆盖)、鼎智科技(天风电新团队联合覆盖)、恒立液压、精锻科技、柯力传感(天风中小市值团队联合覆盖)、五洲新春、步科股份、绿的谐波。 风险提示:技术发展不达预期、中美关系破裂、宏观经济恢复不达预期。 重点标的推荐 1.FSD的V12正式版即将问世,或将加快进入中国市场,海量数据加速FSD迭代演进。 FSD正式版有望发布:2021年,FSD测试有2000客户参加。2022年扩展到了16万客户。 截至2022年10月,积累了480万段数据,训练了7.5万个神经网络,并在此基础上推出了35个FSD的版本更新。2023年6月底,马斯克在社媒表示FSD的V12版本将不再是测试版"Version 12 won't be Beta"。特斯拉FSD有望展现出更加完善的产品形态,向更广泛的用户群体开放。 FSD有望入华:随着6月马斯克访华,不断有消息传出,特斯拉FSD完全版或将加快进入中国。一方面,上海市经信委官方早前表示,将进一步深化和特斯拉的合作,推动自动驾驶、机器人等功能板块在沪布局。随后马斯克访华期间会见了商务部、工信部等多部门主管,就智能网联汽车发展交换了意见。百度智能汽车事业部总经理储瑞松认为,特斯拉FSD在2024年有望入华,之后需要1~1.5年的时间去磨合中国道路场景。 图1:特斯拉FSD迭代发展史 图2:马斯克推特表示V12将不再是测试版 2.硬件+算法+算力全面推进,FSD持续迭代进化 2.1.硬件端:HW1.0逐渐迭代至HW4.0,摄像头接口丰富至12个 HW1.0–基于Mobileye芯片的第一代驾驶辅助硬件,HW1.0阶段特斯拉的主要工作是多传感器融合+应用层软件开发。 HW2.0–特斯拉设计的第二代驾驶辅助硬件,这个阶段特斯拉掌握图像识别算法+多传感器融合+应用层软件开发。 HW2.5–这是对HW2.0的一个小版本更新,主要用于冗余和略微提高的可靠性。此版本还新增两个功能:行车记录仪和带有本地保存视频的哨兵模式。还有一个变化点是毫米波雷达的供应商从博世变成大陆,大陆的毫米波雷达也不逊色于博世。早期的model 3和modelY驾驶辅助ECU硬件类似于HW2.5,但使用的是汽车冷却液回路中的水冷而不是散热风扇。 HW3.0–特斯拉驾驶辅助硬件的重大革新,首次采用自研的自动驾驶芯片,抛弃英飞凌/英伟达的产品,自研高度集成的SoC+MCU芯片,具备全套芯片设计+图像识别算法+多传感器融合+应用层软件开发。 HW4.0-参数方面,CPU核心从12个增加到20个,最大频率为2.35GHz,空闲频率为1.37Ghz。TRIP深度神经网络加速器由双核升级为三核,最大频率从3.0的2GHz提升到2.2GHz。预估总算力300-500Tops。特斯拉还增加了摄像头接口数目,由9个增加到12个。此外特斯拉还增加了雷达接口。 图3:特斯拉硬件迭代配置 2.2.算法端:BEV+Transformer,自动驾驶进入大模型时代,引入占用网络算法持续升级 2016-2018:特斯拉延用了业内常规的骨干网结构;使用2D检测器进行特征提取;以人工对数据进行标注。整体来看,这一套自动驾驶算法还比较原始,相对传统。在这一时期,特斯拉自动驾驶算法仍处于技术追赶阶段。 2018-2019:在这次算法革新中,特斯拉构建了多任务学习神经网络架构HydraNet,并使用了特征提取网络BiFPN。相较于此前算法,HydraNet能够减少重复的卷积计算,减少主干网络计算数量,还能够将特定任务从主干中解耦出来,进行单独微调。 2020:BEV+Transformer,自动驾驶进入大模型时代。在这一方式中,特斯拉先在BEV空间层中初始化特征,再通过多层的Transformer和2D图像特征进行交互融合,最终得到BEV特征,也就是先3D再2D,反向开发,实现BEV的转换。Transformer是一种基于注意力机制(Attention)的神经网络模型。Transformer的引入,使得BEV视角在自动驾驶领域得以实现。而3D空间的引入,使得自动驾驶的思维方式,更接近于真实世界。 2021-2022:特斯拉感知网络架构引入了时空序列特征层,特斯拉对BEV进行了升级——引入占用网络。这使得特斯拉自动驾驶算法的泛化能力得到了提升。而借助于算法提升,特斯拉FSD更能刻画真实的物理世界,进而才有可能实现端到端模型。 图4:特斯拉自动驾驶算法迭代历程 2.3.算力端:Dojo超级计算机已投入生产,预计24年有望成为全球最先进5台计算机之一 Dojo的产品进展时间线:2020年,马斯克首次提出dojo超级计算机概念;2023年7月特斯拉的Dojo将正式投产,随后,特斯拉的算力将进入快速增长期。据特斯拉AI团队预测,2024年2月特斯拉的Dojo将成为全球最先进的5台超级计算机之一,2024年10月特斯拉的算力总规模有望达到100 Exa-Flops。 图5:特斯拉Dojo超级计算机的算力规划 性价比优于GPU:D1是一种面向AI的新型CPU,具有354内核,运行频率为2GHz。据设计师介绍,D1自研架构基于RISC-V架构ISA,从RISC-V借鉴了一些指令,专门针对运行机器学习和神经网络训练进行了优化,采用 7nm 制程工艺,具备超过500亿个晶体管,形成了354个核心,支持多种浮点格式,包括FP32、BFP16和一种新的格式CFP8或可配置的FP8,其32位浮点运算的最大性能是22.6T-FLOPs,对于16位浮点计算,D1的最大性能跃升至362T-FLOPs。D1每个核心都具有完整的带矩阵计算能力,其计算灵活性是远超众核架构的GPU。D1芯片面积为645平方毫米,小于英伟达的A100(826平方毫米)和AMDArcturus(750平方毫米)。据特斯拉芯片团队称,同成本下性能提升4倍,同能耗下性能提高1.3倍,占用空间节省5倍。Dojo算力无上限。 架构改进:从特斯拉公布的产品进度线来看,Dojo这台超级计算机的算力不是一蹴而就,而是逐年累加,随着时间线拉长,算力可能爆棚,这也是特斯拉Dojo的创新之处。这里的算力源于超算,而非拼凑而成的云计算。原因在于Dojo采用了分布式架构,可以随意地增加算力。这与我们熟悉的五百强超算系统不同,Dojo是一套完全可定制架构,全面涵盖计算、网络、输入/输出(I/O)芯片,乃至指令集架构(ISA)、供电、封装和冷却。据特斯拉介绍,用D1扩展算力的方式就好像自家地面铺瓷砖一样。特斯拉将25个D1芯片按5×5规格组成一个训练模块,这被称为tile(瓷砖),再将120个训练模块组成一个Dojo ExaPod。换言之,每个Dojo ExaPod内置3000个D1芯片,拥有超过100万个核心,总算力达到1.1E-FLOPS(每秒百亿亿次浮点运算)。由于Dojo是大型分布式系统,从理论上来说,Dojo的性能拓展可以无限扩张,没有上限。 图6:跑自动标注算法、预测汽车周围所有物体空间占用率的神经网络模型Occupancy Networks时,相比英伟达A100,Dojo能实现性能的倍增 3.FSD与人形机器人底层模块已经打通,实现算法复用,在机器人感知+决策+控制层面起到关键作用 5月17日的特斯拉股东日,马斯克表示,特斯拉已经打通了FSD和机器人的底层模块,实现了一定程度的算法复用。马斯克同时预计,随着人形机器人Tesla Bot的出现,特斯拉FSD将加速迎来自己的‘ChatGPT时刻’。 FSD算法主要依赖于神经网络和计算机视觉技术,对机器人的感知、决策和控制起到重要作用,自动驾驶与人形机器人业务有望产生强协同效应。 1)感知层面:特斯拉的一个重要技术是Occupancy Network (占据网络),借鉴了机器人领域常用的思想,基于occupancy grid mapping,是一种简单形式的在线3d重建。FSD对车辆的环境感知和物体识别是通过对相机、激光雷达等实时传感器获取的数据进行处理和分析,并从中提取有关道路、车辆、行人和障碍物等信息来实现的,这是FSD核心的神经网络模型。FSD算法的传感器可以帮助机器人感知周围环境,识别物体、人和障碍物等,也可以通过传感器数据感知环境。 2)决策层面:FSD算法在自动驾驶中运用了感知到的环境信息进行路径规划和决策,因为它具备辨别道路、车辆和行人等物体的能力,可以帮助机器人在任务执行时辨认和定位物体。同样的方法也可以应用于机器人,协助其在复杂环境中选择最佳路径和做出合适的决策。 3)控制层面:特斯拉在2022年的特斯拉AI日活动中公布了一种名为Lanes Network的在线矢量地图构建模型。该模型能够获取车道线的拓扑结构,从而协助自动驾驶汽车实现变道功能。在人工智能领域,对于未来全自动驾驶系统算法的发展,需要进行适应和改进,以满足不同机器人的特定需求和任务。 图7:Occupancy Network占据网络示意图,FSD算法利用传感器数据进行环境感知 4.风险提示 1.技术发展不及预期:技术研发影响因素多,对产品发展进程起关键作用。 2.中美关系破裂:国际局势日渐紧张,中美关系存在破裂风险。 3.宏观经济恢复不及预期:经济下行期,下游需求弱。