您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国联证券]:如何评价车企端到端能力? - 发现报告
当前位置:首页/行业研究/报告详情/

如何评价车企端到端能力?

交运设备2024-07-09高登国联证券娱***
如何评价车企端到端能力?

行业专题研究 引言:为何关注智能驾驶端到端大模型进展? 端到端大模型是实现高阶智能驾驶功能的主要路径。端到端神经网络可以充分简化运算步骤,减少人工特征工程的需要,并识别出数据中关联性,充分提升计算效率。受益于有效行为轨迹数据规模提升,智能驾驶端到端大模型有望成为高阶智能驾驶解决方案。2023年开始,模块化的端到端规划模式加速,逐步成为代表智能驾驶实现高阶功能迭代的主要方向。 如何评价车企智能驾驶端到端大模型能力? 参考大模型的发展,端到端智能驾驶大模型具备涌现效应。我们认为,评价模型主要参数指标为车端轨迹数据规模、训练数据能力、软件开发能力。 (1)车端轨迹数据规模:具备集中式域架构和车端具备较大算力的车型累计销量及累计里程;(2)训练模型能力,主要包括智算中心算力、云端训练能力和数据存储能力,训练算力成为运算速度的关键,云架构优化算力编排,数据存储能力决定可训练车端轨迹数据规模;(3)软件开发能力,各家代码并不开源,无法直观评价各家智能驾驶模型。我们集中在车端轨迹数据规模和训练数据能力两个维度,使用研发费用替代软件开发能力。 当下车企智能驾驶端到端大模型进展如何? 我们从整车端和训练端两个维度进行当下时点各车企对车企智能驾驶端到端大模型进展进行分析。车端主要关注架构和车型销量,(1)E/E架构:特斯拉和新势力领先,自主品牌加速跟进;(2)域控制器式架构后车型销量与里程积累正相关,理想销量领先,华为、小鹏快速跟进,自主品牌后续有望加速。训练端主要关注算力部署和云化水平。(1)算力部署:特斯拉领跑,华为建设加速,国内车企与互联网厂商建立合作加速算力部署;(2)云计算能力:华为云、阿里云、腾讯云、百度智能云加速整合份额提升。 当下格局:特斯拉领跑,国内品牌加速 当下格局来看,特斯拉凭借算力和数据规模优势有望持续领跑,国内华为、理想研发支出较高、数据规模较大从而追赶速度较快,蔚来、小鹏或受到数据量等方面的影响降低迭代效率。其他自主品牌中,由于具备集中式E/E架构车型较少,可实现数据积累车型数量短期内不足且算力处于建设阶段。 投资建议:建议关注端到端领先整车厂和智能/域架构供应商 整车端:华为系车企有望充分受益于华为算力领先实现功能反超。自研系理想汽车和小鹏汽车有望凭借端到端落地节奏领先实现大模型的领先。零部件端:建议关注E/E架构升级、智能驾驶车端算力等方向的零部件供应商。重点推荐高速连接器供应商电连技术;线控底盘域供应商伯特利、拓普集团、保隆科技、中鼎股份;区域控制器核心供应商经纬恒润;智能驾驶域控制器核心供应商德赛西威、科博达、华阳集团等。 风险提示:智能化车端进展不及预期;算力建设情况不及预期。 1.引言:为何关注智能驾驶端到端大模型进展? 1.1特斯拉端到端大模型落地,驱动行业技术路线迭代 特斯拉引领,智能驾驶端到端大模型加速。特斯拉2023年12月发布FSD Beta V12.1,主要是用于特斯拉员工的内部测试。特斯拉V12版本实现从摄像头数据输入到最终决策控制信号的输出,可以实现智能驾驶端到端的控制。2024年2月,特斯拉发布V12.2.1,该版本简化运算结构和监督算法,实现30万行C++代码简化。2024年3月FSD V12.3.3进入监督(Supervised)版本,实现FSD从测试版到监督版的升级,同时FSD数据的完整后充分提升行为轨迹数据的使用效率。从当下版本使用的车型数量来看,FSD12.3.6搭载车型数量超过1.7万辆,使用率超过90%。 图表1:特斯拉FSD Beta V12后加速端到端的应用 端到端神经网络充分简化运算步骤,减少人工特征工程的需要,并识别出数据中关联性,打通从感知到决策的全过程。传统的机器学习流程中,特征提取和数据转换通常需要大量的人工干预,包括人类标注、边缘检测等手动设计的特征提取方法,需要较大量的人力参与训练。端到端神经网络通过多层神经元结构,将输入数据逐步转化为更高层次的特征表示,网络通过反向传播算法自动调整权重,降低预测输出和实际输出的差值。智能驾驶应用来看,端到端大模型可以从传感器数据学习驾驶策略,去除过去的“感知—决策—执行”的传统智能驾驶链路,充分提升数据和训练效率。 图表2:智能驾驶端到端大模型架构 1.2端到端大模型有望成为未来高阶智能驾驶解决方案 受益于有效数据规模的提升,智能驾驶端到端模型有望成为高阶智能驾驶解决方案。从发展路线来看,2019年至今CARLA数据集不断丰富,基于数据集完成数据泛化、增强可解释性、数据融合、基于人类定义规则的预训练。2023年受益于数据量(下图中DS,为data scale)积累和底层数据类型的升级,充分满足大规模训练需求。通过数据规模提升和数据间关联性可读性的提升,2023年开始模块化的端到端规划模式加速,逐步成为代表智能驾驶未来发展的主要方向。端到端大模型在最终功能表现上有更高的上限,未来受益于数据规模持续扩张和评价体系的完善,智能驾驶端到端大模型有望加速落地。 图表3:自动驾驶功能技术路线时间图 图表4:智能驾驶端到端大模型具备更高的实现能力和表现上限 2.如何评价车企智能驾驶端到端大模型能力? 车端和训练端的配合有望提升数据使用效率和模型迭代速度。在过去的智能驾驶体系中,车端感知层体系建设和车端算力是部署的重点。端到端大模型要求车端算力要求提升的同时,强调云端(训练段和存储端)协同训练。车端的数据采集需要高度灵活化的触发机制和场景化的触发策略,需要车端数据及时收集、云端高效处理,从而提升数据闭环使用效率。从数据流程来看,车端行为轨迹数据产生后压缩发送至云端,而后完成数据存储和云端训练,完成模型分析和算法迭代后回传给车端,从而完成车端功能的优化。在后续的分析中,我们重点关注车端能力和云端能力两个方向。 图表5:自动驾驶端到端能力拆分 评价车企端到端智能驾驶模型能力的主要参数指标为车端轨迹数据规模、训练数据能力、软件开发能力。(1)车端轨迹数据规模:通过影子模式带来的有效累计里程,即具备集中式域架构和车端具备较大算力的车型累计销量及累计里程;(2)训练数据能力,主要包括智算中心算力、云化水平和数据存储能力,训练算力部署体量成为运算速度的关键,云架构优化算力编排,数据存储能力决定可训练车端轨迹数据规模;(3)软件开发能力,由于各家代码并不开源,无法直观对各家智能驾驶模型软件代码进行判断。在后续的分析中,我们集中在车端轨迹数据规模和训练数据能力两个维度的分析。同时,训练能力和软件开发需要人员投入和资本性支出,研发费用和研发人员数量同样成为影响智能驾驶端到端大模型的进展。 图表6:自动驾驶端到端能力拆分 2.1数据获取:架构升级和车端算力保证车辆轨迹数据迭代 参考大模型的发展,数据规模成为影响端到端大模型迭代速度的关键,受益于累计里程数据规模的提升模型准确性。端到端智能驾驶模型是通过传感器完成周围环境数据输入,完成对应运动动作输出的过程。端到端智能驾驶模型与语言大模型具有相似性,存在“涌现”现象,即在数据规模达到一定规模后(即参数量越大),模型拟合的准确性越高。 图表7:大模型具有明显的“涌现”现象 车辆行为轨迹数据是“喂养”端到端智能驾驶模型核心数据。从数据内容来看,车辆行为轨迹数据主要包括传感器信息、地图信息、车辆状态信息、语言结构信息等。 融合方式主要包括前端视觉信息的融合、中段特征的融合和终端执行输出的融合。 图表8:车辆轨迹数据主要内容 车辆行为轨迹数据采集要求一:需要完成车型架构的升级。一方面,E/E架构逐步向集中化方向发展,具备车辆行为轨迹数据集中式生成。另一方面,受高级别智能驾驶功能的影响,系统安全性设计要求提升,L3/L4需要针对网络、电源、底盘、感知等各层级架构均完成冗余设计,从而保证高阶功能的安全性。 图表9:汽车E/E架构升级路线 图表10:智能驾驶催化E/E架构升级 图表11:L3/L4对E/E架构的需求升级 车辆行为轨迹数据采集要求二:车端算力提升,保证“影子模式”运行和车端行为轨迹数据回流。影子模式是指在有人驾驶状态下,智能驾驶系统及传感器仍然运行,通过影子模式计算与有人驾驶状态下的对比,完成对算法模型的验证。随着车型销量逐步提升,影子模式数据传输量远超过路测反馈数据量。智能驾驶数据传输同样需要算力支持,车辆所产生的数据量需要进行将归类、脱敏、压缩和打包后上传至云端服务器,车端算力需要保证车端与训练端通讯通畅。车端算力是推进影子模式和保证数据回流的关键,车端中高阶算力芯片成为硬件的又一要求。 图表12:影子模式的训练模式 图表13:智能驾驶数据闭环流程示意图 我们认为车端核心参数指标为车辆行为轨迹数据规模,车辆行为轨迹数据规模领先的车企有望加速模型进入涌现阶段。车辆行为轨迹数据规模等于具备行为轨迹回馈能力车型数量与总车辆运行时间的乘积。车端硬件要求来看,具备中高端算力和冗余集中式或中央计算式E/E架构车型成为硬件要求。总车辆和运行时间来看,车型累计保有量和总车型运行时间成为重要的参数指标。 2.2数据训练:算力类型及数量决定速度,云优化算力编排 训练端:GPU类型及数量决定训练速度。受架构影响,GPU在计算能力、带宽等方向上存在较大差别,对比来看英伟达H100单卡算力领先,华为昇腾910B受制程影响算力和带宽较低。训练端由于大模型应用范围和架构不同,部署上无法共用不同种类型的GPU,单类型的GPU数量成为关键。服务器整体架构来看,NVIDIA NVLink采用全网状拓扑,同时引入NV Switch架构GPU-to-GPU最大带宽可达到400GB/s; 华为HCCS采用对等拓扑,GPU-to-GPU最大带宽是56GB/s。 图表14:训练段GPU性能对比 图表15:英伟达A100 GPU架构 图表16:华为HCCS架构 云计算:优化算力编排,充分提升算力使用效率。云可以通过虚拟化技术实现资源池化,提供弹性的计算和存储资源;还可以为应用程序提供统一的接口,方便应用程序的部署和管理。优质云计算能力可以充分优化算力结构,实现计算效能最大化。 图表17:云计算能力持续升级 智能驾驶对云上能力要求集中在存储和训练。数据流来看,车端完成数据收集、汇总之后,再上传到云端进行存储和训练。存储来看,车辆行为轨迹数据主要包括两个部分:(1)结构化数据(车辆状态数据、行驶轨迹数据),主要使用关系型数据库; (2)非结构化数据(图像、视频、雷达等信息),主要使用非关系型数据。单车数据量在10TB,全年约产生30PB数据量。训练来看,云可以完成数据识别、数据标注等功能,同时云端高质量的仿真测试体系有望加速算法迭代。 图表18:车端行为轨迹数据产生量较大,存储需求旺盛 图表19:云端可以优化数据,保证数据运行效率 3.当下车企智能驾驶端到端大模型进展如何? 根据上述分析,我们将从数据获取能力和数据训练能力两个维度进行当下时点各车企智能驾驶端到端大模型进展的分析。车端主要包括车端芯片升级进度、整车与架构升级节奏,同时具备数据回收能力的保有量产生的数据规模也是分析的重点;训练端算力部署主要包括算力部署节奏和云计算底层架构。同时,研发人员数量和研发支出是开发端和训练端的保证,主要系:1)软件投入及开发需要完成团队建设;2)算力和存储建设需要费用或成本的支出。 3.1数据获取:硬件和架构升级,销量保证数据规模 车端E/E架构:特斯拉和新势力领先,自主品牌加速跟进。特斯拉、新势力车企在E/E架构进展较快,逐步向中央计算平台式架构升级。从时间来看,特斯拉2016年发布HW2.0,标志车型进入域控制器式架构,2019年发布HW3.0版本,特斯拉E/E架构再升级至中央计算平台式架构,是E/E架构进展领先的车企。国内新势力车企迭代速度较快,理想LEEA 3.0架构、小鹏X-EEA 3.0架构、蔚来ADAM 2.0架构均进入中央计算平台式架构。自主品牌来看,吉利浩瀚架构、比亚迪e3.0平台、长安EPA平台均为域控制器式架构,并逐步