您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华鑫证券]:智能驾驶系列研究(一):从特斯拉视角,看智能驾驶研究框架 - 发现报告
当前位置:首页/行业研究/报告详情/

智能驾驶系列研究(一):从特斯拉视角,看智能驾驶研究框架

交运设备2024-06-04林子健、谢孟津华鑫证券嗯***
智能驾驶系列研究(一):从特斯拉视角,看智能驾驶研究框架

分析师:林子健 SAC编号:S1050523090001 联系人:谢孟津 SAC编号:S1050123110012 行业深度报告 证券研究报告 从特斯拉视角,看智能驾驶研究框架 ---智能驾驶系列研究(一) 投资评级:推荐(维持) 报告日期:2024年06月04日 核心结论: 特斯拉视角智能驾驶历史复盘 算法 算法 第一章:回顾历史,智能驾驶的核心主线是算法的演进史,从2017年至今,在感知侧+规控侧实现算法从规则为主走向端到端。算法方面,2017-2022年,特斯拉在感知侧走向端到端,实现BEV+Transformer+Occupancy。2021-2023年,特斯拉在规控侧从规则走向端到端。数据闭环方面,特斯拉在2022年实现模拟仿真数据、自动标注、云端算力等三个方面的升级。硬件方面,特斯拉从HW1.0升级至HW4.0,期间通过算法升级+自研FSD芯片,实现更为适配智能驾驶进化的硬件体现。 数据闭环 智能驾驶未来 研究框架 数据闭环 第二章:展望未来,我们认为智能驾驶的算法将走向收敛,核心主线将从算法走向数据闭环。向未来看,我们提出由算法+数据闭环+硬件降本+政策法规四个维度构成的研究框架。围绕这些角度展开,我们提出未来智能驾驶核心的三个趋势:数据竞赛+大模型+任务导向。 第三章:对国内智驾能力的区分,我们提炼四个维度:数据积累能力+智驾好用能力+安全性+舒适性。基于数据闭环(背后竞争要素对应为组织的工程化能力)成为未来核心分水岭,我们认为基于算法来判断各车企领先程度的意义将愈发有限,以对数据为主的跟踪将成为未来判断各车企竞争水平的重要指标。 硬件配置 通过复盘高速NOA发展历史,我们总结出高速NOA与城区NOA的两点不同, 提出城区NOA发展的三个阶段,判断2025H1有望实现“好用拐点”。 硬件降本 第四章:智驾下半场是城区NOA,智驾有望在2025H1迎来“好用”拐点。 政策法规 高速NOAvs城区NOA 驱动方式 两个不同 高速NOA三年好用城区NOA更快 落地成本 智驾拐点判断 可用:2023-2024 城区NOA三个阶段 好用:2024-2025H1 车企的智驾能力跟踪框架 数据积累能力 智驾好用能力 执行侧舒适度 安全 必用:2026及以后 风险提示 智能化落地不及预期; 技术迭代风险; 宏观经济波动风险; 下游需求不及预期的风险。 目录 CONTENTS 1.历史:特斯拉视角看智驾演进 2.未来:智能驾驶研判框架 3.供给:车企智驾能力分析 4.需求:智驾拐点何时来临 01特斯拉视角:智驾历史复盘 2023. 2023. 2024. 2024. 2024. 08.15 11.23 04.20 04.28 04.29 特斯拉计划组建一个20人左右的本地远营团队,以推动自动驾驶在中国市场落地。与此同时,特斯拉还在中国尝试成立一个数据标注团队,规模约上百人,为训练FSD的算法作准备。 特斯拉中国回应,FSD落地中国 正在推进的消息属实。 马斯克在twitter上的回复中表态,FSD入华"可能很快就会到来”,本次访问中国预计将推动相关进程。 马斯克访问中国:特斯拉通过国 家汽车数据安全4项全部要求。 据特斯拉用户APP表示,特斯拉中国官方的FSD购买页面描述由“稍后推出”改为“即将推出”,特斯拉FSD离进入中国更进一步。 资料来源:财联社,twitter,中国汽车工业协会,特斯拉官方,华鑫证券研究 模块合成式驾驶方法:包含感知、规划决策,执行控制三大模块,通过分别调试每个模块的参数来适应各种各样的驾驶场景。 •(1)感知模块:利用各种传感器来实现对静止环境、行车相关信息及移动障碍物的全面检测和跟踪,进而将场景图像转化为关键感知指标。 •(2)决策模块:在完成道路交通场景的感知后,从感知模块获取全局和局部信息,对起点到终点的行驶路线进行分析和规划,确定车辆的行 驶路线并最终输入执行模块以实现车辆控制。 •(3)控制模块:负责将来自决策模块的行驶策略转化为具体的车辆控制指令,实现车辆的实际运动。 图表:智能驾驶模块化设计理念 图表:智能驾驶端到端设计理念 模块化架构:规则驱动 端到端架构:数据驱动 感知-定位 决策-规划 执行-控制 端到端智能驾驶方法:端到端智能驾驶方法本质上是使用一个独立系统进行驾驶,通过训练一个深度神经网络从感官输入(如摄像头采集的道路信息)直接映射到驾驶动作。 Transformer LSTM网络 卷积神经网络 执行系统 安全控制 制动控制 驱动控制 转向控制 路径追踪系统 环境感知 激光雷达毫米波雷达 传感器 决策系统 异常处理 轨迹规划模块 行为决策模块 定位/导航 GPS/惯性导航 车辆数据 资料来源:《面向大场景的智能驾驶端到端算法研究》,亿欧智库,华鑫证券研究 •1.1.12014-2016年以规则驱动为主 •端到端的设计理念是输入原始数据后,直接反应输出结果,最早可追溯到上世纪80年代。1988年,第一辆端到端驱动的陆军救护车ALVINN,当时还没有出现卷积神经网络CNN,只构建了一个三层可反向传播的全连接神经网络,并在卡内基梅隆大学的校园内以0.5m/s的速度准确的行驶了400米。 图表:第一台端到端ALVINN 图表:规则驱动与数据驱动对比 设计理念 规则驱动系统 模块化 数据驱动系统 端到端 优势 可解释性、可验证性、易于调试 数据驱动潜力较大,简洁,易于联合训练 劣势 错误传递、模块间不协调、潜力有限 受限神经网络模型发展;黑匣子 模型架构 •相比规则驱动,端到端的框架更为简洁,应用潜力更大,但受制于神经网络模型的发展,一直未在产业中大规模落地使用。 资料来源:《ALVINN:Anautonomouslandvehicleinaneuralnetwork》,《基于深度学习的端到端自动驾驶模型研究及仿真》,BuildingtheSoftware20Stack,《End-to-endAutonomousDriving:ChallengesandFrontiers》,华鑫证券研究 •1.1.12014-2016年以规则驱动为主:由Mobileye提供智驾解决方案。早年的特斯拉并没有自研自动驾驶芯片,从2014年开始特斯拉与 Mobileye合作,在其量产车型上一直采用Mobileye的EyeQ3技术方案。Mobileye届时的算法主要由规则驱动,以单目相机成像测距为例 ,通过物体在图像中的像素高度h和焦距f,即可计算出前方车距。 •2016年特斯拉和Mobileye终止合作:①导火索:2016年5月第一起配备Autopilot的ModelS发生致命事故,无法识别白色拖车和天空; ②核心原因:Mobileye提供的车企的是一个封闭的黑盒方案,车企不仅不能修改其中的算法,而且还不能与Mobileye共享车辆数据。 图表:MobileEye距离测试规则示例 图表:利用焦距计算距离原理示意 资料来源:Mobileye,TheDistanceEstimationofMonocularCamera,Theverge,华鑫证券研究 •1.1.2感知侧2017-2022走向端到端:Transformer+BEV+Occuopancy的主流架构 •CNN极大提高了机器视觉的识别效率,让机器视觉走向深度神经网络结合的端到端架构成为可能。从机器认识一只狗的过程来类比,此前的DNN网络依赖于先认识狗的每个“细胞”,而CNN则从认识狗的一个部位开始,例如眼睛、耳朵,来判断一只图像为狗,其中涉及到三个主要的不同: •(1)不需要认识图像的全部,识别难度降低;(2)通过局部特征训练出来的神经元,能更好的迁移到其他图像(从认识狗的专家,变成认识耳朵的专家);(3)卷积过程降低了图像特征的维度,减少数据量。 图表:CNN去认识一只小狗 图表:DNN去认识一只小狗 资料来源:《丁磊:生成式人工智能》,《EdgeMachineLearningforAI-EnabledIoTDevices:AReview》,《ImageProcessing:HowDoImageClassifiers Work?》,华鑫证券研究 •1.1.2感知侧2017-2022走向端到端:Transformer+BEV+Occuopancy的主流架构 •深入来看,CNN神经网络的效率核心在于卷积+池化的过程。相比全连接DNN神经网络,CNN需要训练的参数数量明显减少。举例来说,一幅像素为1K*1K的图像作为输入,Hiddenlayer有1M节点,仅一层就有10^12个权重需要训练,如果使用CNN网络,采用100*100的卷积核,共使用100个卷积核,输入到Hiddenlayer的参数便降低到了100*100*100=10^6个。 •如果说CNN将管理100人的工作变成管理10个组长,那卷积核就像不同的组长:不同的卷积核代表了不同的特征提取能力。该结构上下层 不再直接全部连接,同一层将共用单个或一定数量的卷积核,因此大大减少了训练权重的数量。 图表:CNN工作过程示意图 图表:CNN卷积-池化层核心结构示意 资料来源:《丁磊:生成式人工智能》,《深度神经网络的关键技术及其在自动驾驶领域的应用》,华鑫证券研究 •1.1.2感知侧2017-2022走向端到端:Transformer+BEV+Occuopancy的主流架构 •2017年AndrejKarpathy加入特斯拉,推动CNN神经网络落地,感知侧端到端拉开序幕。AndrejKarpathy2015年在斯坦福执教,设计并创办了课程卷积神经网络CNN在机器视觉中的应用。 •特斯拉提出Softwate2.0吞噬1.0,CNN网络架构将设计特征的工作从专家交给机器。传统的特征设计往往由特定领域内的专家设计,但当面对复杂任务情景是,专家设计的特征往往存在诸多局限,例如特征本身的有效性、有限性等等。AndrejKarpathy2017年加入特斯拉,推出Software2.0,提出用2.0(基于CNN神经网络模型)吞噬传统Software1.0(由Python、C++等语言编写的代码)的理念。 图表:特斯拉Software2.0吞噬1.0过程图 图表:神经网络将设计特征从专家交给机器 Output Output 1.0code 2.0code 1.0code 2.0code Features Hand-designedfeatures Hand-designedprogram Output Mappingfromfeatures Mappingfromfeatures 1.0:基于编程代码 2.0:基于端到端神经网络 2.0code Input Input Input 资料来源:BuildingtheSoftware20Stack,EnhancingDeepLearningPerformanceusingDisplacedRectifierLinearUnit,华鑫证券研究 •1.1.2感知侧2017-2022走向端到端:Transformer+BEV+Occuopancy的主流架构 •2019年推出HydraNet架构,处理不同的任务。感知侧有许多不同的任务,如果每一项任务都单独使用神经网络,则成本高昂。HydraNet的架构通过一个共享的主干网络backbone,能有效的实现三个方面的优点:(1)特征共享:减少重复的卷积计算,减少主干网的数量;(2)任务解耦:将特定任务与主干分离,能够单独微调任务;(3)能缓存特征,更高效的微调。 图表:不同的任务共用一个SharedEncoder 图表:驾驶过程中的不同任务繁杂 图表:特斯拉的HydraNet架构 资料来源:TeslaAIDay,LEARNHYDRANETS:Monstro