您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[西南证券]:端到端模型赋能自动驾驶,机器人引领具身智能:从特斯拉FSD看人工智能 - 发现报告
当前位置:首页/行业研究/报告详情/

端到端模型赋能自动驾驶,机器人引领具身智能:从特斯拉FSD看人工智能

机械设备2023-08-03王湘杰西南证券点***
端到端模型赋能自动驾驶,机器人引领具身智能:从特斯拉FSD看人工智能

AI专题 从特斯拉FSD看人工智能 ——端到端模型赋能自动驾驶,机器人引领具身智能 西南证券研究发展中心海外研究团队王湘杰2023年8月 从特斯拉FSD看AI对自动驾驶的赋能: 核心观点 技术端:特斯拉率先提出纯视觉方案,端到端自动驾驶成为新路径。特斯拉基于对第一性原理的坚持以及对成本的考量,率先实行纯视觉方案,认为自动驾驶可以依靠摄像头实现感知和目标识别,其成本优势也将推动自动驾驶汽车加速实现规模化量产。此外,特斯拉基于Transformer大模型推出端到端自动驾驶方案,构建多任务学习神经网络架构HydraNet,引入特征级融合、占用网络和BEV+Transformer范式。其中,BEV算法有助于将摄像头的2D感知转化为3D视觉,占用网络有助于解决长尾问题,Transformer能够利用注意力机制实现更精准的目标识别,并通过添加时序和空间信息使自动驾驶更接近4D真实世界,推动智驾水平迈上新台阶。目前,以特斯拉FSD为代表的自动驾驶系统表明神经网络算法和AI大模型的赋能已经渗透至智能汽车领域。 商业端:汽车软件化趋势明显,整车价值量有望提升。随着特斯拉FSD自动驾驶软件的推出,其软件能力已成为差异化卖点,FSD套件的盈利模式采用一次性买断制和按月订阅制,且一次性购买价格经过多轮涨价,目前已提升至15000美元。我们认为,特斯拉在售卖整车的同时还可以售卖自动驾驶服务套件,盈利能力进一步增强。未来,自动驾驶系统在AI技术的赋能下有望持续迭代,单车软件价值逐步增长,推动整车价值量提升,智能汽车软件化趋势明显。 从特斯拉FSD看AI对人形机器人上的赋能: Optimus沿用FSD底座,有望引领具身智能。人形机器人与自动驾驶的算法底座本质上均可分为感知层、规划层和控制层,且在硬件设施上有较高的重合度和通用性。特斯拉Optimus同样是基于第一性原理,模拟人体设计,在视觉感知上改进占用网络,在规控上优化运动轨迹,使机器人更好地适应现实世界。我们认为,自动驾驶技术的进步与发展将惠及至人形机器人领域,推动人形机器人迭代提速 ,引领AI下一代浪潮。 投资建议:建议关注自动驾驶产业链和机器人产业链,其中重点关注具备数据优势、算法优势、且有望在软件端率先进行商业化变现的整车厂商。相关标的:特斯拉(TSLA.O)、小鹏汽车(XPEX.N)等。 风险提示:行业竞争加剧风险,技术发展不及预期风险,商业变现不及预期风险等。 1 目录 1人工智能助力自动驾驶,端到端方案成为新路径 1.1智能驾驶行业趋势:以自动驾驶技术为驱动,迈向规模化量产 1.2自动驾驶生态圈:算法为核心技术难点,车企与模型厂商探索共建 1.3自动驾驶系统:AI赋能主要体现在感知环节 1.3.1感知环节-硬件端:传感器性能各异,4D毫米波雷达有望成为新标配 1.3.2感知环节-融合方案:特征级融合优势显现,纯视觉方案兴起 1.3.3感知环节-视觉表达:BEV实现动态还原,占用网络展现4D泛化世界 1.4技术路径:大模型端到端自动驾驶,BEV+Transformer成为主流 1.4.1大模型成就端到端自动驾驶,推动感知决策一体化 1.4.2车企率先聚焦端到端感知,BEV+Transformer成为主流 2 1.1行业趋势:以自动驾驶技术为驱动,迈向规模化量产 从智能驾驶的发展趋势来看:行业的上半场以电动化为主,核心驱动力与能源电池紧密相关,技术方向主要为辅助驾驶,市场主要关注技术的验证和特定场景的落地;智能驾驶的下半场以智能化为主,发力方向主要集中于智能座舱领域和自动驾驶领域,核心驱动力在于高阶辅助驾驶和自动驾驶技术的创新升级,相关车企逐步聚焦产业化、规模化问题,致力于实现高阶智能汽车的商业化量产。 从人工智能带来的变化来看:我们认为神经网络算法逐渐对各个产业和领域进行深度赋能。2022年11月OpenAI推出ChatGPT、2023年3月推出GPT-4,表明大语言模型率先对文本端赋能;当前,特斯拉FSD系统迭代至BetaV11.4版本,在架构上进行重大改进,引入BEV+Transformer范式,推动端到端自动驾驶,表明神经网络的助力已渗透到智能驾驶等领域。 随着智驾场景从较为简单的高速场景迈向更加复杂的城市场景,我们认为,在人工智能的赋能下,自动驾驶感知技术的进步将在更多智驾场景下显现优势。 智能驾驶行业趋势 行业趋势 电动化 ——技术验证的上半场 智能化 ——商业化量产的下半场 2016年 电动乘用车渗透率<2% 2022年 电动乘用车渗透率≈20%;智能乘用车渗透率≈5% 2030年 预计智能乘用车渗透率≈50% 行业机会 动力系统变革:电动化 智能驾驶:L2及以下功能+特定场景L4初试 电子电气架构变革:软硬件解耦+中央大算力 智能驾驶:多融合方案+L3及以上商业化量产 竞争要素 技术验证为核心;Demo车场景试点;单一模块 的落地能力 商业化量产为核心;满足功能安全的正向开发; 规模化/定制化的赋能能力 资料来源:觉非科技,西南证券整理3 1.2生态圈:算法为核心技术难点,车企与模型厂商探索共建 自动驾驶生态圈及技术发展情况 自动驾驶作为行业下半场的重点发力方向之一,其生态圈的构建非常关键。自动驾驶生态圈可分为四个层级:开发服务、后台系统及基础设施、单车软件系统、单车硬件系统。其中,软件系统中的感知算法、预测及规划算法是当前的核心技术难点。我们认为,自动驾驶解决方案及其生态圈的构建是车企实现产品领先以及差异化体验的核心,车企可以选择与模型厂商或算法公司合作研发、共同探索,建立基于软件系统和生态圈的核心竞争力。 开发服务 测试验证 系统设计 系统整合 感知算法 单车软件系统 通讯软件 数据中心 后台系统 及基础设施 LBS(基于地理位置的服务) 云端算法学习及迭代 高精地图 底层操作系统 车载操作系统(OS) 中间层 人机交互 (HMI) 控制算法 预测及规划算法 传感器信号处理 智能路网 (包括路边通讯及边缘计算单元线) 单车硬件设施 传感器:摄像头、 毫米波雷达、激光雷达 车载通讯单元 电路/线控 动力供应 人机交互 硬件 域控制器 电子控制单元 GPU、CPU、MCU、存储芯片等 注1:●代表技术完全成熟、●代表技术基本解决、●代表技术核心难点; 注2:粉色方框代表需要中国方案;红色方框代表需要结合客户、车况路况需求深度制定;灰色方框代表基本全球通用。 资料来源:麦肯锡,西南证券整理4 1.3自动驾驶系统:感知是前提,规控决定车辆如何与环境互动 自动驾驶系统对应着自动驾驶生态圈中的单车软件系统及部分硬件设施,主要由三个子系统构成: 感知子系统:感知是规控的前提,由各种传感器和感知算法组成。车载传感器包括摄像头、激光雷达、雷达、声纳、IMU、GNSS等,用来感知周围环境、监测车辆的定位和状态。感知算法主要包括传感器融合和滤波算法(例如卡尔曼滤波、粒子滤波、贝叶斯滤波),可以帮助减少传感器数据噪声的形成,由此降低测量的不确定性。 规划子系统:利用感知结果,对车辆行为进行最优规划。车辆采用的最优行为需要通过预测车辆和环境中的其他事 物的未来状态来确定,并考虑全局计划、安全性、舒适性及软硬件的约束等。 控制子系统:通过调整车辆的控制元件,准确执行轨迹,实现“实际驾驶”。控制算法可分为纵向运动控制(例如对车速、与前后车或障碍物距离的控制)和横向运动控制(即垂直于运动方向上的控制,例如转向控制),代表执行器包括油门、刹车和转向等。控制系统决定最终车辆将如何表现并与环境互动。 当前,AI对自动驾驶的赋能主要体现在感知环节、以及连接感知和规划的预测环节。 Perception Control Computer Actuators PlanningAlgorithms PerceptionAlgorithms Control Algorithms LocalPlanning BehaviorPlanning TrajectoryGeneration Planning Sensors Others GNSS RADAR IMU LIDAR SONAR Camera Steering Brake GlobalPlanning Detection&Tracking StateEstimation Localization Throttle Lateral Control Longitudinal Control Map 自动驾驶系统基本架构 资料来源:《CONTROLSTRATEGIESFORAUTONOMOUSVEHICLES》,西南证券整理5 1.3.1感知环节-硬件端:由传感器采集环境信息,主流硬件成本不一 四类自动驾驶传感器性能对比 指标 激光雷达 毫米波雷达 超声波雷达 摄像头 探测距离 <150m >150m <10m <50m 分辨率 >1mm 10mm 差 差 方向性 能达到1度 最小2度 90度 由镜头决定 响应时间 快(10ms) 快(1ms) 慢(1s左右) 一般(100ms) 精度 极高 较高 高 一般 温度稳定性 好 好 一般 一般 湿度稳定性 差 好 差 差 恶劣天气适应性 差 强 差 差 穿透力 强 强 强 差 成本 高 较高 低 一般 功能 实时建立周边环境的三维模型 自适应巡航、自动紧急制动 倒车提醒、自动泊车 车道偏离预警、前向碰撞预警、交通标志识别、全景泊车、驾驶员注意力监测 优点 精度极高、扫描周边环境实时建立三维模型的功能强大 不受天气影响、探测距离远、精度高 成本低、近距离测量精度高 成本低、可识别行人和交通标志 缺点 成本高、精度会受恶劣天气影响 成本高、难以识别行人 只可探测近距 依赖光线、极端天气可能失效、难以精确测距 感知系统首先需要各种硬件传感器,对周围环境进行感知,并转化为数据和信息。 核心传感器包括:1)视觉摄像头:价格较低,在百元人民币水平;在目标识别上优势突出;摄像头易受光干扰;对雨、雪、雾等极端天气情况下可能失效。2)激光雷达:价格昂贵,当前车载激光雷达单颗售价约数千元甚至上万元人民币;对物体的位置、距离和大小等空间信息的感知更准确;激光雷达基于自发光特性,不受光影响,但易受雨、雪、雾天气的影响。3)毫米波雷达:成本较高,在数百人民币至千元区间;不受天气状况限制,环境适应性强;测速,测距能力强。4)超声波雷达:价格低,车载超声波雷达单个售价在数十元人民币水平;检测距离短,是泊车功能的重要传感器。 资料来源:曼孚科技,西南证券整理6 1.3.1感知环节-硬件端:车企配置各异,4D毫米波雷或成为新标配 汽车厂商 车型 摄像头 硬件配置 激光雷达毫米波雷达超声波雷达 芯片 特斯拉及新势力厂商硬件配置情况 自动驾驶传感器配置可分为三大派别:1)摄像头派:以特斯拉为代表,主要通过视觉摄像头模拟人眼视力;2)激光雷达派:增加多颗激光雷达,价格较为昂贵,从目前多款车型的传感器配置来看,激光雷达已具备上车能力;3)毫米波雷达派:以蔚来、小鹏为代表,采用“多颗毫米波雷达+摄像头”的硬件配置,截至2023H1,部分新势力车企和传统车企已将4D毫米波雷达应用至旗下新晋品牌的主推车型上。 特斯拉 model3/s/x/y 8 01 12 特斯拉fSD 理想汽车 L7/L8Air/Pro 10 0 1 12 1*地平线征程5 L7/L8/L9Max 11 1 1 12 2*英伟达Orin-X 蔚来 ET/ES/EC 12 1 5 12 4*英伟达Orin-X 小鹏汽车 G9570Plus/570Pro/702Pro/650Pro 11 0 5 12 1*英伟达Orin-X G9570Max/702Max/650Max 11 2 5 12 2*英伟达Orin-X 2023H1部分主机厂激光雷达和4D毫米波雷达搭载情况 资料来源:特斯拉官网,理想汽车官网,