您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[天风证券]:大模型应用下自动驾驶赛道将有哪些变化? - 发现报告
当前位置:首页/行业研究/报告详情/

大模型应用下自动驾驶赛道将有哪些变化?

交运设备2023-10-05孙谦、于特天风证券欧***
大模型应用下自动驾驶赛道将有哪些变化?

行业报告|行业专题研究 证券研究报告 2023年10月05日 智能汽车 大模型应用下自动驾驶赛道将有哪些变化? 作者: 分析师孙谦SAC执业证书编号:S1110521050004 分析师于特SAC执业证书编号:S1110521050003 请务必阅读正文之后的信息披露和免责申明 行业评级:强于大市(维持评级)上次评级:强于大市 请务必阅读正文之后的信息披露和免责申明 2 摘要 BEV+Transformer已经成为自动驾驶算法主流趋势 特斯拉率先引入BEV+Tranformer大模型,与传统2D+CNN小模型相比,大模型的优势主要在于:1)提高感知能力:BEV将激光雷达、雷达和相机等多模态数据融合在同一平面上,可以提供全局视角并消除数据之间的遮挡和重叠问题,提高物体检测和跟踪的精度;2)提高泛化能力:Transformer模型提取特征函数,通过注意力机制寻找事物本身的内在关系,使智能驾驶学会总结归纳而不是机械式学习。主流车企及自动驾驶企业均已布局BEV+Transformer,大模型成为自动驾驶算法的主流趋势。 大模型应用下NOA快速落地,L3及以上自动驾驶进程有望加快 在车端大模型可赋能自动驾驶的感知和预测环节,并逐渐向决策层渗透,驾驶策略或将从规则驱动向数据驱动转变。在云端大模型通过实现自动标、数据挖掘、仿真场景生成,提高自动驾驶迭代效率和速度。大模型催化下,高速NOA、通勤NOA、城市NOA等功能快速上车,同时有望加快L3及以上自动驾驶落地进程。 大模型将带来云端算力、车端算力、感知端、执行端以及商业模式的变化 •云端算力:智算中心承载这大模型训练与验证所需的算力支持,已经成为自动驾驶下一阶段竞争重点。我们预计到2025年,智算中心算力将达到14-46EFLOPS,算力市场规模或将达到4-15亿美元,国产算力产业链值得关注。智算中心建设需要综合考虑需求、成本、能力三大因素,我们认为在中短期内,主机厂/自动驾驶厂商将主要采取合作模式/采购模式,长期具备较高自建倾向。 •车端算力:需求翻倍或达800TOPS,算力提升原因主要在于:1)在感知硬件数量和性能不断提升,边缘计算需求增加;2)大模型催化驾驶场景复杂化和多样化。同时对芯片效率能耗提出更高要求。 请务必阅读正文之后的信息披露和免责申明 3 摘要 •感知端:大模型对数据精度要求提升,单车搭载摄像头数量增加,像素从200万向800万升级。主机厂及自动驾驶厂商方案频出,逐渐降低对高精地图依赖,或采取车端实时建图方案,通过安装在车辆上的相机等传感器来构建车辆行驶过程中周围的环境地图。激光雷达逐渐降本趋势下,BEV+激光雷达可提供最大安全保障,因此仍将作为重要传感器需求量或将增加,但长期需求或将见顶。4D成像毫米波雷达或将完全替代3D毫米波雷达,有望对低线激光雷达形成替代,或将在中高端车型及自动驾驶服务车型中快速渗透。 •执行端:高阶智能驾驶落地进行加快下,以线控结构替代机械式结构成为实现执行器多重安全冗余的必要条件,线控底盘重要性凸显,有望加快线控底盘环节国产化进程,看好国产线控底盘零部件供应商崛起机会。 •商业模式:伴随城市NOA逐渐落地,订阅模式开始兴起,消费者更偏好自由度更高的付费模式。订阅模式有望加快NOA功能渗透,并进一步促进数据回收实现智能驾驶系统持续迭代。 风险提示:宏观经济及汽车行业景气度下滑;大模型应用速度或效果不及预期;高阶自动驾驶消费者接受意愿不明确;测算具有 一定的主观性和极端情况假设,结果仅供参考。 目录 4 1进展与趋势 1.1特斯拉开启自动驾驶3.0大模型时代 1.2BEV+Transformer提高智能驾驶感知能力和泛化能力 1.3占用网络模型有望成为下一代自动驾驶算法进步方向 1.4BEV+Transformer已成自动驾驶算法主流趋势 2如何应用?有何趋势 2.1大模型目前主要用于感知和预测环节,逐渐向决策层渗透 2.2大模型可提升智能驾驶性能,有望加快L3及以上自动驾驶落地 2.3NOA快速落地成为智能化新指标 3新变化?新需求? 3.1云端算力 3.1.1是否需要智算中心?智算中心成为下一阶段竞争重点 3.1.2需要多少?预计2025年总算力需求达14-46EFLOPS 3.1.3如何建智算中心?合作/采购模式为主,自建倾向较高 3.2车端算力 3.2.1如何变化?感知数量质量和场景复杂度驱动算力升级 3.2.2需要多少?算力需求翻倍达800TOPS 3.3感知端 3.3.1车载摄像头数量质量齐升 3.3.2无图方案频出,逐步降低对高精地图依赖 3.3.3激光雷达仍作为重要传感器,长期需求或将见顶 3.3.4向4D成像毫米波雷达升级,或将替代低线激光雷达 3.4执行端 3.4.1有望加快线控底盘环节国产化进程 3.5商业模式 3.5.1订阅模式或成主流 4风险提示 研究背景及目的 OpenAI推出ChatGPT,人工智能迎来新时代,大模型成为角逐重点掀起百模大战,行业赋能加速。自动驾驶是大模型行业应用的重点领域之一,本报告尝试解答下列问题: 大模型应用进展与趋势 1 主机厂与供应商大模型应用进展与规划如何? 大模型是否将成主流? 大模型如何应用及其应用效果如何 2 应用与效果 大模型主要用途/效果? 是否会带来新的驾驶功能/驾驶场景? 进展与趋势 变化与影响 3 未来展望 5 未来展望 大模型应用下L3及以上自动驾驶何时到来?4 影响因素是什么? 大模型对产业链影响几何 产业链会有哪些新影响和新需求? 谁将收益/谁或将受影响? 1 进展与趋势 请务必阅读正文之后的信息披露和免责申明 6 1.1特斯拉开启自动驾驶3.0大模型时代 2016以前 软硬件均有Mobileye提供 •硬件:HW1.0 •软件:Autopilot1.0 •算法:2D+CNN 2016-2017 牵手英伟达,算法实现自研 •硬件:HW2.0-HW2.5 •软件:Autopilot2.0 •算法:2D+CNN 2023—— 使用端到端技术 •硬件:HW4.0 •软件:FSDV12 •算法:Occupancy+Transformer 特斯拉率先引入大模型,开启自动驾驶3.0时代。2015年,特斯拉开始布局自研自动驾驶软硬件,2016-2019年陆续实现算法和芯片自研。2020年特斯拉重构自动驾驶算法,引入BEV+Transformer取代传统的2D+CNN算法,并采用特征级融合取代后融合,自动标注取代人工标注。2022年算法中引入时序网络,并将BEV升级为占用网络(OccupancyNetwork)。2023年8月,端到端AI自动驾驶系统FSDBetaV12首次公开亮相,完全依靠车载摄像头和神经 网络来识别道路和交通情况,并做出相应的决策。 FSD入华进程渐近,有望加速智能化进程。目前FSDBeta版本尚未在国内开放,根据36氪消息,特斯拉已在中国建立数据中心,并布局组建国内运营团队和 数据标注团队。由于中国道路的复杂性,特斯拉FSD方案入华仍要进行大量中国里程的实车验证,采集对应场景的数据,优化训练出针对中国场景的神经网络模型,提炼针对性策略。我们认为,FSD或将在2024 年进入中国,经过对中国道路的训练后,2025年大规模上车。预计FSD入华后,有望整体加速中国电动汽车的智能化进程。 资料来源:36氪公众号,汽车之心公众号等,天风证券研究所 特斯拉智能驾驶迭代历程 2018-2019 采用自研芯片FSD,算法升级HyraNet神经网络架构+特征提取网络BiFPN。 2020 引入BEV+Transformer,特征级融合取代后融合,自动标注取代人工标注,布局Dojo开发 2021-2022 引入时序网络,BEV升级为占用网络(OccupancyNetwork) •硬件:HW3.0 •软件:Autopilot3.0 •算法:2D+CNN(HydraNet+BiFPN) •硬件:HW3.0 •软件:FSDBeta •算法:BEV+Transformer •硬件:HW3.0 •软件:FSDBetaV9-10 •算法:Occupancy+Transformer 7 1.2BEV+Transformer提高智能驾驶感知能力和泛化能力 BEV/Transformer分别是什么?BEV全称是Bird’sEyeView(鸟瞰视角),是将三维环境信息投影到二维平面的一种方法,以俯视视角来展示环境当中的物体和地形。Transformer大模型 本质上是基于自注意力机制的深度学习模型,与传统神经网络RNN和CNN不同,Transformer不会按照串行顺序来处理数据,而是通过注意力机制,挖掘序列中不同元素的联系及相关性,使得Transformer可以适应不同长度和不同结构的输入,从而提高模型在处理序列数据上的能力。 与传统小模型相比,BEV+Transformer的优势 BEV+Transformer技术路线 BEV+Transformer技术路线的优势(VS传统小模型) 传统小模型BEV+Transformer 主要在于提升智能驾驶的感知能力和泛化能力,有助于缓解智能驾驶的长尾问题:1)提高感知能 力:BEV统一视角,将激光雷达、雷达和相机等多模态数据融合至同一平面上,可以提供全局视角并消除数据之间的遮挡和重叠问题,提高物体检测和跟踪的精度;2)提高泛化能力:Transformer模型通过自注意力机制,可实现全局理解的特征提取,有利于寻找事物本身的内在关系,使智能驾驶学会总结归纳而不是机械式学 习。 单视角摄像头来进行单模块感知(即后融合),在视野和信息的获取方面存在着很大的局限性 传统的小模型,如CNN、RNN等,参数小、泛化性差,并不能支撑高等级自动驾驶的海量数据处理需求 BEV将多个传感器图像融合至同一平面(即中融合),提供全局视角,可以更全面的了解周围环境 利用Transformer自注意力机制可实现全局理解的特征提取,增强模型稳定性和泛化能力 8 资料来源:ZhiqiLi等《BEVFormer:LearningBird’s–Eye-ViewRepresentationfromMulti-CameraImagesviaSpatiotemporalTransformers》 焉知汽车公众号,英伟达微信视频号,亿欧汽车公众号,天风证券研究所 资料来源:特斯拉AIDAY,AITO汽车公众号,焉知汽车公众号,浦东未来车产业公众号等,天风证券研究所 9 1.3占用网络模型有望成为下一代自动驾驶算法进步方向 特斯拉在2022年AIDay上发布OccupancyNetworks(占用网络),将BEV网络在高度方向进行了进一步的扩展,从而实现了BEV从2D到3D的优化,可实时预测被遮挡物体的状态,解决了目标检测的长尾问题,即使某些物体不存在于训练集中,但是因为算法本身进行的是空间占用的检测,不进行目标检测,因此从根本上避免了这个问题。 华为ADS2.0进一步升级GOD网络,道路拓扑推理网络进一步增强,类似于特斯拉的占用网络。GOD2.0(通用障碍物检测网络,GeneralObstacleDetection)障碍物识别无上限,障碍物识别率达到99.9%;RCR2.0能识别更多路,感知面积达到2.5个足球场,道路拓扑实时生成。2023年12月,搭载ADS2.0的问界新M7可实现全国无高精地图的高阶智能驾驶。 占用网络模型以占用的方式重建了3D场景,可用于通用障碍物检测,精准实现空间中物体的占位情况、语义识别、运动情况等,在表征 上更具优势,有望成为下一代自动驾驶算法进步方向。 OccupancyNetwork效果华为GOD2.0 资料来源:浦东未来车产业公众号,EV视界公众号,汽车商业评论公众号,天风证券研究所 10 目前包括比亚迪、蔚小理、智己等车企,以及华为、百度Apollo、毫末智行、地平线、轻舟智航、觉非科技、商汤科技