202305o04I 汽车ö部þⅡ AI大模型在自ú驾驶中的à用 Tran›former大模型在自ú驾驶中à用势明确2Tran›former基于Attention机制,凭借`ù的长序列处理能力和更高的并行«算效率,2021v特ï拉引入自ú驾驶领域2Tran›formerPCNN相比最大的`势在于w泛W性更强2CNNû能对标注Ï的物体ß行相似þ的比对,通ÏO断学`完p对ï物体识别的任áĀ而Tran›formerÿ以通Ï注意力层的结构找到更基q的元素P元素间之间多个维þ的相s信息ß而找到一种更泛W的相似规律,ß而ð高自ú驾驶的泛W能力2\时,O\于RNN`在`储时间长þp限以及ú序依赖的þ ,Tran›former模型xp更高的并行 «算效率并`ÿ以学`到长时间距离的依赖s系2目前,Tran›former要à用在自ú驾驶感知模块中Ð2D特àĀUBEV鸟瞰Ā的视角转换2 城`领航û驾驶落地在即,AI大模型û力实Ā<脱高精þ地Ā=2目前,机厂k mÐ高场oU城`场o拓展,2023p望p~城`领航û驾驶的大规模落地的元2相比于高场o,城`场o面临的Corner×a›e大幅ð升,要求自ú驾驶系统x备更强的泛W能力2目前þ落地城`NGP要基于高精þ地Ā方案,高精地Ā能够ð供超视距1厘米ÿ相对ÝO及ü航信息,在数据和算法尚op熟之前,对于机厂实Ā高ÿ别自ú驾驶xpÞ要意O2但高精þ地Āà用Ï程中无法做到实施更ð1法规风险高1高pq的O大þ 难以解ô2BEV感知算法通Ï将O\视角的摄像头采集到的Āw统一转换到P帝视角,相`于车实施生p活地Ā,补足了自ú驾驶^续ô策需要的道路拓扑信息,因而ÿ以实Ā去高精þ地ĀW2目前,小鹏1_~等头部自ú驾驶厂商均明确ð出<脱Ā时间表=,自ú驾驶算法<Þ感知,轻地Ā=势明确2 大数据和大算力是大模型à用的Þ要前置条þ2Tran›former大模型àÙ引起质Ù需要1ÿ公Ý的Ý程数据2并`,`感器采集得到的raw–data需ß行标注^才ÿ用于算法模型¯ÿ,自ú标注ýxÿ大幅ð升数据处理þ22018óÎ,特ï拉数据标注Ð2D人ý标注 m发展ó4D空间自ú标注Āÿ内厂商中小鹏1毫p智行等î相继è出自ú标注ýx大幅ð升标注效率2除真实数据外,仿真场o是弥补¯ÿ大模型数据O足þ 的Þ要解ô方式2生p式AIp望èú仿真场o大幅ð升泛W能力,帮û机厂ð升仿真场o数据的à用比例,Ð而ð高自ú驾驶模型的迭代þ1缩短开发周期2大算力是Tran›former模型¯ÿ的另一Þ要条þ,超算中心p~自ú驾驶厂商Þ要的基础设施2特ï拉AI«算中心Dojo总«使用了1.4万个英_达的GP٧来¯ÿAI模型,网þ¯ÿþð升30%,ÿ内厂商中小鹏P阿Ý联\出资打 自ú驾驶AI智算中心<扶摇=,将自ú驾驶算法的模型¯ÿ时间ð170倍2 s注标的ÿ德赛西威,经纬恒润,寒n纪 风险ð升ÿ技术ßmO及预期,法规风险,行业þÏà剧2 行业深þV析 证z研究ç告投资评ÿ领Y大`–A维持评ÿ 汽车ö部þⅡ 沪深300 47% 37% 27% 17% 7% –3% –13% 2022–052022–092022–122023–04 行业表Ā 资料来源ÿWind资± 升幅%1M 相对收益–8.0 ÿ对收益–7.3 3M –8.9 –12.5 12M 13.5 16.2 首选股票 目标ÿÿ元Ā评ÿ 688326经纬恒润 –W 160 买入–A 徐慧雄V析师 GAC执业证书编÷ÿG1450520040002 ×uh×@e››en×e.×om.×n 李泽V析师 GAC执业证书编÷ÿG1450523040001 相sç告汽车ï胎行业系列ç告之 2023–04–21 一ÿàÿ齐升叠àpqQ降周期,看好中ÿ胎企份持续UP智能网联汽车建设kà, 2023–03–15 特Ý场o商业模式þ完pýÿ智能汽车2023þ策略 2022–12–12 ÿⅠĀÿ³Ð入2.0时代,车机域ç格局或将再Þ塑线çá盘ÿ实Ā高¸自ú驾 2022–10–29 驶的ß要条þ,各ÿ节将迎ààï期电驱ú深þç告ÿ行业à 2022–05–17 扩张,格局持续`W,电驱ú行业迎来历ó性机遇 lize@e››en×e.×om.×n 内容目录 1.AI大模型如何à用于自ú驾驶算法中?4 1.1.神经网þà快自ú驾驶感知算法发展,小模型U大模型迭代势明确4 1.1.1.1.深þ神经网þDNN是人ý智能的开端5 1.1.1.2.卷ÿ神经网þCNN广泛用于特àð×5 1.1.1.3.循ÿ神经网þRNNp效处理p时间序列信息7 1.1.2.Tran›former大模型的注意力机制p~自ú驾驶感知算法的利器8 1.2.特àÿ融\ m×代^融\,BEV+Tran›former~`前流方案10 1.2.1.自ú驾驶感知技术Ð^融\U特àÿ融\迭代势明确10 1.2.2.Tran›former大幅ð升BEV空间中的特àÿ融\效果12 2.AI大模型的à用对自ú驾驶领域~来的好处?15 2.1.城`NGP落地在即,AI大模型的à用驱ú自ú驾驶算法x备更强的泛W能力15 2.2.Ð特ï拉感知算法迭代历程看AI大模型对城`NGP的赋能方U17 2.2.1.第一ffi段ÿBEV+tran›former,实Ā<脱高精þ地Ā=18 2.2.2.第Ðffi段ÿ升ÿ到s用网þ,实Ā<脱激Z÷达=21 2.2.3.第Offi段ÿÐ感知到ô策ç制端到端的自ú驾驶模型p望p~o来发展方U ......................................................................22 3.AI大模型à用于自ú驾驶中的前置条þ?23 3.1.条þ一ÿx备相`数à的Ý程数据,因而自ú标注+仿真Āÿ节将尤~Þ要23 3.2.条þÐÿx备相`算力的ß端¯ÿĀ,因而超算中心将p~机厂ß要基础设施26 4.s注标的28 4.1.德赛西威28 4.2.经纬恒润28 4.3.寒n纪29 5.风险ð示29 Ā表目录 Ā1.自ú驾驶系统V~感知1ô策和执行O部V4 Ā2.一个感知机就类似一个生物神经元5 Ā3.DNN架构ÿO\层感知机全â接, 层单U`递信÷5 Ā4.人类能够通ÏÊ察特à高效判别人脸6 Ā5.CNN相比于DNN在全â接层之前à入卷ÿ/W层6 Ā6.CNN通Ï卷ÿ和Wí作ð×Ā像特à并降P数据维þ7 Ā7.多次Wÿ能丢失特àO置信息,CNNÿ能误判7 Ā8.RNN借û循ÿð×时间特à,实Āâ续数据预测8 Ā9.Tran›former的目标是û找元素间的hÞs系8 Ā10.Vi›ionTran›former模型架构8 Ā11.注意力机制能够获得一个元素和w他元素多角þ相sþ的矩·9 Ā12.编码器–解码器架构9 Ā13.tran›former架构10 Ā14.按照融\ÿ节O\V~前–特à–^融\11 Ā15.^融\Ï程11 Ā16.前融\Ï程12 Ā17.特àÿ融\Ï程12 Ā18.Ā像空间中的感知结果通Ï^融\投影到BEV空间中出ĀoÞ的失真13 Ā19.BEV感知框架13 Ā20.英_达LGG算法基q架构14 Ā21.特ï拉基于Tran›former的BEV空间转换架构14 Ā22.BEV转换Ï程15 Ā23.基于交Ü注意力机制在BEV空间内做特àÿ融\的效果à好于基于规[的方法在 BEV空间内^融\15 Ā24.城`场oxp高频1\需特à,落地ÿ值凸显16 Ā25.高场o自ú驾驶Corner×a›e较少17 Ā26.城`场o自ú驾驶Corner×a›e大幅ð升17 Ā27.特ï拉自ú驾驶算法迭代历程18 Ā28.BEV鸟瞰Ā视角19 Ā29.特ï拉BEV语O地Ā20 Ā30.理想BEV语O地Ā20 Ā31.xNet感知架构Þ感知1轻地Ā20 Ā32.BEVPs用网þ效果对比21 Ā33.BEVPs用网þ效果对比22 Ā34.深þ强W学`y型框架23 Ā35.车道保持ß能的端到端¯ÿ框架23 Ā36.特ï拉数据引î24 Ā37.特ï拉自ú标注系统迭代历程24 Ā38.毫p视频自÷督大模型25 Ā39.仿真场o中对\一路口生pO\街oß行场o泛W26 Ā40.对统一路口生pO\车道s系ß行场o泛W26 Ā41.特ï拉超算中心27 Ā42.搭载超算中心投资金28 Ā43.搭载超算中心时间周期28 Ā44.经纬恒润自ú驾驶域ç制器ï品29 表1ÿ2023多家机厂预«è出城`领航û驾驶16 表2ÿ高精地Ā在城`道路覆盖þp限18 表3ÿ`统地ĀP高精地Ā盈利模式的|别19 表4ÿ要自ú驾驶厂商ýa脱Ā时间21 表5ÿ自ú驾驶厂商超算中心建设情况27 1.AI大模型如何à用于自ú驾驶算法中? 算法是ôÝ自ú驾驶车感知能力的心要素2`前流的自ú驾驶模型框架V~感知1规划ô策和执行O部V2感知模块是自ú驾驶系统的眼睛,心任á包括对采集Ā像ß行检测1V割等,是^续ô策层的基础,ôÝ了整个自ú驾驶模型的P限,在自ú驾驶系统中ósÞ要2感知模块硬þ部V要~`感器,ðþ~感知算法,w中算法是ôÝ自ú驾驶车感知能力的心要素2 Ā1.自ú驾驶系统V~感知1ô策和执行O部V 资料来源ÿÜ信证z研究中心þ制 1.1.神经网þà快自ú驾驶感知算法发展,小模型U大模型迭代势明确 神经网þ模型的à用驱ú感知算法高发展2早在P世纪70代,学术院校和ù研机构展开对自ú驾驶技术的探索,早期的自ú驾驶感知算法要是基于`统«算机视觉技术,直到2010之^着深þ学`技术的发展,神经网þ被引入到自ú驾驶感知算法中,自ú驾驶汽车的感知效果p了质的ð升2 à用于感知层面的神经网þ模型ÿ以V~n类,一类是以CNN1RNN~代表的小模型,另一类是Tran›former大模型2神经网þ是一种Ø生物神经元启发而ï生的深þ学`方法,v _多的感知机构p2感知机类似于生物学中的神经元,输入信÷经Ïàh均ß算,若超Ï某一个阈值[U^`递信÷,否[被抑制2O\的神经网þ模型实×就是对感知机之间设ÝO\的逻辑s系2单个感知机ý作的Ï程~ÿ1Ā感知机前端相`于神经元树突,接Ø输入信÷×,ÿ以以Uà表示×=ÿa,b,×Ā,w中a1b1×V别来自P一个神经元或原始Ā像22Ā输入信÷Pâ接hÞUàw=ÿw1,w2,w3Āß行内ÿß算,à实×是对输入信÷ß行àh均23Ā在相`于神经元轴突的感知机^端设Ý一个阈值z,`àh均值达到阈值即×wT+z>0,[感知机被激活U^`递信÷,否[感知机被抑制24Āl外,引入非线性因素保证输出â续,ÿ以对×wT+b整体施à一个激活函数2 Ā2.一个感知机就类似一个生物神经元 资料来源ÿ,Ü信证z研究中心þ制 1.1.1.1.深þ神经网þDNN是人ý智能的开端 深þ神经网þÿDNNĀÛü多层感知机神经网þ,w中pO个基q类型的层ÿ输入层1 藏层ÿ或者ü中间层,ÿ以p多个Ā1输出层2O\层之间的感知机全â接,在è理时,前UÿÐ输入层到 藏层到输出层Ā`递信÷得到è理结果2在学`时[将误差ÿ真实值和è理值的偏差ĀàU`递ÿÐ输出层到 藏层到输入层Ā,实Ā对感知机参数ÿâ接hÞ和阈值Ā的更ð,直ó找到使得误差最小的一Ā感知机参数2在自ú驾驶感知模块中输入数据 ~Ā像,而Ā像xp高维数ÿ对比时间序列通常û是一维UàĀ,对w识别时需要设置大à输入神经元以及多个中间层,模型参数à大难以¯ÿ`í耗算力高,并ÿ能~来Ï拟\的þ 2 Ā3.DNN架构ÿO\层感知机全â接, 层单U`递信÷ 资料来源ÿÜ信证z研究中心þ制 1.1.1.2.卷ÿ神经网þCNN广泛用于特àð× DNN识别Ā像的q质是对每一个像素点ß行比对学`,因l效率较P2Ï实P,人类在对Ā像ß行识别是并O需要对像素点ß行 个对比,而是通ÏĀ像的特àß行识别2例如识别人脸时,并O需要对每一个像素点都仔细Ê比对,而是Y搜索脸部的ï廓以及眼睛1鼻子等特