智能车研究框架(9):玩家进展:蔚来、小鹏、理想篇20240910_原文 2024年09月10日19:12 发言人00:00 本次会议仅面向开源证券的专业投资机构客户或受邀客户,仅供在新媒体背景下研究观点的及时交流。第三方专家发言内容仅代表其个人观点、所有信息或所表述的意见并不构成对任何人的投资建议。未经开联证券事先书面许可,任何机构或个人联系录音转发及相关解读涉嫌违反上述情形的,我们将保留一切法律。 智能车研究框架(9):玩家进展:蔚来、小鹏、理想篇20240910_原文 2024年09月10日19:12 发言人00:00 本次会议仅面向开源证券的专业投资机构客户或受邀客户,仅供在新媒体背景下研究观点的及时交流。第三方专家发言内容仅代表其个人观点、所有信息或所表述的意见并不构成对任何人的投资建议。未经开联证券事先书面许可,任何机构或个人联系录音转发及相关解读涉嫌违反上述情形的,我们将保留一切法律。感谢您的理解和支持,谢谢。 发言人00:37 购车者大家早上好,我是开源中小盘和汽车的任娜。继续欢迎大家收听我们智能车研究框架系列的这个第二会的一个深度的汇报。我们今天其实也是继前两次跟大家分享的整个玩家的一个进展,第一次都过整个实际的一个实测的功能体验的各家的一个对比的一个情况。第二天跟大家分享了整个华为系的一个进展,今天跟大家主要分享的就是车企这边,尤其是新势力这边,魏小米的整个自驾的技术发展的历史最新的一个情况,以及整个功能体验的一个情况。这些的工程企业其实在第一篇完结进来的第一天,跟大家其实做了比较多的一个介绍,尤其是领先的对小鹏。但是同时我们对这个后发快科技的理想也做了比较多的一个介绍,所以今天其实主要是介绍三家整个整个专家的一个发展的一个历史,这的一个技术布局的一个情况,以及未来发展的一个规划,包括目前体验的一个技术的一个情况。 发言人02:01 首先我们其实分享的是小鹏,小鹏因为是自驾的一个标签,作为典型的一个新势力可以看到其实在很多领域其实都是行业的领先的一个这些并且也是相关功能在国内第一个开发出来这样的一个玩家。所以对小鹏这样一个研究,在很多时候对于未来前瞻性的一个判断,还是有很大的这样的一个帮助的那第二个其实理想理想其实大家最关注的一个问题就是在智能化,尤其是自驾这边能不能够后发先制,能够快速的跟上甚至赶超,这是大家非常关注的一个问题。然后第三个是未来,未来其实在布局这方面其实是非常的领先的。包括一开始在车上的一个,这就是思考类的这样的一个布局,包括自研芯片的一个布局。那其实相对来说都是比较早的。包括我们说对于整个端到端的自动驾驶的一个架构的这领先的布局,世界模型的领先的一个布局其实都是还是比较早的。所以我们也可以看到整个未来布局,以及后面可能带来比较大的一个改善的这样的一个点。 发言人03:29 这是今天其实主要就是从这三家企业跟大家做一个介绍。第一个其实就是我们说介绍一下这个小红。小红其实刚好前段时间小鹏的十周年里面和小朋友也做了一个分享。 发言人03:47 其实有一点,像我们这个PPT里面也有一个相关的一个内容大家可以看到就是其实国内的很多的制造业这样我们一个功能和体验其实都是小鹏率先研发出来的,包括这个动泊车,大家如果还记得话,在最开始的这样的一个这个时候,大家会认为自动泊车,都是一个非常惊艳的这样的一个功能。那大家可能在,1718年,那个时候如果说有一个叫泊车的一个车出来的话,那就是非常值得惊艳的那实际上,到了,1920年,那时候中国已经慢慢已经成熟了。现在大家如果去体验这个车模式,已经体验非常好了。就是无论是坐在车上的泊车,还是离车的泊车,都已经做的非常的预算。但现在大家可能觉得已经是见怪不怪,这是一个很西方寻常力的事情了。所以包括城市的摩托车,包括到高速,因为对,包括到城市 的这个OA,其实很多时候最先最最多的这些就是小红,并且这个图其实是冯晓红在十周年里面重点讲的一个这样的一个这个时间点的一个进展。这个时间点的进展可以看到,整个技术进步的速度是远远比大家想象的要快的,整个技术也就是在加速进步的一个过程中。 发言人05:28 大家可以看到,整个功能开发的难度其实在,持续的一个提升的。但是整个开发者需要有这样的一个时间点,或者说这个时间段是在持续的一个压缩。那从开放高速,到开放个别城市的这个OA用了21个月。但从开放个别城市到开放部分城市使用了13个月。然后到开放所有的这样的一个城市使用的这样的一个时间,八个月和4个月这样的一个时间。所以可以看到,其实如果前面再加上这个自动摩托车这样的一个推出。 发言人06:14 那这样的一个时间点的话,大家会发现以前都是以两年作为一个大的一个技术进步的一个时间点。最近大家可以看到是一年多,甚至半年,甚至这一年甚至半年的一个时间点,就能够看到技术有一个质的这样的一个飞跃。所以实际上他看到的这样的一个趋势,确实就是整个技术的升级迭代速度是在快速的一个加速,其实我们也可以看到,整个小鹏的这样的一个自动驾驶的发展的一个历史。从21年推出这样一个高速APP,到22年9月份开始试点这个城市是啊再到深圳,二三年3月份,其实就实现了北上深的北上广深的这样的一个,应该刚开始是上海、广 州、深圳的一个城市NGP,然后到6月份就开通了北京的这样的一个NGP。然后其实从去年6月份开始,下半年大家就可能够看到整个城市NGP的一个的速度是在快速的一个加速。 发言人07:30 因为大家开始真正去推无土的这样的一个版本。从11月份,无头正式的推送开城来到25层,然后到年底整个开城就到了52层。到了今年的一月份,开头就来到开城,就来到243层的这样的一个水平。真正让大家看到了全国的所有的路段的全覆盖。因为之前我们说过开城只是开城,并不是这个城市所有的路段都可以去使用。那基本上到了七月份,最新的这样的一个版本,也就短短六半年左右的一个时间,就实现了全国所有城市,所有道路的无线NGXNGP的这样的一个全量的一个推送。 发言人08:21 那今年趋势就是白晓峰说的,要实现这个门到门。也就是说把所有的这个断点全部都去打通,包括内部道路,包括闸机,包括这个收费站,真正实现这样的一个门到门一个没有断点的这样的一个企业。然后在明年,大概可能是下半年实现跟现在的威猛一样的这样的一个接近L4的这样的一个试驾的一个体验,并且开始向全球研发和推动叉EP。所以整个自驾车功能的体验的大幅度的提升,其实最快的一个发展就是过去的一年半左右的一个时间,就是在快速的一个进步。这个其实跟我们说,跟当初特斯拉从VC这个版本,去年3月份开始这样的一个版本,整个能力提升,这样的一个特征非常的一个类似,基本上也是22年10月份。 发言人09:28 然后只不过特斯拉在之前的这样的一个V十产品的进步也是非常的快。国内整个技术的进步其实类似于可能2022这样的一个水平。你2二三年大概就是2022年左右的这样的一个水平。那今年可能也是类似于22年底到二三年的这样的一个水平,其实都属于技术和新的一个过程。实际上我们在这部,尤其是今年下半年,我们已经能够感受到一些功能体验的大幅的一个提升,也开始出现跟二三年3月份这张V十一出来之后,这样的一个是非常匹配的。整个背后的一个技术快速进步的一个背后,其实是整个模型算法 能力的大提升,核心其实就是三三模型的一个拓展的整个能力的一个边界整饬的整个自动驾驶的能力的上限造成的一个提升。技术这边其实我们之前跟大家讲过,需要更多公司调研纪要关注公众号MT调研可添加微信号S130970。小鹏。 发言人10:48 现在其实就是分段式的,我们是级联式的分段端的大模型,包括这个感知端的xname,xname其实就是这个B叫transformer,叫occurence这一套感知识别的这样的一个大模型。然后第二个,其实就是把规划和预测控制集中到一起的xplanner。Xplan其实就是使得整个支架非常的拟人化的这样的一个规控的一个大模型。第三个其实就是把我们说第三阶段的后面的跟NLP的大语言模型,也类似于这个快慢系统里面的脉系统的这个XFXbrain,形成了这样的一个三部分,形成这样的一个分段式的、分段端的这样的一个大模型,真正的朝着拟人化的方向去做一个迭代。 发言人11:49 Xnet其实它也做了一个区分,包括静态的xnet和动态的xnet。基本上就是对于静态的这个数这个物体和动态的物体做这样的一个感知。而动态的xnet除了做这个感知之外,它还会要进这样的一个预测,以及这样一个博弈。所以实际上越往后,其动态xnet的重要性会越强。因为你的人车的这样的一个博弈的一个能力,其实跟你这个X动态X2的这样一个预测和博弈的能力是密切相关的那有了xnet的一个上升了之后,我们能够看到不仅是识别的泛化的能力上的提升。所以实际上大家从现在很多车企的SR的一个画面上已经能够看得到了。但是现在识别基本上不是什么太大的问题,基本上都能实现这样的一个识别。同时在识别之外,它可以看到就是感知的范围。 发言人13:00 这是大学的提升。这一次是提升了200%的这样的一个感知的一个范围。那为什么会有感知范围的大部分的一个提升呢?其实这就是这个端到端的大模型在这个特征值提取之后,对于这个感知判断的一个能力造成了一个提升。大家可以看到感知的类型,原来的包括儿童、清扫车、减速带、地上的坑这个井盖等等都可以识别了。那这是一个是识别类型的的提升。 发言人13:36 第二个识别能力提升,就是对于你同样的这样的一个像素,你能够识别的这样的一个因为你有特征值提取的一个能力,你更小的一个像素,更模糊的这样的一个轮廓,我也可以进行这样的一个识别。这就是跟我们人眼的特征一样,就是你太远了,我看的只能看一个模糊的一个轮廓。但是,我因为对于整个特征值的一个判断相对会比较长,所以我可以根据一个轮廓也可以实现物体的精准的这样的一个识别。所以,其实感知的范围也会大幅的一个 提升。 发言人14:19 感知范围的一个大幅提升,对这种大型的入口,或者说一些异形的入口,其实就会有比较大的一个帮助。可以看到现在xnet上车了之后,整个汽车感知的面积可以达到1.8个足球场的这个大。这个其实比人的这样的一个视线,可视线所及的一个范围,其实要大的多的多的多了。XX这个规控大模 型planner其实基本上也是端到端大模型了之后,包括其实大家会看到对于很多的这样的一个具备这种老司机化,或者说拟人化的这样的一个流畅更加流畅的一个体验。包括其实会有非常大的一个工作,包括这个xnet上车了之 后。 发言人15:15 这里我可能要补充一下。其实大家会发现这个识别能力提升了之后,尤其是具备这种时序识别的一个能力。因为大家其实经常会遇到一个问,就比如说这个激光雷达和纯视觉的一个解决方案里面,有些大家认为全视觉会有一些识别的这样的一个难点的一个缺点。比如说倒在地上的这样的一个白色的货车,比如说我做了在这个路面上,做一次这样的一个虚拟的山地的这样的一个坑的这样子的一个画这一幅图,去通过各种是这样这样的各种各样的这样的一个画面去骗这样的一个去欺骗这样的一个,视觉感知的这套这套系统。但实际上当你这个神经网络系统增加了持续的一个信息之后,其实很多的这样的一个目标,它其实就能够这很正的都做了做做这样的一个分辨。 发言人16:26 比如说倒在地上的这个货车和天边的这样的一个云朵,那实际上可以改通过你实际上这个物体大小的一个变化。如果说你是天边的云朵,那你可能在你的持续变化中,这个物体的大小是不会有太大的一个变化的。如果你是倒在这个地方的一个货车,它的大小就会随着时效你前进,这个时候你就出现出变化,比如说你在路面上画一个非常具有3D立体图的这样的一个深坑。你看一眼,你可能会觉得在在镜子的画面下,这就是一个深坑,尤其是有一些阴影的话,可能很难这个区别。但是真正你在路上真的行进起来,车在行进的过程中,你会发现真的他讲的他最大的一个变化就是它的实际变化的这个图片的变化其实是完全不一样的。所以有了实际信息了之后,其实很多大家认为可以欺骗视觉的这样的一个信息,其实都