您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[民生证券]:民生:对话掌门人纪要-畅谈Robotaxi与自动驾驶大时代-20240713 - 发现报告
当前位置:首页/会议纪要/报告详情/

民生:对话掌门人纪要-畅谈Robotaxi与自动驾驶大时代-20240713

2024-07-12民生证券程***
民生:对话掌门人纪要-畅谈Robotaxi与自动驾驶大时代-20240713

会议要点1、自动驾驶技术发展与挑战 · 特斯拉FSDV12版本实现了端到端的自动驾驶模型,但实际效果与稳定性仍需进一步验证。 · 自动驾驶的关键在于数据量、数据处理能力和算法模型的迭代,特斯拉在这方面有显著优势。 · 自动驾驶的端到端模型可能带来更高的通用性和方法能力,但同时也增加了黑盒性,导致问题难以回溯和解释。 2、自动驾驶的商业模式与估值 ·Robotaxi的商业模式估值应考虑其作为移动设备折现现金流的资产,而不仅仅是节省司机成本。 ·Robotaxi的产业落地节奏将受到法规和监管的影响,但技术进步和政策支持正在推动其快速发展。 3、自动驾驶产业链变革与价值分配 · 自动驾驶技术的发展将重塑汽车产业链,整车厂可能从纯硬件制造商转变为包括软件收入的服务提供商。 · 在服务体系中,平台公司如滴滴将通过提供运力服务来获取价值,而车企则可能通过销售车辆和订阅自动驾驶服务来获取价值。 4、滴滴自动驾驶的战略布局与优势 · 滴滴在自动驾驶领域的布局聚焦于无人化、量产化和商业化三个关键方面,利用其在网约车平台的大数据优势,以及与广汽等车企的合作,推动自动驾驶技术的发展和应用。 · 滴滴与广汽的合资公司将专注于定制适合Robotaxi的车型,这可能成为行业内的里程碑事件,有助于降低成本、提升性能和可靠性。 5、政策环境与自动驾驶的未来发展 · 中国的政策环境对自动驾驶技术的发展持开放态度,地方政府和国家层面的政策都在积极推动自动驾驶的测试和商业化应用。 · 滴滴预计,随着技术成熟和政策支持,自动驾驶车辆的部署将从区域性试点逐步扩展到全国范围。 会议实录Robotaxi与技术突破 各位投资者,大家周末上午好。非常感谢大家在周末抽出时间参加我们关于Robotaxi和自动驾驶时代的电话会议。最近自动驾驶领域发展迅猛,特斯拉的马斯克宣布将于8月8日推出Robotaxi无人驾驶出租车服务。此外,特斯拉的FSDV12版本数据更新迅速。在中国,滴滴自动驾驶是国内自动驾驶领域的先行者之一,一直在L4级别自动驾驶技术上进行布局。最近,滴滴自动驾驶与广汽集团旗下的电动车品牌埃安宣布成立合资公司,双方将基于广汽埃安的纯电动平台和车辆电气架构,结合滴滴自动驾驶面向出行服务的L4级别自动驾驶技术,共同打造L4级别无人驾驶量产车。 今天,我们非常荣幸地邀请到了滴滴自动驾驶的首席运营官,同时也是滴滴自动驾驶与广汽埃安合资公司安迪科技的总经理孟醒孟总,与我们共同探讨Robotaxi和自动驾驶的未来发展。今天的讨论将由两位首席共同主持,我将从计算机技术的角度出发,聚焦技术层面的重大转折点。稍后,我们的汽车首席分析师崔老师将从商业模式的角度,与孟总一起深入讨论自动驾驶的最新进展。 首先,我想从技术角度提出大家普遍关注的问题。特斯拉的FSDV12版本,尤其是最近发布的版本,已经实现了相当于老司机级别的L4甚至L5级别自动驾驶 。在海外媒体如YouTube上,我们可以看到其零接管的成功率可能超过90%。孟总,您如何看待这一技术突破?它背后的基础是什么? 孟总:首先,感谢有机会与大家分享我们的观点。特斯拉以及其他车厂所做的辅助驾驶系统,我们统称为辅助驾驶。其潜在假设是车上始终有人,是在人机共驾的前提下优化体验的自动驾驶模式。滴滴自动驾驶以及我们的海外同行,我们的目标是在无人驾驶领域,假设车上没有司机。这实际上是两个不同的方向。具体到特斯拉的FSDV12版本,它从早期的版本到现在的12.3版本,包括对12.4和10.5版本的预测,对行业产生了很大影响。 影响主要体现在特斯拉重写了整个架构,从原有的多个模型和一些兜底规则的模式,转变为马斯克所说的端到端模型。这个模型中,人类经验的预判非常少 ,基本上是从感知信号输入到控制信号输出,过程中是一个黑盒,所有训练都基于积累的数据。但是否真正实现了完全的端到端模型,目前还无法证实。我们与特斯拉的同事沟通,或从市场上获取的信息,都不能作为确凿证据。如果我们假设特斯拉确实做到了这一点,那么对行业来说,这将是一个重大变化。因为在过去,无论是效果上的提升,还是自动驾驶能力的可解释性,都不太支持端到端模型的出现。 FSDV12的最大影响在于它采用了端到端模型,理论上具有更高的天花板。长期而言,其能否提升取决于能否在模型上进行大量数据训练,从而解决以前无法解决的复杂问题。这是我们行业内部讨论FSDV12价值时的共识。 至于V12版本发布后的实际效果,我认为12.1版本,即伊隆·马斯克自己发布的 视频,与V11相比,可能是持平或略有下降。这是一个有趣的现象,V12的第一个版本发布时,大家都感到震惊,但同时也不知道如何评价,包括行业内的许多人都感到困惑,不知道这是好事还是坏事。 从架构上看,两个版本都具有相当的规模,重写架构是一项艰巨的任务,而且大家不预期它会立即表现出色,即能达到与上一个版本相似的水平,这已经很了不起了。所以从这个角度来看,V12的架构改进是积极的,天花板很高。但同时,作为一个辅助驾驶能力,如果驾驶45到48分钟后出现一次闯红灯的情况 ,可能还不如上一个版本,这在某种程度上是退步的。 当然,从12.0到12.3,现在已经有了很多进步。最近发布的视频显示,V12版本能够完成许多新任务。但我认为我们首先关注的应该是架构上的天花板提升 ,而不是它目前能达到的水平。你提到的零接管成功率90%,在无人驾驶的语境下,这是完全不及格的,这是远远不能接受的,因为如果假设车上没有人,那么成功率应该是数量级上的差别。 但是,作为一个辅助驾驶能力的提升,我们可以清晰地感知到它的进步。许多以前无法做到的事情,现在可以完成,甚至有时它不完全按照导航地图进行规划,而是根据现场感知做出判断和规划。有时,它可能不会严格按照红绿灯规则行驶,而是根据旁边的车流量来决定是否闯红灯。 这些变化表明,V12版本在算法能力上有所提升,能够完成以前无法完成的任务,但这种提升并没有体现在稳定性和可靠性上。也就是说,虽然现在能够做到,但成功的概率是多少?我们进行十次操作能成功九次,还是一百次操作能成功九十九次?目前看来,这种提升更多体现在方法能力上,而不是可靠性上 。 在当前阶段,尤其是在无人驾驶领域,可靠性变得越来越重要。这是我们衡量自动驾驶的核心标准。 自动驾驶数据驱动竞争格局 近日,我亲自体验了Robotaxi服务,在过去两周内共进行了12.3次试乘。据我观察,该服务在平均10到20英里之间需要一次人工接管,这一频率在行业内属于平均水平。在城市道路和郊区中心,以及高速公路上的表现有所不同,高速公路上的接管频率可能超过100英里,而市中心和郊区中心的接管频率可能在10到23英里之间。尽管这一表现并不突出,但Robotaxi相较于以往版本已经取得了显著进步。 为了获得更准确的评估,可能需要进行更大规模的测试,例如内部测试,至少需要行驶上万公里。目前,我们所获得的数据只能反映出Robotaxi的最低性能水平,而无法确定其最高性能。因此,进行严谨的测试需要投入更多的成本和时间。 此外,特斯拉的FSD(全自动驾驶)系统在经历了V12和V12.3版本的迭代后,马斯克于8月8日宣布推出Robotaxi服务。这标志着自动驾驶技术开始进入数据驱动的快速发展阶段。随着FSD系统的不断完善,Robotaxi的用户数量将增加 ,从而为系统提供更多的数据,进一步优化FSD的性能。这种数据驱动的竞争模式可能会成为未来自动驾驶领域的主要竞争方式,对于拥有大量出行需求和 车队数据的公司,如滴滴,将是一个有利因素。 目前,自动驾驶技术的发展越来越依赖于机器学习。从感知、决策到控制和预测,机器学习技术已经在不同程度上被应用于自动驾驶的各个环节。特斯拉在这方面做得尤为突出,实现了全流程的机器学习应用。 特斯拉在数据采集和处理方面具有优势。首先,特斯拉拥有大量的车辆和先进的采集设备,能够收集到大量的行驶数据。其次,特斯拉已经建立了成熟的数据管道,能够处理大规模的车辆数据。然而,要实现数据的闭环利用,还需要进行数据的清洗、筛选和标注,以及仿真系统的自动迭代和场景库的建设。这些都需要强大的基础设施和高昂的成本。 最后,特斯拉还需要一套合适的架构,以确保训练数据能够被有效应用并进行迭代。目前,特斯拉在这方面已经取得了一定的进展,但仍然处于初级阶段。随着基础训练平台的GPU数量预计将增长两到三倍,特斯拉在自动驾驶领域的领先地位将进一步巩固。 自动驾驶的算力与挑战 对,所以架构我认为需要整合三方面:数据收集、基础架构的区域训练能力,以及算法模型对数据迭代的支持。这三者缺一不可,才能确保整个系统的顺畅运行。特斯拉在这方面建立了非常强大的架构,但即便如此,它的架构也在不断地发展和探索中。对于滴滴而言,情况也是类似。我们的优势在于滴滴本身拥有庞大的数据规模和技术设施,我们一直在进行数据训练,以支持滴滴的网约车系统。我们拥有自己的基础平台建设,但如果没有足够的算力支持,这些都是空谈。 对于一家初创公司或小型企业来说,从头开始建立一个基础平台的训练体系是非常困难的。这需要大量的GPU算力、云计算设施以及弹性云等一系列能力,而这些通常都是现成的。当然,一旦这个体系运行起来,它的价值是巨大的。但反过来说,还需要考虑的一个问题是,最终是否所有车辆都会使用端到端的模型。我认为这还是一个未知数,因为虽然端到端模型的通用性和功能性更强 ,但它也带来了更大的问题,如前期的巨额投入、训练成本,以及更大的黑盒性。一旦出现问题,其行为很难被追溯和解释,这在线上文本或图片生成中可能不是问题,但在线下物理行为中,如服务器群、汽车等,任何失误都需要严格的溯源和纠正。 此外,还有车辆规范和一系列制度需要考虑。因此,这两个行业可能非常不同 ,对于端到端模型的接受程度也会有所不同。当然,有很多方法可以作为最后的保障或替代方案,但我认为在行业演进中,可能不会完全围绕数据飞轮逻辑来评价一个企业的表现。 特斯拉是基础算力投入的一个例子,其算力已经提升了2到3倍,使用了数千张H100显卡。随着FSD和12.3等技术的使用越来越广泛,未来端到端的数据驱动 ,包括训练、回撤等,以及盈利模式,算力的投入可能会非常巨大,甚至达到互联网巨头的量级。对于云端和边缘侧的算力投入,您如何看待? 如果我们采用不同的路线,那么在云端的投入选择可能不会完全与特斯拉相同 。我们的投入规模可能很大,但影响系数可能与特斯拉不一致。如果我们假设 使用端到端模型,并使用超大规模的预训练数据来训练模型体系,同时建立庞大的云计算平台,那么对应的投入将会非常巨大。例如,特斯拉可能已经投入了3万张H100显卡,年底可能会增加到8.5万张,并可能建立与H100算力相当的多GPU云计算训练平台。这些加起来将是一个非常大的规模。 当然,这些投入不仅限于FSD,还可能包括其他工作和能力,甚至可能包括与SAI的信任、人机交互等,都可能共享同样的平台来实现。但可以肯定的是,这将是一笔巨大的投入。如果我们类比一下,最近开源的最强大模型,如LambdaSchool的M3模型,大约需要2,400张H100显卡的集群来支持百亿甚至千亿级别的参数模型。这已经非常惊人了。 一般来说,我们认为具身智能或自动驾驶的模型参数应该会比大型语言模型或多模态模型少一些,因为它不需要那么多冗余信息。但是,如果将其扩展到如此大的规模,那么所需的算力将会非常巨大。 在云端,训练侧的算力需求可能还好,但在边缘侧,我认为特斯拉本来就不是在边缘计算上投入最多的。当然,这得益于特斯拉强大的一体化研发能力,使得模型和硬件能够高效协同,使得端上的算力能够支持FSD。实际上,端上的算力并不算特别大,下一代的成本可能会有所增加,但肯定不会是行业里最高的。即便如此,端上的算力成本正在迅速下降,因此不会成为一个特别大的问题。将这种模型部署在车上,带宽和内存可能是更大的问题,而算力反而可能是相对较小的问题。 然而,我认为一个