智能车研究框架:智驾底层技术:Transformer和Diffusion,新 一轮AI革命的基石20240906_导读 2024年09月06日22:27 关键词 transformerdifusionAI自动驾驶算法开源证券专业投资机构技术变革芯片英伟达电子电气架构特斯拉FSD软硬件分离主动安全软件付费投资建议robotaxi用户培育萝卜快跑 全文摘要 本次会议重点关注了智能汽车研究中的算法和技术革新,特别是transformer和difusion模型对自动驾驶技术发展的促进作用。首先强调了算法底层技术对于价格、性能影响的重要性,随后深入解析了这些技术的原理及其在自动驾驶领域的应用潜能。此外,回顾了自动驾驶技术的发展历程,并探讨了AI技术变革对于汽车行业及其他AI应用可能产生的影响。 智能车研究框架:智驾底层技术:Transformer和Diffusion,新 一轮AI革命的基石20240906_导读 2024年09月06日22:27 关键词 transformerdifusionAI自动驾驶算法开源证券专业投资机构技术变革芯片英伟达电子电气架构特斯拉FSD软硬件分离主动安全软件付费投资建议robotaxi用户培育萝卜快跑 全文摘要 本次会议重点关注了智能汽车研究中的算法和技术革新,特别是transformer和difusion模型对自动驾驶技术发展的促进作用。首先强调了算法底层技术对于价格、性能影响的重要性,随后深入解析了这些技术的原理及其在自动驾驶领域的应用潜能。此外,回顾了自动驾驶技术的发展历程,并探讨了AI技术变革对于汽车行业及其他AI应用可能产生的影响。智能汽车行业的兴起由特斯拉引领,通过Model3和ModelY等车型的发布,显著推动了汽车工业的技术革新和软件生态系统的繁荣。当前,行业焦点在于提升自动驾驶算法性能和实现在量产车上的应用。人工智能领域经历了从符号主义到连接主义,再到行为主义的发展,深度学习和神经网络的崛起极大地推进了图像识 别、自然语言处理等领域的发展。特别是Transformer模型的应用,为自然语言处理和计算机视觉带来了突破,同 时deflation和difusion模型也优化了图像生成的质量和效率。这些技术创新预示着人工智能将在自动驾驶等特定领域产生根本性变革,展现出巨大的行业发展潜力。 章节速览 ●00:00智能车研究框架体系:算法与技术变革 本次会议重点讨论了智能车研究中的算法和技术变革,特别是transformer和difusion模型如何推动自动驾驶技术的发 展。首先介绍了算法底局技术的重要性及其对售价和性能的影响,然后探讨了这些技术背后的原理和在自动驾驶领域的应用潜力。此外,还回顾了自动驾驶技术的发展历程,并分析了AI技术变革对汽车行业和其他AI应用的潜在影响。 ●05:14智能汽车革命:从特斯拉引领到行业转型 智能汽车行业的兴起最初是由特斯拉推动的,特别是通过Model3和ModelY等车型的发布,显著地将汽车行业推 向了科技行业。特斯拉的成功不仅体现在其电动汽车的设计和性能上,更重要的是在推动汽车电子电气架构和车内计算能力的重大创新上。这使得车辆能够承载更强大的芯片,并支持各种软件功能的迭代更新,从而形成了繁荣的软件生态系统。与PC和智能手机的发展历程相似,这一过程促进了软硬件的分离,使软件开发者能更加专注于优化用户体验,而不必过分担心硬件限制。此外,随着电子电气架构的集中化成为行业趋势,许多汽车制造商开始采用高性能芯片,如英伟达的解决方案,以支持高级驾驶辅助功能。特斯拉及其追随者的目标是实现完全自动驾驶,从而提高汽车的安全性、便利性和盈利能力。通过软件订阅等方式,汽车制造商能够提供不断升级的服务,增强产品的竞争力,并探索新的收入来源。最终,随着技术的进步和市场的接受度提高,自动驾驶预计将深刻改变人们的出行方式,并为汽车行业带来根本性的变革。 ●15:05自驾技术进步与产业变革 随着自驾技术的发展,特别是软硬件的协同进步,汽车行业正经历重大变革。硬件方面的快速渗透已经为软件端的迭代提供了坚实的基础。目前,行业的焦点主要集中在两方面:一方面是如何使自驾车的算法更加优秀,以满足消费者的期待并实现通过软件盈利的愿景;另一方面则是自动驾驶在量产车上的实际应用情况,如特斯拉的FSEV12.3带来的市场关注度提升和驾驶性能改善。此外,像萝卜快跑这样的自动驾驶项目也在实际运营中展示了其潜力,特别是在武汉的测试表明了自动驾驶技术的可行性和用户接受度。这些进展的背后,技术起着决定性的作用,不仅关乎业务的可行性,还直接影响盈利模式和盈利能力。 ●20:37三大AI学派及其影响 人工智能领域主要分为符号主义、连接主义和行为主义三大学派。符号主义侧重使用规则和符号表示知识,早期代表有专家系统。连接主义模仿人脑神经网络结构,涵盖机器学习和深度学习等技术。行为主义关注行为和环境间的相互作用,应用广泛于机器人及自动化控制等领域。三大流派共同推动了人工智能的快速发展和广泛应用。 ●24:09人工智能的发展历程及其里程碑 人工智能起源于20世纪50年代,随着图灵测试的提出与达特茅斯会议的召开,AI的概念正式诞生。早期的专家系统、符号主义以及逻辑理论家等标志着AI技术的初步发展。进入80年代,专家系统因知识表示限制及个人电脑的发展而逐渐衰退。与此同时,连接主义与神经网络的研究逐渐兴起,特别是深度学习的出现,推动了图像识别、自然语言处理等领域的发展。标志性事件如DeepBlue击败国际象棋大师和AlphaGo战胜围棋世界冠军进一步证明了AI的进步。 ●30:49AI发展里程碑:从Transformer到多模态处理 自2012年以来,人工智能领域经历了飞速的发展,尤其在深度学习和神经网络方面。2017年,谷歌提出的Transformer模型标志着自然语言处理的一个重大进展,不仅提升了翻译的质量,还推动了整个行业的快速发展。随后,该模型的应用扩展到了计算机视觉领域,如通过将图像分割成块并使用Transformer进行特征关系分析,实现了图像识别和分类等任务。此外,研究人员还探索了如何将文本与图像信息结合起来,利用Transformer进行多模态处理,显著提高了人工智能系统对复杂数据的理解和处理能力。这一系列创新标志着人工智能技术正朝着更加智能化、多元化的方向发展。 ●37:49Deflation算法及其在视频生成中的应用 Deflation算法最初用于视频的视觉生成,通过逐渐添加和移除噪声的方式来实现高质量图像的生成。该算法相较于其他方法如GANs有着更好的稳定性和图片质量,但计算资源需求较高。随着时间推移和计算机技术的发 展,Deflation的优势愈发明显,逐渐成为视觉生成领域的主流方法之一。其基本原理涉及构建一个噪声预测器,通 过训练使其能预测并逐步去除或添加噪声,从而生成或恢复图像。这一过程类似雕刻,初始时对完整图像进行处理使其变为模糊状态,然后再通过反向操作将图像细节逐步还原。 ●41:15模型迭代与优化:从底层式到潜在扩散模型 最初,底层式模型因效果好但计算需求大难以在个人设备上运行。随后提出了潜在扩散模型,通过压缩图像并提取特征降低计算需求,使得算法能在个人电脑上高效运行。该模型将图像编码为机器可识别的特征,经过添加或减少噪声的过程后重新解码为人类可理解的图像。为进一步提高性能,使用了对抗性 训练模型替换之前的CNN,形成了DeformingTransformer模型,特别适合视频生成任务。这一系列迭代使得生成模型在性能上有了显著提升,并被广泛应用于图像生成领域。 ●44:41人工智能行业迎来新的浪潮 讨论集中在人工智能(AI)行业的最新进展,特别是Transformer和决策模型的快速发展如何推动了AI领域的新浪潮。特别提到了两款代表性产品:ChatGPT和一种视频生成或视觉生成工具,它们各自在市场引起了高度关注。ChatGPT自2022年11月发布以来,因其引发的广泛关注和讨论,被认为是AI再次进入能够深刻改变人类世界的阶段的重要标志。另一方面,一款被戏称为“世界模拟器”的算法能够生成连贯的长达一分钟的视频,这些视频在时间和空间一致性方面表现突出,从而激发了人们对其能否成为预测未来事件的世界模型的兴趣。此外,还介绍了一种改进算法的方法,通过创新的编码和解码技术,以及特殊的数据处理方式,提高了视频生成的质量和效率。最后,讨论暗示了这些AI进步将如何影响自动驾驶行业等特定领域,表明了人工智能正带来基础性变革,并预示着更多行业的发展潜力。 ●50:08自动驾驶的发展历程与未来趋势 自动驾驶行业起源于20世纪50-60年代的基础遥控功能,真正发展始于90年代,受美国国防部先进计划局推动。早期的技术试验和竞赛标志着自动驾驶技术的逐步成熟,如沙漠拉力赛展现了车辆的基本自动化能力。21世纪初,谷歌、特斯拉等公司加入,推动了自动驾驶技术的快速发展,尤其是深度学习和transformer技术的应用大大提高了自动驾驶的性能。目前,自动驾驶正逐步向量产和商业化迈进,虽然面临技术、法律和伦理挑战,但前景广阔。 ●58:05大模型与自动驾驶技术的融合与发展 大模型的发展对自动驾驶行业具有深远影响:一方面可直接优化车载算法,另一方面通过生成仿真数据助力算法训练,引发行业潮流变迁。此外,不同企业如特斯拉、微博等采用端到端算法探索,致力于道路场景模拟与预测,预示着自动驾驶与人工智能的深度融合及其在未来交通领域的广泛应用。 要点回顾 本次会议的主要议题是什么? 本次会议主要讨论的是开源证券中小盘和汽车团队对于智能车研究框架体系中从供给端视角出发,聚焦于近年来自动驾驶领域从硬件转向软件的关键技术变化,特别是transformer和difusion这两种算法对自动驾驶能力和性能提升的影响。 为什么研究者重视技术领域的变化,并将重点放在transformer和diffusion算法上?研究者看重技术领域变化的原因在于,该领域的变革对整个行业变革起着核心作 用。transformer和difusion算法作为人工智能的基础底层算法,在当前的大模型及生成式模型等领域有着显著的影 响,它们直接影响着自动驾驶和其他AI应用场景的技术进步与发展。 智能汽车行业的历史演变如何? 智能汽车行业最初由特斯拉引领,通过电子电气架构的集中化改革实现了汽车制造业向科技行业的转型,提升了车载芯片的应用范围和灵活性,为支持大规模操作系统并衍生出丰富的软件生态系统创造了条件。自1920年代起,电子电气架构变革的趋势逐渐明朗,众多企业纷纷跟进采用类似PC和手机领域的软硬件分离策略,推动了诸如自动驾驶算法和OTA更新等功能的发展。 英伟达芯片在汽车行业的广泛应用背景与挑战是什么? 自2021年至2022年,随着电子电气架构集中化的趋势加强,越来越多车企开始大规模应用英伟达等高效率芯片来支撑自动驾驶功能的迭代升级。然而,将高级自驾功能普及至消费级电子产品的过程中面临许多技术难题,例如确保预控芯片与其他车辆部件(如制动、转向)的稳定高效连接。尽管在硬件普及后,业界进一步追求自动驾驶功能带来的产品力提升以及吸引更多消费者购买优势,但整个历程展示了技术在推动行业发展中的重要地位。 消费者如何基于自驾功能评判车企产品力? 消费者主要依据两个维度来评估车企自驾功能带来的增效:一是主动安全性增强,比如一些具有强大自驾能力的厂商(如华为、理想、小米等)在其宣传中重点展示车辆在高速状态下的紧急制动性能显著提升,远超传统车型;二是自驾功能对消费者购车决策产生了较大影响。 自驾功能如何作为车企额外收益来源并改变盈利模式? 自驾功能有望以软件付费的形式为车企创造额外收益,例如特斯拉FSD采用订阅模式(购买或按月租赁),从而实现车企依靠用户订阅软件而非仅靠销售汽车来实现盈利的愿景。 自驾技术进步将如何重塑车企生产工具角色及业务规模? 随着算法能力提高,汽车将成为生产力工具,车企若能运营相关业务,将带来海量收