您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国一汽]:人工智能在自动驾驶决策中的应用与思考 - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能在自动驾驶决策中的应用与思考

信息技术2023-06-10刘斌中国一汽G***
人工智能在自动驾驶决策中的应用与思考

HDNGQI 红旗新能源 人工智能在自动驾驶决策中的应用与思考 中国一汽研发总院 刘斌(首席) 2023年06月10日 背景分析 ■1.1人工智能在自动驾驶中的应用 HDNGCI 红旗新能源 人工智能的出现,使得图像的输入与输出之间通过深度学习等方法进行特征描述,因此不再需要完全依赖人类专家设计特征,特征本身也可以跟学习器一起进行联合优化 传统感知与AI感知AI感知优势关键因素 人工特征设计分类器学习 Vehicle Vehicle 优势1: 逐层加工处理 优势2: 自动学习特征分类器学习内置特征变换 优势3: 模型高度复杂 深度学习的特殊优势,即将构化的图像数据进行统计和分析,依靠图像语义分割,将大量的数据抽象和形式化,通过计算机可理解的简单概念构建复杂概念,使得其在自动驾驶感知领域取得了广泛的应用 、背景分析 ■1.2自动驾驶中的规划决策 HDNGCI 红旗新能源 随着人工智能的发展,模型的泛化能力不断增强,特征提取不仅能够应用于感知,同样能够将类似方法应用于决策技术在复杂场景下,人工智能算法自动提取更多的特征,尽可能多的自动学习人类司机的经验,提升算法“拟人化”程度 简单交互场景下的规则型决策方法复杂场景下的AI型决策方法 送航 驾驶员超护 自动驾驶决策任务同样具有自己的特征,人工智能方法的引入对自动驾驶决策任务的提升具有潜在优势 背景分析 HDNGCI 红旗新能源 ■1.3感知型AI与决策型AI的差异 感知型AI决策型AI 环境的“静态”表示感知,存在相对真值环境的“动态”表示交互,但动作不唯一性,是相对值 由于决策的结果与环境之间存在动态交互,且不同决策下的行为表现的差异性较大,给决策型AI的工程化落地带来了困难,探索AI驱动规划决策技术是人工智能技术在自动驾驶领域的下一个重点内容 二、相关探索 AI决策技术的应用方向 AI加“智"AI加“速" HDNGCI 红旗新能源 基于模块化的方法自动化标注挖据AI数据合成 基于端到端的方法云端大模型训练 TaCTadLarsing AI模型可通过子模块或一体化的形式部署在车端决策代码中,实现“新手司机”向“老司机”的转变 AI可以在自动驾驶数据挖掘、场景生成、仿真测试等方面实现加速,极大提升自动驾驶验证效率和效果 二、相关探索 ■2.1AI决策技术的加“智”方式 基于模块化的方法基于端到端的方法 HDNGCI 红旗新能源 自车位姿感知结果导航信息自车位姿感知结果导航信息自车位姿导航信息 决策规划决策深度深度学习 控制学习模型模型 被控车辆被控车辆被控车辆 易于实现安全性条件的检测运用模型强大的学习能力及对于数据的拟合能力可以与已有规则方法相结合,进行局部提升×输出的稳定性和安全性无法保证 X 易于根据需求进行模型微调X难以在现有方法基础上进行提升模块化限制了中间输出的模态 二、相关探索 HONDCI 红旗新能源 ■2.2基于模块化的AI决策 通过AI算法提高决策效率和决策性能 应急反应场景轨迹粗解生成 √基于强化学习,越过繁琐的决策流程,加速自动驾驶系统在紧√基于机器学习,短时间内从5000余条粗解轨迹中选取出最优急场景下的反应轨迹 Wust%efcassb0g 基于AI实现安全性条件的检测,增强紧急场景的反应能通过局部应用AI模型,实现轨迹粗选,提升算法运算实 力时性,效率提升了85%以上 相关探索 HDNGCI 红旗新能源 ■2.2基于模块化的AI决策 扩展搜索空间至时间与空间一体,决策灵活度提升,但高维度空间导致搜索耗时增加 以模仿学习为代表的决策AI方法通过将驾驶问题建模来学习从环境表示中给出最优的决策行为 联合行为决策流程 模仿学习优化决策范围联合行为决策优化 ·考虑动态与静态·基于模仿学习搭 障碍物,通过规 ·将最优行为决策 则方法在横纵 建AI决策模型, 利用神经网络实 转换为约空间 体式坐标系下直现决策行为的快构建最优化问题, 接搜索出最优行速搜素,搜索耗求解出最优动作 为决策,耗费算 力 时降低42%,类序列 人程度显著提升 ■基于模块化部署决策A的优势,实现部分模块的微调,实现决策规划模块的性能提升 相关探索 HDNGCI 红旗新能源 ■2.3基于端到端的AI决策 以感知地图信息、障碍物历史轨迹信息、车辆运动信息作为输入,以人类驾驶数据为真值标签便用一套数据驱动的轻量生成网络帮助快速生成规划路径 Tesla交互式搜素算法Comma.ai InteractionSearch Carpemlat Iraining+Infrastructure ne(Online) 运用了模型强大的学习能力及对于数据的拟合能力,利用丰富的上游信息更好的适应道路条件、交通情况和驾驶场景 二、相关探索 ■2.4A加速”方式 使用A技术,可以在数据获取、标注、挖掘、训练等方面,有效提高模型选代效率,缩短开发周期 技术应用数据驱动的自动驾驶开发流程 HDNGCI 红旗新能源 自动化标注挖掘:车端平台云端平台 A/模型自动挖掘有效数据, 加速模型持续选代 车端采集数据自动化标注挖掘人工标注质检和精修 AI合成数据:云端模型选代 仿真环境+A/合成足以乱真的数据,低成本、高效率的获取海量数据 云端大模型训练 通过A/搜素,自动调整模型 超参数和模型结构,减少繁车端模型 项重复工作 AI合成数据云端大模型 车端模型送代 二、相关探索 ■2.5A加速:自动化标注挖掘 依托影子模式+云端大算力模型,自动完成数据标注、清洗、挖掘,加速数据向模型能力转化 HDNGOI 红旗新能源 技术应用应用案例 自动化标注挖掘:影子模式云端大模型 √云端自动标注数据,降低成本 √自动挖掘有效数据,提高效率 当前使用大模型自动标注自动化率可达80%~90%,大量减轻人工标注负担,且标注结果相较人工具有更好的一致性 二、相关探索 HDNGCI 红旗新能源 ■2.6AI加速:AI合成数据 通过仿真环境+AI合成染,源源不断的生成训练数据,有力推动模型送代升级 可将场景隐式存储于神经网络,重建自动驾驶场景,模拟罕见、极端场景,支撑模型闭环验证 技术应用应用案例 数据获取: V短时间低成本获取海量数据tarn √定向获取指定类型有效数据 参数空间分析 对于自动驾驶规控而言,80%以上的数据是无效数据使用仿真环境+AI合成可以定向获取有效数据,显著加速模型送代 二、相关探索 ■2.7A加速:云端大模型训练 自动驾驶规控需要面向驾驶风格需求进行设计,对应不同驾驶风格需要构建多种AI模型 自适应调整模型超参数与模型结构,避免重复繁琐的调参和模型结构设计工作 技术应用应用案例 HDNGI 红旗新能源 云端大模型训练:自适应超参数调整自动网络结构搜索 √自动调整模型超参数 √自动调整模型结构anicngligore TheVision NeNorDatasdDandirites Nt ..I... M,Alpidn MAIpitha barifetre 使用AI技术学习如何进行AI模型本身的训练,已经成为了未来的发展趋势 目录 HDNGI 背景分析相关探素几点思考 红旗新能源 三、几点思考 ■3.1AI在自动驾驶决策应用中的安全风险 红旗新能源 HDNGI 新一轮的人工智能浪潮受到了工业界以及全社会的广泛关注,随着一批人工智能的落地应用逐渐开始变成现实,安全问题也渐渐显现出来 cruise POLICEPULLOVERDRIVERLESSCAR SANFRANCISCO NBCd 2018年3月19日,一辆Uber自动驾驶汽车在美国亚利桑那州2022年4月1日,一辆无人驾驶出租车,!由于晚上没开大灯而被坦佩发生交通事故造成一名行人死亡,这是首起自动驾驶汽车警察拦截,在警察走近后,这辆无人车居然突然加速“逃跑” 致行人死亡的交通事故直到远程介入后才停下来 三、几点思考 红旗新能源 HDNOCI ■3.1AI在自动驾驶决策应用中的安全风险 人工智能算法对学习样本数据集的正确性存在严重依赖,错误的数据集将导致人工智能算法的错误输出,人工智能算法本身存在安全盲点,难以对数据集的安全性进行分析 表现:错误的数据集导致错误输出局限性:安全盲点 -·Q: Eliza Eliza nsfor routocor cuttit withe arm 比利时男子在与Chai应用程序上的一个Al聊天机器人交谈中,聊天机器 人鼓励其通过自杀解除痛苦,该男子最后自杀身亡。 -解决办法:需要推进建设人工智能数据集安全管理的相关标准、法规,并构建标准AI模型,对数据集安全性进行监督保障 三、几点思考 ■3.1AI在自动驾驶决策应用中的安全风险 红旗新能源 HDNGI 人工智能算法提取特征的过程是随机化的、不可控的,在不恰当的数据集上算法可能会选择错误的特征,以致使用者不能清晰理解算法的决策机理,难以解释、预测算法的行为和结果 表现:算法输出不可解释局限性:黑盒特性 INPUTBLACKOUTPUT 输入BOX输出 黑盒 自动驾驶车辆经过一座无人墓地时,车主发现中控屏幕上显示出了可怕的未知“行人”。 解决办法:需要构建基于AI与规则混合驱动的强化智能模型及安全大脑,实现可解释的安全兜底。 三、几点思考 红旗新能源 HDNGCI ■3.1AI在自动驾驶决策应用中的安全风险 系统越复杂,就越有可能包含安全隐患,人工智能算法容易受到输入数据扰动的干扰,出现非鲁棒特征,从而导致模型给出错误的结论 表现:系统输入增加扰动后输出错误局限性:不稳定性 无扰动 +.007× “panda""nematode""gibbon" 57.7%confidence 8.2%confidence99.3%confidence有扰动 对一幅“能猫”图像增加少量扰动后输入到AI算法中,AI算法将图像错 解决办法:需要构建车路云协同监管系统,在大系统、大环境中对AI智能驾驶车辆进行全面监管。 三、几点思考 HDNGCI ■3.2AI在自动驾驶决策应用中的231安全对策 红旗新能源 Step1模型安全 Step6Step3 AI标准/法规 规则决策规划 感知Step2数据安全 AI决策规划校验控制 安全大脑 数据 Step4 Step5 车路云 三、几点思考 HDNGCI ■3.3模型安全策略 红旗新能源 Step1收集示教数据,训练监督策略Step2收集对比数据,训练奖励模型Step3利用强化学习针对奖励模型优化策略 从调优数据集中 采集调优数据从数据集中采 及多个模型输集新的调优数 采样出据 贴签展示出期望 的决策行为对输出结果从10 好至坏进行打 策略生成单个输出 学习方法对决策 利用数据训练 出计算出奖励 行为模型进行微 奖助模型 值 利用奖动值更新策略 数据被用于监督奖助模型为输 三、点思考 红旗新能源 IDNCI ■3.4数据安全策略 需要对数据的使用权、所有权、运营权进行确权,使用数据时仍需对于敏感数据进行隐私保护,实现在充分挖掘数据使用价值的同时保障数据安全 对于规划决策这种相对表达需求,需借助仿真手段构建精准评估模型,快速评估端到端决策效果,进而生成泛化海量高价值场 景数据 数据自动化标注训练评测部署 数据 1②泛化 筛选! 人工设计优质数据 标注训练评估模型仿真部署 仿真系统 三、几点思考 HDNOCI 个 ■3.5人工智能型与传统规则型任务混合建模 感知融合决策规划算法安全仲裁车辆控制 红旗新能源 Goal A快格 安全仲裁模块通过规则约束交规、安全等预设 大数据挖摄提取(影子模式)限制,进而保证AI决策 结果的安全可行 通过混合传统包含安全规则的决策算法,可以确保AI规划决策算法在行驶过程中底线安全性,从而得到一个安全等级更高 的决策框架 三、几点思考 ■3.6安全大脑理念 HDNGCI 红旗新能源 SENSE构建最优排序训练 奖励模型奖励模型 数据标注:标注元根据预定义的标准对结果进行评估与排序 PLAN构建训练模型:根据标注员的排序,学习模型的排序规则 最优排序:对模型输出的结果,利用构建的排序模型对其进行排序 奖励反馈:将排序后