2023年08月20日 传媒 人形机器人的AI算法,如何借力于自动驾驶FSD————AI专题报告之十二 首选股票 目标价(元)评级 行业专题 证券研究报告投资评级领先大市-A维持评级 在我们的研究框架中,AGI、混合虚拟现实、元宇宙均描述的是未来成型的生态。AGI/虚拟现实的真正实现,首先依托于智能科技视角下的两条技术路径——混合平台、重构时空,人形机器人即混合平台的一种工程方案。智能科技视角下,chatGPT是生产力范畴、MR眼镜与人形机器人是不同的计算平台/新空间,我们预计其中MR眼镜将于2024年进入C端,人形机器人预计将于2026年进入家庭C端。 国内外市场对人形机器人产业进程的分歧巨大(落脚于能否2026年进家庭C端),源于硬件的诸多关键部位均需0-1的定制化研发,软件(主要是AI算法)部分则较车端自动驾驶更具挑战。我们本篇报告聚焦于软件部位的AI算法部分:AI算法部分为何至关重要?自动驾驶FSD详细分析及最新进展、人形机器人的AI算法部分如何借力于FSD? 软件算法的迭代速度、技术高度对人形机器人的导入速度、产品高度起到决定性的作用,且随着硬件体系成熟,软件算法的重要性会愈加凸显:1)人形机器人与传统机器人的突破在和物理世 界的实时感知交互,决定其实现的关键在于软件算法;2)算法能力的提升在一定范围内会降低对硬件的依赖与精度要求,参考自动驾驶方案逐步降低对雷达的依赖走向纯视觉方案;3)当产品的成熟度达到一定高度后,硬件趋向同质化,很难体现出产品的差异性,在一定范围内所体现出的重要性或将逐步降低,而软件的成熟度、稳定性等因素将日益成为影响产品差异性竞争力的重要因素。 特斯拉自动驾驶自研方案经历四次重要迭代,当前形成了“4D 传媒 沪深300 52% 42% 32% 22% 12% 2% -8% -18% 2022-082022-122023-042023-08 行业表现 资料来源:Wind资讯 升幅%1M 相对收益-5.6 绝对收益-7.5 3M -8.6 -12.9 12M 35.1 25.6 焦娟分析师 SAC执业证书编号:S1450516120001 相关报告影视行业2023年迎多重利好,暑期档超预期将加速行 2023-08-19 业修复欧盟《人工智能法案》草案 2023-06-15 通过,关注优质IP方的两条 jiaojuan@essence.com.cn 空间+占用网络”的核心架构。自动驾驶方案主要有感知、决策规划、运动控制三个模块,其中感知层相当于自动驾驶的“眼睛”, 受益逻辑新IP×AIGC×NFT:交互大 2023-06-11 帮助汽车理解所处的外部环境,感知模型的输出是基础;建立在 繁荣、内容新模式、变现新 准确、可靠的感知输出结果上,决策规划模型相当于“大脑”,对自车及周边环境轨迹进行预测,通过打分机制筛选出最优运动轨 空间从“上网”到“上算”,由“网络世界”至“虚拟现 迹输出给运动控制模块;获得行动轨迹后,运动控制模块将其分 实”——AI专题报告之十一 解为方向转向、行车速度等操作指令,将其传输给方向盘、油门、 从“上网”到“上算”,由“网 2023-05-23 刹车等执行器进行操作,最终实现对汽车的控制。 络世界”至“虚拟现实”— 我们对特斯拉FSD算法进行详细拆解,并对比了人形机器人与自动驾驶方案的异同:我们认为人形机器人建立在FSD的基础上有算法能力及供应链的加持,导入速度更快;但考虑到自由度更 —AI专题报告之十:四层投资逻辑中,主线是“大模型”——大模型携生态合作伙伴衍生出爆款落地应用 大模型及其应用的海外跟踪2023-04-10从“上网”到“上算”,由“网 络世界”至“虚拟现实”— —AI专题报告之九 多,规控算法难度较大,因此达到成熟需要一定周期,预计未来会类似于自动驾驶一样,呈现产品智能等级逐步提升的过程。相较市场对硬件部分的关注,我们本篇报告特别关注软件算法 平台的机会: 1.市场认为机器人最终会类似于自动驾驶一样走向自研。我们则认为:1)短期内对于希望升级至人工智能方向的制造商,可能会借助软件算法公司的积累而进行业务迭代;2)长期来看机器人与 自动驾驶的场域更加开放,为了提高用户体验,可能会走向更多长尾功能及场景的优化,体现为种类繁复的执行器及规控操作。如若每个公司都在感知等基础平台上重复造轮子,可能会带来产业资源的浪费。因此若最终指向通用人形机器人,我们判断感知、决策被模型化后或许会成为类似今天基础大模型一样的存在,在这类能力上具备强大实力的公司可能成为平台型的公司,而在其之上,不同应用场景的机器人公司可以部署垂类小模型,基于相应的执行器进行调整,这种模式或许是更经济的方案。由此推演,我们认为或许不排除未来特斯拉会成为AI公司提供基础能力,将上层执行器及运动控制的方案开放给更多的第三方合作伙伴。2.有观点认为国内技术创新能力不足,不具备提供平台型能力的 实力。我们反而认为:从算法能力方面,中国车企在自动驾驶方 案上已经有一定积累,特别是新势力如理想、小鹏、华为、地平 线等在感知、决策规划上已经具备相应的能力,且地平线已经宣布将进军机器人领域。此次大模型的火爆也在很大程度上推动了对技术创新、工程化落地重要性的认知,量变的积累可能引起质变,推动国内技术方案及工程能力整体水平的提升,因此我们认为国内的新势力公司仍值得关注。 关注人形机器人产业链: 特斯拉及其产业链上生态合作伙伴:其中软件部分系特斯拉自研,国内在产业链上的参与方式主要在零部件; 传统机器人向智能化升级:传统人形机器人做智能化升级,比如波士顿动力引入ChatGPT做交互;非人形机器人向智能人形机器人迭代,如傅利叶智能; 互联网大厂向机器人方向拓展:谷歌、腾讯、字节跳动等; 自动驾驶新势力:地平线等。 芯片、算力、数据等也非常重要:云端算力如超算中心的芯片及服务器;边缘、端算力,关注云天励飞;仿真模拟数据等。 风险提示:技术迭代进展不及预期、算力投产速度不及预期、安全、隐私法规等政策风险、测算不及预期。 内容目录 1.安信智能科技研究框架6 2.产业趋势:机器智能“模型”系统迎来拐点,“行动”系统蓄势待发6 3.自动驾驶FSD有望迎来量产落地12 3.1.感知层:进入“4D重建+占用网路”阶段,感知体系已较为成熟14 3.2.决策规划:系高维非凸问题,引入神经网络求解效率提升18 3.3.运动控制:仅执行决策指令,在工业上较为成熟20 3.4.数据及标注:特斯拉领先之关键,已建立强大自迭代体系20 3.5.算力:自研芯片性能可期,投产Dojo应对潜在增长需求24 4.人形机器人产业链26 4.1.Optimus:以FSD体系为基础,指向人形对软硬件适配调整26 4.2.建立在智能驾驶体系之上,人形机器人导入速度预计很快31 4.2.1.硬件架构无须破旧立新,共享汽车零部件供应体系31 4.2.2.与智能汽车本质均为智能交互硬件,复用算法模型及数据体系31 4.2.3.大模型加速智能驾驶方案迭代,机器人大模型领域成果频出32 4.3.开放场景人形机器人相较于自动驾驶面对更多挑战34 4.3.1.特斯拉缺乏语言大模型能力,需要补齐语料数据34 4.3.2.人形机器人运动控制具有极大难度35 4.3.3.对特斯拉自研算力提出更高的要求35 5.预测:人形机器人落地节奏及市场规模36 6.投资建议38 7.风险提示39 图表目录 图1.安信传媒团队智能科技研究框架6 图2.陆奇提出的“三位一体结构演化模式”7 图3.全球互联网用户及对应渗透率7 图4.中国互联网用户及对应渗透率7 图5.2016-2020年全球产生的数据量规模8 图6.从GPT-1到GPT-4的对比9 图7.商汤科技模型进化历程10 图8.视觉、语言神经网络架构进化10 图9.具身智能指机器智能与物理世界交互反馈11 图10.特斯拉人形机器人的关键时间点12 图11.特斯拉自动驾驶架构13 图12.特斯拉算法迭代进程14 图13.特斯拉采用8颗摄像头采集车周围信息15 图14.特斯拉FSD感知算法流程图15 图15.特斯拉多头处理任务架构HydraNets16 图16.特斯拉针对尘雾场景进行模型训练16 图17.Transformer架构技术原理16 图18.早期BEV鸟瞰图为2D俯视角16 图19.特斯拉感知架构的演进17 图20.占用网络之体素分割17 图21.占用网络构建步骤及输出17 图22.感知输出之动态障碍物18 图23.感知输出之车道线及路网18 图24.非凸问题优化18 图25.特斯拉采用交互搜索树进行决策规划19 图26.占用网络构建步骤及输出19 图27.特斯拉决策树剪枝方案19 图28.决策规划的输出轨迹19 图29.每个Clip数据集将通过算法标注输出空间信息20 图30.2018-2023H1特斯拉车辆年度销量21 图31.2018-2023H1特斯拉车辆累计销量21 图32.特斯拉FSDBeta版本覆盖的里程数据21 图33.仿真模拟的场景22 图34.Wayve利用AIGC生成仿真模拟环境22 图35.特斯拉数据流图23 图36.特斯拉数据仓库中包含大量、多元数据24 图37.自动驾驶云、端主要工作及关系24 图38.特斯拉D1芯片参数25 图39.特斯拉云端机柜DOJOPOD25 图40.特斯拉Dojo投产计划25 图41.智能机器人软硬件构成26 图42.特斯拉人形机器人外形参数27 图43.特斯拉人形机器人芯片及电池等参数27 图44.特斯拉人形机器人视觉传感器及感知占用网络27 图45.特斯拉人形机器人视觉导航系统28 图46.人形机器人采集运动控制数据28 图47.人形机器人的影子模式28 图48.人形机器人运动轨迹预测28 图49.人形机器人推倒测试29 图50.特斯拉人形机器人外形参数29 图51.特斯拉人形机器人芯片及电池等参数29 图52.特斯拉人形机器人外形参数30 图53.特斯拉人形机器人芯片及电池等参数30 图54.人形机器人与自动驾驶动力系统比对30 图55.特斯拉列举28种人类常见活动30 图56.特斯拉设计了6款执行器30 图57.汽车电子电气架构逐步从分布式走向集中31 图58.2022年AIDay发布的特斯拉人形机器32 图59.为人形机器人编写跌倒测试软件32 图60.马斯克称将FSDv12.0版本将实现端到端33 图61.马斯克表示运动控制模块正在AI模型化33 图62.道路语义拓扑图33 图63.RT-2模型实现视觉-语言-动作三种模态对齐34 图64.中美自动驾驶分级标准36 图65.智能机器人产业链39 表1:2021-2022年中国各类互联网应用用户规模和网民使用率8 表2:CNN、RNN、Transformer优缺点对比9 表3:目前自动驾驶方案中主要的传感器对比14 表4:特斯拉历代FSD硬件版本26 表5:特斯拉汽车智能化发展阶段梳理36 表6:全球机器人销量37 表7:2023-2030年人形机器人落地节奏及市场规模预测38 1.安信智能科技研究框架 当下,我们正处于下一代计算平台构建成型的起点上,以“智能”的真正实现为总纲,技术维度的要素创新,包括混合虚拟现实(MR)、人机共生/协同(AI)两个方向,其中MR本质上是重构时空,人机共生/协同本质上是混合平台,混合平台又包括不同的工程方案——人形机器人(以机器为智能载体)、脑机接口(以人为智能载体)。 工程方案理论上会有无穷多,具象的工程方案探索,严格意义上仍在初期(目前仅基于视觉的技术探索),但所有的工程方案都可以收拢到具体的技术路径中,任何技术路径的目标是实现虚拟现实,即模糊掉虚拟与现实之间的边界。目前主流的技术路径为,一是以AR的技术路径去实现,但现阶段AR相关技术仍待攻克;二是先VR再迭代至MR,以VR作为过渡。 混合平台是智能实现的另一条技术路径。如果将人的身体看作“硬件”,智能的实现过程,也是新智能交互硬件层出不穷、旧硬件