您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:TeslaBot:ChatGpt产业共振,剑指具身智能 - 发现报告
当前位置:首页/行业研究/报告详情/

TeslaBot:ChatGpt产业共振,剑指具身智能

信息技术2023-05-21刘泽晶华西证券简***
TeslaBot:ChatGpt产业共振,剑指具身智能

证券研究报告|行业动态报告 2023年5月19日 TeslaBot:ChatGpt产业共振,剑指具身智能 评级及分析师信息 行业评级:推荐 行业走势图 58%44%30%16% 2% -12% 2022/052022/082022/112023/022023/05 计算机沪深300 分析师:刘泽晶邮箱:liuzj1@hx168.com.cnSACNO:S1120520020002 计算机行业 事件概述: 2023年5月17日,特斯拉召开2023年股东大会,展示了一直备受关注的人形机器人Optimus进化情况,机器人作为AI技术的重要载体成为市场焦点。在ChatGPT掀起的AI风潮下,机器人与大模型有望实现产业共振。 特斯拉股东大会召开,人形机器人Optimus进化 在机器人领域,特斯拉的人形机器人一直备受关注。2021年,马斯克发布了仅处于概念阶段的特斯拉通用机器人计划,2022年人形机器人擎天柱(Optimus)实体亮相,在没有连线或后援的情况下能简单走几步。2023年特斯拉股东大会上,马斯克展示了TeslaBot的最新进展:TeslaBot不仅可以流畅行走,多个TeslaBot还可以一起往前行走,并且边走边发现并记忆周遭的环境,此外,还能够精准控制力道,各种物体拿捏自如。 TeslaBot技术支撑——AI域、技术域 特斯拉机器人可以简单拆分2个域,即AI域及技术域。 AI域:采用FSDcomputer作为算力核心,是人形机器人的核心及未来发展的重要趋势。FSD算法主要依赖于神经网络和计算机视觉技术。其核心是神经网络模型,可以实现车辆的环境感知和物体识别,FSD算法在机器人的感知、决策和控制方面也起到重要作用。 技术域:机器人头部包含信息屏幕,用来展示信息,此外机器人由轻质材料组成,并且四肢包含40个左右的机电执行器,并通过力反馈感应系统来实现平稳和敏捷双脚行走。研究团队使用电机扭矩控制(motortorquecontrol)操纵人形机器人腿部的运动,让机器人「落脚」力度保持轻缓。 ChatGPT风起,机器人与大模型有望实现产业共振ChatGPT掀起的AI浪潮依旧在全球范围内疯狂蔓延,机器人作为AI技术的重要载体成为市场焦点。在当前所处的“模型”范式后,下一个“行动”范式节点是以机器人为代表的物理空间革新,而当前AI大模型的技术突破为下一范式来临注入强大推动力。大模型对机器人的赋能体现在1)感知系统及方式的革新;2)提升控制、规划决策和交互能力。代表研究包括谷歌的具身多模态语言模型PaLM-E、微软的ChatGPT以及商 请仔细阅读在本报告尾部的重要法律声明 汤“书生2.5”模型对机器人在人机交互、行动规划决策、问题处理和智能控制等多任务领域的实验。 我们认为AI现实场景应用中的探索,最终目的是给大语言模型“穿上机器人外衣”,进而转化为生产力提升。因此要进一步关注目前可以用大模型进行改造的硬件机器人类型及应用场景:1)服务类机器人;2)工业机器人;3)人形机器人。 受益方向梳理:机器人产业链、机器视觉、大模型 在各大厂商加速布局AI算法和机器人产业链,寻求多领域场景落地可能性的背景下,我们认为重点关注领域及受益标的包括:机器人产业链(三花智控、绿的谐波、鸣志电器)、机器视觉(虹软科技、海康威视、大华股份)、视觉领域大模型 (商汤科技、云从科技)。 风险提示 核心技术水平升级不及预期的风险,AI伦理风险,政策推进不及预期的风险,中美贸易摩擦升级的风险。 正文目录 1.特斯拉股东大会召开,人形机器人Optimus进化5 2.TeslaBot技术支撑——AI域、技术域7 2.1.AI域:已打通FSD和机器人的底层模块7 2.2.技术域:电机扭矩控制是机器人精准控制力道的关键方法9 3.ChatGPT风起,机器人与大模型有望实现产业共振10 3.1.下一范式蓄势待发,机器人“智”+“力”双剑合璧10 3.2.AI赋能机器人:革新感知方式,融合控制与交互12 3.3.打开市场:加速三大机器人场景落地15 4.受益方向梳理:机器人产业链、机器视觉、大模型16 5.风险提示20 图目录 图表12021年TeslaBot的大致形态5 图表22022年Optimus在「特斯拉AI日」上亮相5 图表3TeslaBot流畅行走6 图表4多个TeslaBot一起向前行走6 图表5TeslaBot边走路边识别并记忆周边环境6 图表6TeslaBot轻松拿取物体7 图表7TeslaBot放置物体7 图表8是否拥有AI域的机器人在软件上的差异8 图表9神经网络示意图8 图表10特斯拉神经网络示意图8 图表11特斯拉人形机器人工作流程图9 图表12特斯拉机器视觉全流程示意图9 图表13TeslaBot感知9 图表14TeslaBot对周边环境的识别9 图表15特斯拉人形机器人概念图10 图表16TeslaBot腿部落地运动10 图表17TeslaBot控制力道不打碎鸡蛋10 图表18“模型”范式下一范式:“行动”无处不在11 图表19机器人大模型:LLM、VLM、VNM12 图表203D视觉避障12 图表21眼动追踪:像素密集的注视点显示器更大12 图表22PaLM-E控制下的机器人任务13 图表23人机交互的层级关系:人或机器将一部分决策权让渡给另一方14 图表24是否运用ChatGPT技术的人机交互模式区别14 图表25“书生2.5”居家机器人场景应用15 图表26服务机器人16 图表27工业机器人16 图表28特斯拉Optimus16 图表29三花智控部分产品17 图表30谐波减速器LHS系列17 图表16鸣志电器有刷空心杯电机18 图表32虹软科技智能汽车视觉解决方案18 图表33海康威视视觉软件定位功能19 图表34华睿科技机器人视觉业务19 图表35商汤科技书生(INTERN)2.520 图表36云从科技产品服务体系20 1.特斯拉股东大会召开,人形机器人Optimus进化 在机器人领域,特斯拉的人形机器人一直备受关注。 2021年,在「特斯拉AI日」上,马斯克发布了特斯拉的通用机器人计划,并用图片展示了人形机器人TeslaBot的大致形态。但当时的TeslaBot只是个概念,动作展示部分是由工作人员穿着特制的紧身服装,扮成机器人的模样表演了一段舞蹈。 一年后在2022「特斯拉AI日」上,人形机器人擎天柱(Optimus)实体亮相,缓缓走出并和观众打了个招呼。初次亮相的Optimus在没有连线或后援的情况下,只能简单走几步。 图表12021年TeslaBot的大致形态图表22022年Optimus在「特斯拉AI日」上亮相 资料来源:计算机视觉联盟,华西证券研究所资料来源:计算机视觉联盟,华西证券研究所 在最近的2023年特斯拉股东大会上,马斯克展示了TeslaBot的最新进展:1、TeslaBot已经可以流畅行走。 2、多个TeslaBot可以一起往前行走。 3、TeslaBot不是在简单走路,而是边走边发现并记忆周遭的环境。 图表3TeslaBot流畅行走图表4多个TeslaBot一起向前行走 资料来源:计算机视觉联盟,华西证券研究所资料来源:计算机视觉联盟,华西证券研究所 图表5TeslaBot边走路边识别并记忆周边环境 资料来源:计算机视觉联盟,华西证券研究所 除了行走之外,马斯克还展示了人形机器人更为细节的能力:特斯拉展示了Optimus电机转矩控制的能力,能做到控制力道不打碎鸡蛋。此外,特斯拉的人形机器人还能够灵活抓取放下物体,各种物体均可拿捏自如。 资料来源:计算机视觉联盟,华西证券研究所资料来源:计算机视觉联盟,华西证券研究所 2.TeslaBot技术支撑——AI域、技术域 2.1.AI域:已打通FSD和机器人的底层模块 AI域:采用FSDcomputer作为算力核心,配备8个AutopliotCameras作为传感器,支持深度学习、大数据分析,Dojo训练,自动标记等算法。 我们认为AI域是人形机器人的核心,机器人只有通过不断的机器学习的训练,才能完成指定的任务。此外特斯拉人形机器人是特斯拉自动驾驶的集大成者,因为人形机器人的核心与智能驾驶共用FSD系统,我们预计智能驾驶很多神经网络系统将会应用在人形机器人中。 AI域是人形机器人未来发展的重要趋势,无论是工业机器人重视的人机协作能力,还是服务机器人随着人工智能技术的突破,进入快速扩张期,同时逐渐向仿生领域迈进,甚至是特种机器人建筑煤炭灾后重建等方向进军,机器视觉和智能语言都是其赋能千行百业的必要前提。 非拥有AI域机器人:从流程上可分为四步,即编程、行动、生成指令集和执行控制,软件层面上专精型机器人通过基于云计算或者虚拟主机进行软件编程,通过执行已配置的业务逻辑进而完成固定任务。 拥有AI域机器人:从流程上可分为感知、评估、规划、执行四步。软件层面上主要通过机器学习和神经网络不断进行迭代训练,进而完成理解人类语义和机器视觉上的物体识别,从而通过规划生成完成任务的多种路径,由评估模块生成最低能效完成任务的简单路径,最后生成规划指令集,传导到完成制动。 资料来源:华西证券研究所 马斯克透露,特斯拉已经打通了FSD和机器人的底层模块,实现了一定程度的算法复用。FSD算法指的是其全自动驾驶(FullSelf-Driving)系统所采用的算法,采用它是为了实现车辆的自主导航和自动驾驶功能,让车辆能够在各种交通环境下进行感知、决策和控制。 FSD算法主要依赖于神经网络和计算机视觉技术。其核心是神经网络模型:通过对实时传感器(如相机、激光雷达等)获取的数据进行处理和分析,并从中提取有关道路、车辆、行人和障碍物等信息,可以实现车辆的环境感知和物体识别。 图表9神经网络示意图图表10特斯拉神经网络示意图 资料来源:知乎,车东西,华西证券研究所资料来源:知乎,车东西,华西证券研究所 人形机器人的灵魂——AI机器视觉:机器视觉是AI深度学习的一种应用与技术方向,无论是人形机器人还是智能驾驶都是机器视觉的落地方向之一。我们认为特斯拉在智能驾驶和人形机器人在机器视觉的路径上具有异曲同工之妙。一套完整的训练、测试(工作)运动包含传感器、感知、评估、规划、制动器五个部分。 首先由传感器收集数据,随后数据通过神经网络的运算进行数据转换及数据清洗,生成计算机可以识别的数据信息;然后评估模块基于感知模块生成的数据生成完成任务的多种路径;由评估模块选择使用最低能效完成任务的简单路径,随后生成规划指令集;最后由规划生成控制指令集,完成对制动器的判定,让机器人完成指令任务。 图表11特斯拉人形机器人工作流程图图表12特斯拉机器视觉全流程示意图 资料来源:华西证券研究所整理资料来源:华西证券研究所 特斯拉利用大规模的数据集训练模型,可以提高算法在复杂环境下的性能和鲁棒性。特斯拉这次称已经打通了FSD和机器人的底层模块,并认为自动驾驶的本质其实就是机器人。 FSD算法在机器人的感知、决策和控制方面也起到重要作用。和特斯拉环境感知主要依赖视觉相似的,机器人同样也是如此。在感知层面,特斯拉的一个重要技术是OccupancyNetwork(占据网络),用于对3D空间中一些长尾障碍物的检测,来估测障碍物的位置大小,甚至可以估计物体的运动情况。FSD算法利用传感器数据进行环境感知,这些传感器也可以帮助机器人感知周围环境,识别物体、人和障碍物等,帮助机器人在执行任务时识别和定位物体。 图表13TeslaBot感知图表14TeslaBot对周边环境的识别 资料来源:AI蓝媒汇,华西证券研究所资料来源:AI蓝媒汇,华西证券研究所 2.2.技术域:电机扭矩控制是机器人精准控制力道的关键方法 技术域:机器人头部包含信息屏幕,用来展示信息,此外机器人由轻质材料组成,并且四肢包含40个左右的机电执行器,并通过力反馈感应系统来实现平稳和敏捷双脚行走。 图表15特斯拉人形机器人概念图 资料来源:车东西