2023年深度行业分析研究报告 目录 1AI赋能机器人,具身智能发展正当时1 1.1机器人是AI落地的最佳载体1 1.2AI大模型助力具身智能发展3 2特斯拉人形机器人Optimus的AI赋能分析6 2.1软硬件不断迭代升级,核心为优化成本和效率6 2.2AI多次模拟,优化设计方案7 2.3FSD+Dojo加持,提高机器人执行力9 3特斯拉人形机器人Optimus的驱动方案分析11 3.1身体:14个旋转线性执行器+14个线性执行器11 3.2灵巧手:12个空心杯关节14 4人形机器人蓄势待发,为国内相关产业链带来机遇16 4.1减速器:具有较高技术壁垒,机器人零部件核心赛道16 4.2无框力矩电机:可用于协作机器人关节,国内产品逐步系列化18 4.3空心杯电机:下游应用广泛,设计和规模量产为壁垒19 4.4丝杠:技术壁垒高,国产替代空间大21 4.5传感器:视觉和力控必不可少,精度和可靠性为关键25 5相关标的29 图目录 图1:人工智能和机器人的联系1 图2:AI机器人/人形机器人可以分成五大部分2 图3:AI机器人在完成任务时需要经历三层处理2 图4:人形机器人和大模型进展情况4 图5:RT-1可以让一个机器人同时干多份工作5 图6:RT-1可以完成一系列复杂组合任务5 图7:PaLM-E可以手写菜单直接算出2份披萨的价格5 图8:PaLM-E参数量达5620亿(GPT-3的参数量为1750亿)5 图9:SAM支持多种交互方式分离识别物体6 图10:SAM为一张图标记超过500个遮罩6 图11:特斯拉人形机器人Optimus最新样机7 图12:Optimus摄像头方案为7个摄像头配置7 图13:特斯拉车辆碰撞模型有超过3500万个自由度7 图14:特斯拉工程师将车辆碰撞模型应用于机器人设计中7 图15:人体在低功耗的同时具有高度灵活性8 图16:通过AI仿真模型找到每个关节的最佳设计8 图17:AI分析执行器云端数据进行共性研究,减少定制设计8 图18:6种执行器包括3种旋转执行器和3种线性执行器8 图19:FSD能使车辆在各种交通环境下感知、决策和控制9 图20:机器人可以借助FSD算法将周围环境具像化9 图21:占据网络通过对3D空间内障碍物持续监测来计算障碍物位置、大小、运动情况9 图22:FSDBeta目前已拥有近2亿英里自动驾驶数据10 图23:2021年超级计算机算力榜Dojo位列第6名10 图24:特斯拉推特账号宣布将在2023年7月开始生产Dojo10 图25:Dojo计算架构为AI路径规划提供算力支持11 图26:Dojo可以训练AI解决新问题的能力11 图27:特斯拉人形机器人Optimus使用的6种执行器11 图28:特斯拉人形机器人Optimus身体28个执行器12 图29:旋转执行器方案图示13 图30:线性执行器方案图示13 图31:机器人Optimus手的结构示意图15 图32:机器人Optimus手的结构示意图15 图33:2021年我国机器人用谐波减速器市场占比情况18 图34:2021年我国机器人用RV减速器市场占比情况18 图35:无框力矩电机示意图19 图36:无框力矩电机常用于协作机器人的关节19 图37:空心杯电机结构示意图19 图38:空心杯电机结构示意图19 图39:梯形螺纹丝杠、滚珠丝杠、行星滚柱丝杠结构示意图21 图40:全球和我国行星滚柱丝杠市场规模情况23 图41:2021年我国行星滚柱丝杠市场竞争格局23 图42:2016-2021年全球滚珠丝杠市场规模CAGR=10.2%24 图43:2016-2021年我国滚珠丝杠市场规模CAGR=6.2%24 图44:3D视觉三种原理示意图26 图45:2025年中国3D机器视觉市场空间将超过57亿元26 图46:毫米波雷达CMOS工艺大幅提高了芯片逻辑密度27 图47:我国毫米波雷达行业被国外企业占据绝对的主导地位(2022年)27 图48:一个力可以被拆分成多个力和力矩之和28 图49:六维力传感器常被用于协作机器人末端28 图50:加速度计结构示意图29 图51:陀螺仪结构示意图29 表目录 表1:各厂商人形机器人汇总2 表2:特斯拉人形机器人Optimus身体28个执行器12 表3:特斯拉人形机器人Optimus身体核心零部件市场空间测算14 表4:特斯拉人形机器人Optimus手部核心零部件市场空间测算16 表5:三种精密行星减速器对比17 表6:谐波减速器和RV减速器在工业机器人领域的应用对比17 表7:精密减速器公司对比18 表8:生产无框力矩电机公司情况19 表9:空心杯电机特点20 表10:无刷空心杯电机和有刷空心杯电机的优缺点20 表11:生产空心杯电机公司情况21 表12:滚柱丝杠与滚珠丝杠的性能比较22 表13:轧制滚珠丝杠与磨制滚珠丝杠的比较22 表14:国内生产丝杠公司情况24 表15:3D视觉三种原理的优缺点25 表16:惯性传感器三种分级比较28 1AI赋能机器人,具身智能发展正当时 1.1机器人是AI落地的最佳载体 具身智能(EmbodiedIntelligence)是AI进入物理世界进行交互的载体。根据智能程度,可以将机器人分为两类:非智能机器人和智能机器人;同时根据有无载体,也可以将人工智能分为两类:虚拟AI和实体AI。机器人与人工智能的交集,即:作为AI实物载体的智 能机器人。一般的工业机器人只能被编程为执行重复的一系列运动,所有的运动轨迹、位置、 动作、力度都需要提前设定,更突出其“机器”属性,智能机器人则可以与外界交互,根据自身对外界的感知,决定完成任务的方式,并且可以在失败中不断学习进步,相较于非智能机器人的“机器”属性,智能机器人更像是“人”。 图1:人工智能和机器人的联系 数据来源:发那科官网、OpenAI官网、特斯拉AIDay、西南证券整理 AI机器人可以分成五大部分。1)感知系统,相当于机器人的“五官”,包括声音、光、温度、压力、定位、接触等传感器,用以将外部环境信号转换为机器人可以理解的信息或者 数据;2)驱动系统,相当于机器人的“肌肉”,电机驱动包括电机、减速器、编码器等;3)末端执行系统,相当于机器人的“手”,用以和外界环境进行交互;4)能源供应,电源或者电池;5)运算系统及软件,相当于机器人的“大脑”。 AI机器人在完成任务时需要经历三个层次。给到机器人一个任务时,机器人一般要经历三层信息处理:1)第一层是感知,理解需求和环境。机器人通过传感器感知周围环境,并且识别到任务体在环境内所处的位置。2)第二层是规划,拆解成任务和路径规划,机器人 理解任务之后,它需要将任务拆解成多个步骤,按顺序执行步骤达到完成任务的目标。3)第三层是执行,驱动硬件执行任务,把运动规划转变成为机械指令,确定能量、动量、速度等参数,开始执行任务。非智能机器人无法对外界进行自主感知,需要人类计算出运动路径 并设定运动参数,而智能机器人可以自主感知外界,并拆解任务、设计路径,最终完成任务。 图2:AI机器人/人形机器人可以分成五大部分图3:AI机器人在完成任务时需要经历三层处理 数据来源:特斯拉AIDAY,西南证券整理数据来源:西南证券整理 人形机器人赛道迎来快速发展阶段。进入到21世纪以来,以本田、波士顿动力为首的各大厂商纷纷布局人形机器人产品,但是受限于硬件和软件的成熟度,早期的人形机器人发 展缓慢。在算法和硬件的不断进步中,人形机器人赛道也出现了很多“新面孔”,2022年以来特斯拉、小米等各大厂商陆续推出了自己的人形机器人产品,尤其特斯拉以“量产”为目标,预计将推动整个行业迎来快速发展。 表1:各厂商人形机器人汇总 厂商 机器人型号 发布时间 应用场景 参数 价格 图片 特斯拉 (美国) Optimus 2022年 工厂内基础性工作,未来进入家用 173cm,57kg,身体28个关节(14直线+14旋转),手部11个自由度 量产后预计售价 2万美元 小米(中国) CyberOne 2022年 家庭陪伴、公共服务 177cm,52kg,全身13个关节,21个自由度 造价60-70万 优必选 (中国) Walker 2021年 家庭、办公、智慧工厂、表演 130cm,63kg,全身41个自由度(腿6x2,臂7x2,手6x2,颈3) 200万 1XTechnologies (挪威) EVE 2019年 工厂保安、医护助理 186cm,83kg,下半身为轮式结构,不能跨越障碍 2019年以140万元卖给了丰田研究所,目前价格未知 EngineeredArts (英国) Ameca 2021年 家庭陪伴 187cm,49kg,全身51个自由度,面部表情丰富,运动能力差 13.3万美元 厂商 机器人型号 发布时间 应用场景 参数 价格 图片 AgilityRobotics (美国) Digit 2019年 物流仓储 155cm,42.2kg,全身16个自由度,没有头部和手部 25万美元 软银(日本) Pepper 2014年 机场、银行、酒店 100cm,28kg,全身20个自由度,下半身为轮式结构,不能跨越障碍 已停产 波士顿动力 (美国) Atlas 2018年 救援 150cm,80kg,全身28个自由度,没有头部和手部 190万美元 本田(日本) Asimo 2000年 (初代) 表演 130cm,48kg,全身57个自由度 近300万美元 数据来源:西南证券整理 1.2AI大模型助力具身智能发展 各大科技巨头纷纷推出AI大模型,有望解决人形机器人的通用性问题。1950年图灵首次提出具身智能的概念,此后几十年里,受制于落后的AI技术,具身智能并没有取得很大的进展。近年来随着硬件和软件算力的不断提升,各大公司相继推出AI大模型算法,包括 OpenAI的GPT-4、谷歌的RT-1、PaLM-E等,有望解决机器人的通用性问题,具身智能迎来快速发展。 图4:人形机器人和大模型进展情况 数据来源:西南证券整理 2022年12月,谷歌发布多任务模型RoboticsTransformer1(RT-1),用以大幅推进机器人总结、归纳、推理的能力。RT-1是一种多任务模型,可以标记机器人输入和输出动作以在运行时实现高效推理。训练模型使用的数据集涵盖700多项任务的13万个数据带点, 使用13台机器人在17个月内收集而成。RT-1可以显著改进机器人对新任务、环境和对象的零样本泛化,机器人执行从未做过的任务的成功率明显上升,对不同环境甚至有干扰的情况下的成功率也有上升;此外使用别的机器人数据来训练模型,使得自己机器人的执行任务的准确率得到提升。 图5:RT-1可以让一个机器人同时干多份工作图6:RT-1可以完成一系列复杂组合任务 数据来源:新智元,西南证券整理数据来源:《RoboticsTransformerforReal-worldControlatScale》,西南证券整理 2023年3月,谷歌和柏林工业大学共同发布可以用于机器人的多模态视觉语言模型PaLM-E,用视觉数据来增强其语言处理能力,可以指导机器人完成复杂的任务。PaLM-E主要基于谷歌现有的PaLM大语言模型,并且加入了感知信息的能力,能让机器人真正“理 解”任务,将看到的图像转化成可以理解的语言文本,从而做到在面对零样本新任务时的“举一反三”。PaLM-E无需对相关数据进行预处理或注释。 图7:PaLM-E可以手写菜单直接算出2份披萨的价格图8:PaLM-E参数量达5620亿(GPT-3的参数量为1750亿 数据来源:谷歌,西南证券整理数据来源:谷歌,西南证券整理 2023年4月,Meta发布了图像分割模型SAM。SAM可以在不需要额外训练的情况下 对不熟悉的对象和图像进行零样本泛化,从而“剪切”任何图像中的任何对象。在SAM发布之前,想把图像准确分割,需要人类手动分割后再交给机器人学习,这需要大量专家进行高度专业化的工作,费时费力。SAM使得机器人将所学到的分割图像进行细致