行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

视觉传感器——人形机器人视觉感知交互硬件

机械设备 2024-04-14 刘卓,傅昌鑫中邮证券 Aaron

该研报主要关注于人形机器人的视觉实现，以及机器视觉行业的发展。随着人形机器人技术的发展，其交互功能及应用场景更加丰富，因此，纯摄像头方案的厂商也有可能通过迭代更新，在其新产品中引入3D视觉传感器。机器视觉技术按照成像维度的不同，可以划分为2D和3D两大类别。3D视觉感知技术主要包括飞行时间（ToF）法、双目立体视觉法、结构光法等。产业链相关标的包括奥比中光、奥普特、凌云光。

证券研究报告：机械设备|深度报告 2024年4月14日行业投资评级强于大市|维持视觉传感器——人形机器人视觉感知交互硬件 0% -3% -6% -9% -12% -15% -18% -21% -24% -27% -30% 机械设备沪深300 投资要点行业相对指数表现（相对值）行业基本情况收盘点位 1370.03 52周最高 1594.48 52周最低 1090.08 视觉传感器助力人形机器人感知世界。视觉传感器，即机器视觉旨在利用机器来执行视觉识别和判断任务。人类约80%的信息是通过人眼感知获取的，未来的机器人也将和人类一样，大量信息都将通过视觉感知获取。目前，不少人形机器人选用3D视觉方案以保证人形机器人的环境感知及交互能力。未来随着人形机器人的不断发展，其交互功能及应用场景更加丰富之后，现阶段纯摄像头方案的厂商也有可能通过迭代更新，在其新产品中引入3D视觉传感器。机器视觉是由计算机或图像处理器以及相关设备来模拟人的视觉行为，完成得到人的视觉系统所得到的信息。其下游应用广泛，主要可发挥定位、识别、测量、检测等功能，目前主要下游为智能制造的工业场景，医学、智能交通等场景也有应用。机器视觉的产业链上游主要有光源、镜头、工业相机、工控机、图像处理软件等机器视觉 2023-042023-062023-092023-112024-012024-04 研究所资料来源：聚源，中邮证券研究所分析师:刘卓 SAC登记编号:S1340522110001 Email:liuzhuo@cnpsec.com 研究助理:傅昌鑫 SAC登记编号:S1340123050006 近期研究报告 Email:fuchangxin@cnpsec.com 《出海系列专题（1）：通用动力机械 —海外补库，中资突破，新质赛道》 -2024.04.09 组件设备的提供商；产业中游包括如检测、测量、定位、识别系统/定位引导系统等以及各类视觉设备；产业链下游主要为各行业的产线综合解决方案供应商终端行业。我国机器视觉市场现阶段正处于快速增长阶段，到2027年有望突破560亿规模。机器视觉技术按照成像维度的不同，可以划分为2D和3D两大类别。2D成像技术使用到的传统RGB相机，仅能捕捉到物体表面的纹理信息，没有物体到相机的距离信息，3D视觉感知技术有效地补充了2D视觉技术的不足，使得更加复杂和智能的功能得以实现。3D视觉感知技术主要包括飞行时间（ToF）法、双目立体视觉法、结构光法等。机器视觉产品按照下游应用场景的性能要求，可以大致分为消费级和工业级两类。工业级机器视觉对于技术、精度、稳定性等的要求相对更高，整体成本较高。消费级视觉方案对于精度的要求相对较低对于成本控制的需求较高。现阶段人形机器人进入规模量产阶段，对视觉方案的需求更关注于产能供应和成本控制两方面，推测消费级3D视觉产品有望成为需求主流。随着未来人形机器人应用场景的复杂化及多元化之后，不排除需求工业级机器视觉产品的可能性。产业链相关标的：奥比中光、奥普特、凌云光 风险提示：人形机器人规模化不及预期风险；人形机器人视觉感知技术路径变化风险；消费级视觉产品竞争加剧风险；3D视觉技术发展不达预期风险。目录 1人形机器人的视觉实现4 1.1视觉传感器助力人形机器人感知世界4 1.2人形机器人主要视觉方案4 2机器视觉行业6 2.1机器视觉的工作原理及应用6 2.2机器视觉产业链及规模7 2.3机器视觉主流技术方案8 2.4机器视觉产品价格水平12 3产业链相关标的14 4风险提示16 图表目录图表1：空间三维测量示意图4 图表2：视觉传感器助力人机交互4 图表3：国内外人形机器人厂商进展及其视觉方案5 图表4：机器视觉系统构造及工作原理7 图表5：2016-2027年中国机器视觉市场规模及预测8 图表6：主流3D视觉感知技术对比9 图表7：双目立体视觉工作原理10 图表8：结构光工作原理11 图表9：ToF工作原理11 图表10：dToF与iToF的对比12 图表11：2022年埃科光电主要原材料及产品价格情况13 图表12：2021年奥比中光主要原材料、产品价格情况及部分产品零售价13 图表13：奥比中光3D相机亮相NVIDIAGTC202415 1人形机器人的视觉实现 1.1视觉传感器助力人形机器人感知世界视觉传感器，即机器视觉，旨在利用机器来执行视觉识别和判断任务。在工业生产中，机器视觉的引入旨在提升效率、减少误差、降低成本，并从繁重或危险的工作环境中解放人力。根据图像数据的维度，机器视觉在工业中的应用可分为二维（2D）和三维（3D）两大类，主要功能包括识别、测量、定位和检测。其中，识别功能的实现相对简单，而检测功能则相对复杂。2D技术能够获取平面图像，并在二维空间内定位目标，但其无法提供物体的三维信息，如高度和体积，且易受光照变化和物体运动的影响。相比之下，3D技术能够提供更全面的物体信息，并在三维空间内定位目标，从而实现更为复杂的功能，如人脸识别和3D建模。尽管3D技术在数据处理和存储方面仍存在挑战，但它在许多应用场景中展现出独特的优势。未来的人形机器人将会拥有语音感知交互能力（“嘴巴”和“耳朵”）、视觉感知交互能力（“眼睛”），以及各种AI决策分析能力（“大脑”）。人类约80%的信息是通过人眼感知获取的，未来的机器人也将和人类一样，大量信息都将通过视觉感知获取。现实物理世界是三维的，发展多年的2D成像技术难以完整重现各类三维场景，3D视觉感知技术则可以让终端获取更多精准的三维信息，助力各类终端更好地看懂三维世界。图表1：空间三维测量示意图图表2：视觉传感器助力人机交互资料来源：奥比中光招股书，中邮证券研究所资料来源：优必选公告，中邮证券研究所 1.2人形机器人主要视觉方案目前，国内外已经有众多人形机器人厂商发布了产品样机，领先厂家甚至已经开始规模量产的规划。可以看到，不少人形机器人选用3D视觉方案以保证人形机器人的环境感知及交互能力。图表3：国内外人形机器人厂商进展及其视觉方案海外由特斯拉自研的执行器和传感器、颈部新增2-DoF驱动、集成执行器的电子及 Tesla Optimus 布线、行走速度提升30%、铰接式脚趾部分构成仿生学的脚、未牺牲性能减重10kg、平衡及全身控制能力提升、速度更快的11-DoF全新手部、手指末节引入预计即将量产 8个Autopilot摄像头触觉传感器。 AgilityRobotics Digit 以其独特的双足设计脱颖而出，机器人配备了激光雷达等先进传感器，可以感知周围环境并轻松避开障碍物。手臂擅长保持平衡，还能抓取、携带物体，并与环境中的各种元素交互。身高约1.75米，体重65公斤，相当于中等男子的身材，最多可承载16公斤。即将年产1万台并引入下游工厂作业深度相机激光雷达面部表情最丰富、仿真的人形机器人。利用Mesmer技术为Ameca提供大量的真人表情数据，从人体不同角度扫描，构建3D模型，在立体光刻3D打印机上制 EngineeredArts Ameca 作的精确模具，使皮肤质感看起来和真人一样。能够对外界变化做出相应反应：Tritium操作系统连接了软件、硬件和云端，可以驱动硬件的每一个组成部分，使其硬件部分能像人类骨骼一样活动。Atlas身高约1.5米，重约82公斤，具备执行各种复杂动作的能力，包括步行、跑 BostonDynamics Atlas 步、跳跃和复杂的体操动作。其特点之一十先进的感知系统，利用多种传感器来构建环境的三维地图，并实现自主导航和障碍物避让；另一个显著特点是其液压驱动系统，这使得它能够执行强大的举重和搬运任务，以及在摔倒后自我 RGB摄像头ToF深度相机恢复的能力。双足机器人，并以人体肌肉运动为模型，对其进行「高精度」和「轻柔度」的 1XTechnologies NEO 设计，在铝芯之上覆盖了一层软层，使之它和人类一样柔软、轻巧，而且本质上是「安全」的，没有夹点或其他危险。因此，NEO可以自由行走，通过面部（前一代产品EVE配备前置/ 后置摄像头以获取全景视图）表情沟通，提高操作效率的同时，还保障了用户的安全性。仍在开发中。国内优必选 WalkerX 搭载高性能伺服关节以及多维力觉、多目立体视觉、全向听觉和惯性、测距等全方位的感知系统，结合视觉定位导航和手眼协调操作技术，可实现快速平稳的行走和精准安全的交互。有少量销售 RGBD相机双目相机傅利叶智能 GR-1 采用电驱动，自研FSA高性能一体化执行器，拥有强大且灵活的运动性能。GR-1身高1.65米，体重55公斤，全身自由度达40个，最大关节模组峰值扭矩可达300Nm，步行速度可达到5km/h，负重50kg。已启动量产并实现部分交付 Realsense深度摄像头采用轻量化材料设计，整体重量只有47kg，整身拥有19个自由度，行走姿态轻宇树科技 H1 盈稳健，为适配大负载，高密度，大功率的需要，应用了扭矩密度更高的M107关节电机，峰值扭矩达到了360Nm。目前H1人形机器人行走速度可以达到1.5m/s，潜在运动能力可达5m/s。续航方面，H1人形机器人搭载15Ah电池，最 3D激光雷达深度相机大电压67.2V，可满足连续1小时的运动续航标准。研发历时三年，经过四个版本迭代，目前已实现除主板等少数零部件外的完全开普勒先行者国产化。机器人身高178cm，体重85kg，拥有40个关节自由度和12个自由度的智能灵巧手。核心技术包括自研的行星滚柱丝杠执行器和旋转型执行器，以及星云系统（用于机器人的实时环境感知，包括视觉、听觉和本体感知）和云端计划2024年下半年量产，预估售价为2-3万美元 3D视觉相机鱼眼360°环视相机多模态大模型。步幅大、步速快，自稳定能力强。手臂具备7自由度，重复定位精度达到小鹏 PX5 0.05mm，单臂最大负载为3kg，机械臂自重为5kg，负载自重比超过0.6，最大末端线速度为1m/s。PX5的感知和交互能力已经与小鹏汽车的底层能力打通，摄像头利用公司在XNGP、XOS等方面的积累，实现了技术在不同产品间的复用。CyberOne的身高为177厘米，体重52公斤，具有与真人相似的外观和比例。小米 CyberOne CyberOne搭载了高效电机，支持多达21个自由度，并能实现各自由度0.5毫秒级别的实时响应，模拟人的各项动作。还搭载了自研的MiAI环境语意识别引擎和MiAI语音情绪识别引擎及OLED显示模组，能够感知45种人类语义情绪和分自研空间视觉模组AI交互相机辨85种环境语义的能力。身高175cm，重量55kg，全身超过49个自由度，搭载了谐波一体关节、直线推杆、无刷行星伺服、空心杯电机等驱各类执行器，PowerFlow关节电机，峰值智元机器人远征A1 扭矩350Nm，重量1.6kg，配有水冷循环散热。腿部采用反曲膝设计，灵巧手拥有12个主动自由度，5个被动自由度，采用驱动内置。还配有基于视觉的指尖传 RGBD相机激光雷达感器，可以分辨操作物的颜色、形状、材质等。足式/轮式、灵巧手均支持自主更换。资料来源：各公司官网，澎湃新闻，36氪等，中邮证券研究所整理 BostonDynamics的Atlas采用RGB摄像头+ToF深度相机，优必选采用RGBD+双目相机，傅利叶的GR-1采用深度相机，开普勒的先行者系类采用3D视觉+鱼眼环视相机，小米的CyberOne配备了自研空间视觉模组+AI交互相机。大部分案例均使用3D视觉传感器，各类型的深度相机被广泛使用，部分厂商的方案同时搭配了激光雷达，如AgilityRobotics的Digit、宇树的H1、智元的远征A1等。也有少部分厂家仅使用摄像头作为视觉传感器的方案，如特斯拉的Optimus，其视觉感知系统则主要基于特斯拉FSD的计算机模组和方案，面部配备8个汽车同款Autopilot摄像头，最远监测距离可达250米，还有1XTechnologies的前

点击免费查看完整报告

视觉传感器——人形机器人视觉感知交互硬件

你可能感兴趣

传感器专题研究：人形机器人感知交互基础，重视技术路线变化及产业进展

3D视觉、游戏交互，A股MR内容公司梳理;未端触觉与力控，券商称各类传感器是提升机器人性能的核心-1221脱水研报

人形机器人深度之三：更精确的感知，更高效的交互

【风口研报·公司】深耕AI语音多模态技术+海外多个市场份额第一，这家消费电子龙头业绩创历史新高，分析师上调今明年预测;一文拆解人形机器人感知模块，这两个传感器更具投资价值

传感器-人形机器人创造增量需求，多重感知融合推进具身智能发展

人形机器人传感器深度报告：感知无界，智领未来：机器人传感器加速智能进化

【财联社早知道】再发力！抖音携手多家企业发起微短剧合作计划，这家公司制作的首部微短剧已上线备案；工信部2024年要出台未来产业发展行动计划，瞄准人形机器人，这家公司的柔性传感器已应用于感知等多个场景

人形机器人系列之传感器：人形机器人感知层核心，传感器成长可期

评级日报丨3D深度相机是人形机器人主流视觉配置方案！这家公司市占率高，6大3D视觉感知技术能力比肩海外巨头—20250602

“人形机器人的Optimus时刻”系列（七）：视觉感知：从机器视觉到“机器人之眼”