机械设备 2024年12月30日 投资评级:看好(维持) 动作捕捉:人形机器人数据采集利器 ——行业点评报告 孟鹏飞(分析师)熊亚威(分析师)张健(分析师) 行业走势图 mengpengfei@kysec.cn 证书编号:S0790522060001 xiongyawei@kysec.cn 证书编号:S0790522080004 zhangjian1@kysec.cn 证书编号:S0790524060001 29% 14% 0% -14% -29% 机械设备沪深300 低成本方式获得高质量数据是人形机器人大规模量产前要解决的关键问题 人形机器人需要理解并与物理世界进行交互,使用人类运动数据对机器人进行训练,能够提升机器人的灵活性和协调性。泛化能力的提升需要海量的数据,准确复制人类动作则要求数据具备高精度。特斯拉、智元等国内外巨头已纷纷布局数据采集,国内政策也在积极支持。2024年12月27日,北京国地共建具身智能机器人创新数据采集基地亮相,12月28日,上海提出“搭建超大规模城市级的 模拟应用场景,率先赋能具身智能、自动驾驶等大模型实训”。我们认为通过低 2024-012024-052024-09 数据来源:聚源 成本方式,高质量地获取数据对机器人进行训练,是量产前要解决的关键问题。 动作捕捉或是当下人形机器人最主流的数据采集方式 相关研究报告 《人形机器人丝杠走向量产,国产丝杠领跑全球—行业周报》-2024.12.22 《机器狗为首发经济重要分支,民用市场大有可为—行业周报》 -2024.12.15 《大国科技博弈持续,设备及零部件为自主可控基石—行业点评报告》 -2024.12.10 数据采集方式分遥控操作、动作捕捉、大模型三类,动作捕捉能直接将人类动作迁移至人形机器人,具备精度高、数据采集全面等优势,或是当下人形机器人最合适的数据采集方式。动作捕捉系统主要为光学式、惯性式,光学式基于光学 摄像头完成物体捕捉和定位,惯性式则利用惯性传感器测量物体的加速度、方向、倾角等,由于人形机器人在运动过程中涉及检测平衡、跌倒、抗扰需求,采用惯性动作捕捉更为合适。我们以特斯拉采用Movella动态捕捉训练为例,开发人员穿着动捕设备执行任务,惯性传感器捕捉记录数据,传输到平台分析,Movella积累的数据库也可供机器人开发使用,因而可以看出硬件设备、软件开发、大数据构成动捕企业的核心竞争力。目前,动作捕捉下游以电影制作、游戏开发等为主,2022年市场空间仅为58亿元,我们假设未来2-3年单个人形机器人本体企 业使用1000台进行训练,1000台,则有望为动捕市场带来500亿增量空间。 动捕核心是由数据集、传感器(高精度IMU)、算法库构建的系统解决方案我们认为三类企业有望充分受益:1、能提供整套系统解决方案;2、有大量案例和数据积累;3、核心是传感器(高精度IMU和力传感器)。相关上市公司梳理如下:(1)诺亦腾:奥飞娱乐投资的公司,与NVIDIAIsaac合作,实现了动 作捕捉系统与NVIDIAIsaacSim的数据联通,产品已用于智元机器人、千寻智能。(2)世优科技:捷成股份投资,惯导动捕已大量应用于数字人,具备丰富数据库积累,与北京大学共同成立“数字人训练联合实验室”。(3)凌云光:全资 子公司元客视界推出AI动捕产品FZmotion,已经服务宇树科技、优必选、小米等客户。(4)利亚德:旗下公司虚拟动点拥有大量高品质动作数据和光学动作捕捉产品,与松延动力合作成立了“具身智能机器人联合实验室”。(5)天娱数科: 通过投资银牛微电子、芯明智能布局动作捕捉硬件,构建了丰富动作库和表情库的多模态数据集,子公司智境云创与西安交通大学携手共建空间智能研究中心。 受益标的 (1)动捕系统:奥飞娱乐、捷成股份、凌云光、利亚德、天娱数科;(2)IMU:芯动联科、敏芯股份、苏州固锝。 风险提示:人形机器人数据采集发展不及预期;动作捕捉技术发展不及预期。 行业研 究 行业点评 报告 开源证券 证券研究 报告 目录 1、低成本方式获得高质量数据是人形机器人大规模量产前要解决的关键问题3 2、动作捕捉或是当下人形机器人最主流的数据采集方式5 3、动捕核心是由数据集、传感器(高精度IMU)、算法库构建的系统解决方案7 4、投资建议11 5、风险提示11 图表目录 图1:大规模、高质量、低成本的采集数据是当前人形机器人发展的关键3 图2:特斯拉构建动作捕捉数据采集训练场4 图3:智元计划打造全球最大机器人生产与数据采集基地4 图4:北京国地共建具身智能机器人创新中心数据采集基地亮相5 图5:光学动作捕捉可用于影视制造6 图6:基于IMU传感器的动作捕捉采集6 图7:特斯拉采用Movella动态捕捉进行训练6 图8:人形机器人有望为动态捕捉市场带来500亿新增市场空间7 图9:Movella是全球领先的硬件(传感器等)、软件和数据分析解决方案供应商,系统性优势突出8 图10:诺亦腾具备机器人训练整体解决方案9 图11:世优科技布局动捕设备9 图12:元客视界推出的AI动捕产品FZmotion10 1、低成本方式获得高质量数据是人形机器人大规模量产前要解决的关键问题 数据是人形机器人AI/具身智能与传统AI的最大区别之一。AI三大支柱为算 法、算力、数据。传统AI训练主要依靠图文,互联网为传统AI算法训练提供了海量且廉价的图文数据。然而,具身智能需要深入地理解和交互物理世界。3D数据集能提供精确的空间信息,使机器人能够准确地感知和理解三维场景中的物体、空间关 系以及动态变化。现成的3D数据有限,数据采集是机器人AI提升的关键。 数据量提升是人形机器人通用性提高的重要途径。人形机器人追求的是能够像人类一样思考、运动,精确地模仿人类动作是实现这一目标的重要路径。高质量的人类运动训练数据能提升机器人的灵活性和协调性。相比于工业机器人仅具备处理 单一或有限范围问题的能力,通过精确编程实现。人形机器人面向更广泛、更多样的泛化任务。泛化能力提升需要海量的3D数据进行训练。 数据精度直接影响到机器人准确复制人类动作的能力。即使是运动数据中的微小错误,也可能导致机器人误操作或损坏,尤其是在需要精细运动技能的任务以及与人的互动过程中。 因此,大规模、高质量、低成本的数据采集是当前人形机器人发展的关键。图1:大规模、高质量、低成本的采集数据是当前人形机器人发展的关键 资料来源:开源证券研究所 国内外机器人厂商争相布局数据采集: (1)特斯拉构建动作捕捉数据采集训练场。在2023年股东大会上,特斯拉在视频中展示了通过使用动作捕捉技术“训练”机器人进一步了解真实世界中的各种场景。在数据采集过程中,穿着XsensLink动作捕捉套装的“演员”会执行一系列任务,其全身运动数据被记录下来。 图2:特斯拉构建动作捕捉数据采集训练场 资料来源:Movella (2)智元计划打造全球最大机器人生产与数据采集基地。2024年12月15日,智元机器人宣布通用机器人商用量产,并表示将力争打造全球最大机器人生产与数据采集基地。在数据采集基地内,智元搭建多个人类生活空间的模拟场景,涵盖家庭生活中的卧式、客厅、卫生间等,上百台机器人每日可产数万条机器人真机数据和仿真环境数据。 图3:智元计划打造全球最大机器人生产与数据采集基地 资料来源:人形机器人联盟 国内政策支持加快数据采集发展: (1)国地共建具身智能机器人创新中心数据采集基地亮相。2024年12月27日,国家地方共建具身智能机器人创新中心与北京大学计算机学院联合推出大规模多构型智能机器人数据集,该数据集包含5.5万条机器人轨迹数据,涉及279项不同 的任务,涵盖高达61种不同的物体,覆盖了家居、厨房、工厂、办公、零售等大部分生活服务场景。 图4:北京国地共建具身智能机器人创新中心数据采集基地亮相 资料来源:国地共建具身智能机器人创新中心公众号 (2)上海要求加快建设虚实融合超大型实训场。2024年12月28日,上海市人民政府办公厅印发了《关于人工智能“模塑申城”的实施方案》,明确要求“依托头部企业和科研机构,打造虚实融合的超大型实训场,建设支撑实训场的高性能计算集群、高精度三维建模和高质量训练数据集,创建与物理实体对应的高精度仿真环境和仿真训练系统,搭建超大规模城市级的模拟应用场景,率先赋能具身智能、自动驾驶等大模型实训。” 综上,我们认为随着人形机器人/具身智能场景增多,对低成本采集高质量数据需求逐步增多,国内政策支持,海内外巨头纷纷布局,人形机器人数据采集产业有望迎来快速发展机遇。 2、动作捕捉或是当下人形机器人最主流的数据采集方式 人形机器人数据采集方法包括遥控操作、动作捕捉和大模型三大类,而将动作捕捉与AI学习算法结合,正使得人形机器人越来越多地高精度模仿人类动作。 动作捕捉的基本原理是开发人员重复执行任务,对应他的每个动作将被动作捕捉技术仔细捕捉,远程操作过程中,人形机器人将将在开发人员旁边执行相同的操作,并通过记录的动作数据学习如何移动,因而动作捕捉采集的运动数据精度更高,才能能力更全面。 由于数据精度对人形机器人训练非常重要,它将直接影响机器人准确复制人类动作的能力,任何不准确的数据都会加剧学习的错误,导致低效或不准确的动作,因而AI利用动作捕捉创建的模型,可以使机器人可以非常准确地模仿人类的动作,并帮助机器人学习如何与周围环境互动。 动作捕捉按技术原理主要分为光学式、惯性式。(1)光学式基于光学原理完成物体捕捉和定位,通常借助整套光学摄像头完成动作捕捉。(2)惯性动作捕捉:利用惯性传感器测量被测物体的加速度、方向、倾斜角度等。人形机器人在运动过程中,更多涉及检测平衡、跌倒、抗扰的需求,因而采用惯性动作捕捉可实现更精准 的数据采集。 图5:光学动作捕捉可用于影视制造图6:基于IMU传感器的动作捕捉采集 资料来源:度量科技官网资料来源:感织技术公众号 我们以特斯拉采用Movella动态捕捉进行训练为例。开发人员穿着Movella的Xsens动作捕捉套装执行一系列任务,此时惯性传感器会实施捕捉并记录人体运动及数据,这些数据可以在Movella自主研发的软件中实时体现,并可以同步到其他平台,此时可获得全面的运动数据,包括角速度、重心关节角度以及各部位的运动速度和加速度,为进一步的开发和应用提供可能。此外,Movella积累的强大数据库也可以直接为特斯拉提供训练数据,供机器人开发使用。 图7:特斯拉采用Movella动态捕捉进行训练 资料来源:Movella、开源证券研究所 因此,动态捕捉企业除拥有传感器、整套动捕装备研发生产能力外,在软件SDK 开发,以及大数据的积累也是企业的核心能力。 动态捕捉目前的下游包括电影制作、游戏开发、医疗健康、教育培训等,中研网数据显示2022年动态捕捉市场规模为58亿元。 我们参考特斯拉计划在2025年实现千台级别的量产,并且将在2026年开始对 外销售,智元机器人已下线超900台,假设2027年单个人形机器人本体企业量产1000 台,每台进行1对1动作捕捉训练,则单家机器人头部企业将采购1000套动态捕捉 设备,按照单台设备价值量50万元,采购企业数量100家计算,则人形机器人有望 为动态捕捉市场带来500亿空间,较2022年实现近10倍空间扩容。 图8:人形机器人有望为动态捕捉市场带来500亿新增市场空间 500 58 600 500 400 300 200 100 0 2022预计2027年人形机器人带来的新增市场规模 中国3D动作捕捉市场规模(亿元) 数据来源:中研网、开源证券研究所 3、动捕核心是由数据集、传感器(高精度IMU)、算法库构建 的系统解决方案 全球动作捕捉系统市场代表形成了以Movella为代表的国际知名厂商,其在技术研发、产品性能、数据整合的方面具备显著优势,占据市场主导地位。国内也逐步涌现以诺亦腾、世优科技、凌云光、利亚德、天娱数科等一批具备竞争力的3