您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中泰证券]:人形机器人行业运控专题:从“做出来”到“卖出去” - 发现报告

人形机器人行业运控专题:从“做出来”到“卖出去”

机械设备2025-03-11中泰证券顾***
人形机器人行业运控专题:从“做出来”到“卖出去”

中泰证券研究所专业领先深度诚信 证券研究报告 从“做出来”到“卖出去” 人形机器人运控专题 2025312 分析师:王可 执业证书编号:S0740519080001Email:wangke03ztscomcn 1 目录 CONTENTS 1 人形机器人小脑(运控)介绍 小模型性价比凸显 2 小脑在垂直场景有望率先成熟, 3 谁有望抢占小脑发展的制高点? 动捕企业 4 投资逻辑:聚焦二开本体厂商及 1 人形机器人小脑(运控)介绍 人形机器人“小脑”:目前产业界对人形“小脑”的定义并没有形成统一共识,一般认为“小脑”就是运动控制,即由软硬件构成,硬件包括控制器、驱动系统、编码器等,软件主要为部署在硬件上的控制和感知算法等。人形运控与传统运控最大的区别在于:后者是根据已编程好的轨迹去完成实时控制,而前者需要通过各种场景的实时判断来生成实时运动轨迹(即AI大模型训练学习后,实时生成运控轨迹的指令),进而实现控制。 图表1机器人“小脑”构成 来源:雷赛智能招股书、中泰证券研究所整理 “小脑”的主要功能:与“大脑”主要负责环境感知和智能交互不同,“小脑”更多地关注于机器人的运动控制和平衡调节,通过接收来自传感器(如视觉传感器、力觉传感器、触觉传感器等)的信息,对这些信息进行处理和分析,进而指导机器人的运动。主要功能可以分为四类:运动执行、协调运作、反馈调节和动态平衡。 图表2人形机器人“小脑”主要功能 来源:茶派科技公众号、中泰证券研究所绘制 包括三类:模型控制(MPC)。基于精确的运动学和动力学模型,实现对机器人动作的精准控制,适用于特定任务的自动化执行,即传统运控范畴。强化学习。通过在复杂环境中的自主探索,学习最优控制策略,显著提升了上肢和下肢在复杂任务中的效率、精度和适应性。模仿学习。通过模仿人类行为,减少对环境探索的依赖,利用人类行为数据训练智能体(动捕是关键,即数据获取),显著提升任务执行能力。 图表3“小脑”的控制技术介绍 来源:《人形机器人技术与产业发展研究》、中泰证券研究所绘制 北京理工大学 模仿学习采用模仿学习算法,以人机关节轨迹相似为目标,通过非线性最优化求解的动作映射,规划出合理的运动方案 13、人形机器人“小脑”案例 案例:目前业界基于强化学习和模仿学习已进行多种尝试,以美国AgilityRobotics的Digit机器人为例,其利用强化学习算法,通过在仿真环境中不断进行训练和优化,学习各种运动技能(行走、奔跑、转弯、上下台阶)。在实际应用场景中,Digit机器人与亚马逊合作,负责仓库物流,能够根据环境的变化和任务需求,自主规划路径,快速准确地完成物品的搬运和分拣。Digit在物流领域中的成功应用,不仅提高物流效率,还降低人力成本,为物流行业的发展带来了新的解决方案。 图表4人形机器人制造商“小脑”环节方案(部分) 制造商 产品名称 控制技术 控制系统方案 本田 ASIMO机器人 模仿学习 基于零力矩点(ZMP)判据及预观控制算法,通过精确计算零力矩点(ZMP),规划机器人的运动轨迹,确保在行走和运动过程中保持平衡和稳定 AIST 模仿学习 通过ZMP判据及预观控制算法,实现对自身运动的精确控制,确保在不同的工作场景下都能稳定、高效地完成任务 AgilityRobotics Digit机器人 强化学习 利用强化学习算法,通过在仿真环境中不断进行训练和优化,学习各种运动技能 来源:茶派科技公众号、中泰证券研究所整理 其他方面 “小脑”在与感知、决策和规划的结合方面存在不足,这些环节往往存在脱节的现象,导 致机器人的整体性能受到影响,严重阻碍了构建端到端的自主系统。 14、人形机器人“小脑”面临的挑战 挑战:主要包括如何进一步提高AI模型在机器人控制中的实时性、鲁棒性和可解释性,以确保机器人在复杂环境中的稳定运行和安全可靠。此外,如何将控制与感知、决策和规划更紧密地结合,构建端到端的自主系统,亦是未来重要的研究方向。 图表5“小脑”面临的挑战 面临的问题详细内容 实时性问题 机器人需要对环境变化做出快速响应,但在复杂环境中快速行走、躲避障碍物或与人类进行实时交互时,大模型的计算和推理过程可能会产生较大的延迟。实时性问题的产生主要源于大模型的复杂性和计算量。 鲁棒性难题现实世界中,环境容易变化,如光线、温度、地形、障碍物分布等,这些因素都会对机器人的运动控制产生影响,进而导致运动规划和控制出现偏差。 可解释性缺失 AI的告诉发展使得越来越多复杂算法和模型被应用于机器人的运控中,但它们往往是黑盒模型,难以理解其决策过程和输出结果的依据。 来源:茶派科技公众号、中泰证券研究所整理 小脑在垂直场景有望率先成熟,小模型性价比凸显 21、人形机器人落地难度和市场规模:ToCToB TOB有望率先落地和放量,原因: 技术适配与需求刚性:B端客户,如工业、医疗、物流等需求明确且结构化,技术更易适配。例如,工厂中的搬运、质检等任务对机器人的运动控制、环境感知能力要求较高,但场景相对封闭,无需复杂的人机交互。ToC场景家庭环境复杂多变,需要高度灵活性与自然交互能力。 成本与价格敏感度:企业用户注重性价比,TOB产品量产万台后价格预计可降至2030万元(以优必选机 器人为例),而C端对性能要求高,目前ToC主流产品售价在99万元65万元(以宇树科技机器人为例)。 政策与法规支持:政策明确支持工业场景开放与标准化;ToC场景下,隐私、安全等伦理问题尚未解决,制约C端场景落地。 ToB场景 ToC场景 应用场景 工业、医疗、物流 作为家庭助手,帮助用户完成家务、陪伴老人和儿童等任务 价格 量产万台后价格预计可降至2030万元 主流产品售价在99万元65万元 销售量 2024年约2000台,预计在2030 、2035年分别达到15万台、8090万台 预计2030、2035年分别达到2万台、120130万台 技术成熟度 谐波减速器传感器国产化率高 双足行走情感交互技术未闭环 图表6:B端和C端机器人场景对比 政策支持 深圳市推出“双一百”政策: 开放100个应用场景与百亿基金持续发力推动人工机器人发展 伦理法规待完善,暂无明确政 策 来源:搜狐网、中国信息通信研究院、中泰证券研究所整理 图表7:人形机器人未来规模预测 来源:思瀚产业研究院,中泰证券研究所绘制 22、TOB场景下,开发统一的底层大模型难度大 机器人下肢:运动关节相对固定,更容易形成一个统一的模型,可以设置“不摔倒、走得快”等作为奖励函数来强化学习。目前主流的下肢算法是英伟达的IssacGim底层算法强化学习。 人形机器人 下肢 机器人上肢:属于精细运动范畴,尤其是灵巧手关节的控制,不同应用场景下运动轨迹的规划千差万别,开发统一的底层大模型面临两大难题:开发难度大,训练成本高,高能耗以及在特定场景下的性能瓶颈等;高质量的训练数据获取难。 图表8:机器人上肢和下肢特征及对应算法 特征 运动关节固定, 有统一底层算法 算法 IssacGim底层 算法强化学习 特征 精细运动,没有 统一底层算法 难题 开发难度大, 训练成本高; 训练数据缺失 上肢 来源:中泰证券研究所绘制 一次开发 一开商 企业:特斯拉、二次开发 华为、宇树、 figuer、1X、 智元等,即平台型企业 二开商 其他 矿山 危化 消防 养老 教育 公司:科大讯飞、优必选等 公司:麦迪科技、欧圣电气等 公司:青鸟消防等 公司:博实股份等 公司:运机集团、华荣股份等 电力、智能家居等领域 人形运控产业 人形运控产业未来将由一次开发一开商和二次开发二开商两部分构成。一开企业如特斯拉、华为、宇树等做人形运控算法的一次开发(即平台型通用机器人企业),类似于iOS之于苹果,不同厂商硬件规格和方案不同,运控算法不兼容,因此运控产业是平台型企业的兵家必争之地;二开企业是应用厂商,类似于APP应用开发商,在一开企业软硬件基础上,开发针对特定应用场景的机器人(如针对教育、养老、消防、危化、矿山、电力、冶金等领域开发机器人)。 图表9:人形运控产业一次开发商和二次开发商的关系 来源:中泰证券研究所绘制 针对特定应用场景开发小模型有望渐成主流。随着Deepseek的出现,通过蒸馏技术缩小模型规模,进而将小模型植入人形端部成为可能,未来特定场景应用的小模型会越来越多。 小模型优势:小模型适用于特定场景,如工业制造、医疗护理、家庭服务等,能显著降低开发与部署成本。相较于通用大模型需要海量数据和算力支持,小模型可以通过迁移学习或微调快速适配特定任务,减少数据标注和训练周期。并且这种针对性的强化学习,使得垂直模型决策逻辑更贴近实际需求。 图表10:小模型优势 优势 主要内容 成本效益显著 大模型的训练成本呈指数增长,从早期Transformer到如今谷歌GeminiUltra模型近2亿美元训练成本。而一些小模型通过精心设计和优化,在保证性能的前提下,极大地降低了训练所需的计算资源和时间成本 部署灵活性高 小模型所需的计算资源和存储空间较少,这使得AI技术能够更贴近用户,实现本地化的智能处理,减少对云端服务器的依赖,提高响应速度 专业性与针对性强 与通用的大模型不同,小模型可以针对特定的专业领域或具体业务需求进行定制化训练,从而在特定任务上展现出卓越的性能。美国生物技术公司PathAI利用小模型在图像处理方面的优势,对病理图像进行自动化分析,辅助医生进行疾病诊断,其专业性和准确性在实际应用中得到了有效验证 能源消耗低 由于小模型的计算复杂度相对较低,对高性能硬件资源的需求较少,因此在运行过程中能耗大幅降低 来源:贤集网、中泰证券研究所整理13 特定应用场景小模型一般是基于通用底层大模型进行的二次开发。为了给模型注入特定领域知识,就需要用该领域内的语料进行继续的预训练,进而通过SFT激发模型理解该领域内各种问题并逐渐具备回答的能力,最后通过RLHF可以让模型的回答对齐人们偏好,比如行文的风格。 图表11:特定应用场景小模型开发的基本思路 来源:机器学习社区、中泰证券研究所 小模型应用案例: 工业质检场景:小模型可基于少量缺陷样本实现高精度识别,开发成本较通用模型显著降低。 医疗护理场景:养老机构中,小模型结合多模态传感器数据(语音、触觉、体温),实现老人跌倒检测与应急响应,误报率降低,响应时间缩短。 家庭服务场景:1X的NEOGamma家用机器人通过垂直模型实现衣物分类与清洁力度自适应调节,识别准确率提升,能耗降低。 农业与物流场景:农业采摘机器人通过小模型识别果实成熟度,结合地形感知调整抓取路径,采摘效率提升,同时损坏率降低。 24、难度:数据采集 行业痛点:人形机器人训练数据严重短缺 数据需求激增:在特斯拉2024年第四季度财报电话会上,马斯克指出,人形机器人所承担的任务及用途,相较汽车自动驾驶而言复杂得多,大概有1000倍之多,所需的训练数据规模也会随之扩大至10倍左右。 数据现状难以支撑训练:目前可用于训练人形机器人的开源数据集,无论是在数量上还是规模上都极为匮乏,难以支撑高效训练。 图表12人形机器人与自动驾驶开源训练数据集大小对比 自动驾驶数据集 数据集描述 人形机器人数据集 数据集描述 Waymo 包含1150个场景、2030个20s片段、1260万个3D标注框 RoboSet 包括7500条轨迹 BDD100K包含10万段40s高清视频OpenX Embodiment Google整合的60个已有机器人数据集, 包含22个机器人的527个技能训练数据 BoxyVehicle包含20万张高分辨率图像 Detection G1 宇树G1人形机器人拧瓶盖倒水、叠三色 积木等5种操作 LyftL5包含1805个场景、46万张图像、约 130万个3D标注框 AgiBotWorld智元机器人开源数据集,涵盖80余种