一、定义及分类 具身智能是指一种具备自主决策和行动能力的机器智能,它可以像人类一样感知和理解环境,通过自主学习和适应性行为来完成任务,是一种新型智能形态。业内人士针对具身感知提出了PIE方案,包含了具身感知、具身想象和具身执行三个模块。 二、行业政策 1、国家层面相关政策 具身智能被许多业内人士视作人工智能的终极形态,而人形机器人是具身智能最佳物理形态。为抢占具身智能产业制高点,我国政府部门发布了一系列政策,鼓励研发人形机器人及人工智能技术。 如2023年11月,工业和信息化部发布了《人形机器人创新发展指导意见》,明确提出到2025年,人形机器人创新体系初步建立,“大脑、小脑、肢体”等一批关键技术取得突破,确保核心部组件安全有效供给。整机产品达到国际先进水平,并实现批量生产,在特种、制造、民生服务等场景得到示范应用,探索形成有效的治理机制和手段。 2、地方层面相关政策 北京市、上海市等地也相继出台政策,将具身智能列为人工智能重点研发方向。上海市经济信息化委、上海市发展改革委等部门在2023年10月出台了《上海市促进智能机器人产业高质量创新发展行动方案(2023-2025年)》,明确表示要重点攻关具身智能等先进技术。通过模仿学习和强化学习训练构建机器人运动控制大模型,实现小脑能力。以通用多模态大模型为基础,构建多模态感知规划大模型,实现大脑能力。搭建包含机器人动作库、物体知识库和数据采集平台的具身数据中心,建立模拟机器人运行环境与机器人感知、运动信息的验证仿真中心和具身算力中心。 三、行业壁垒 1、技术壁垒 行业存在较高的技术壁垒。具身智能属于技术密集型产业,技术研究和应用涉及多个领域知识,包括机器人技术、计算机视觉、自然语言处理、物理学(仿真)等,这要求企业具备强劲的研发实力与创新能力,需要经过长期的技术积累。 2、人才壁垒 人才是推动行业发展的重要元素,具身智能技术研发需要高端技术人才的支持,尤其是掌握多领域专业知识和技能的复合型人才。目前,高端人才供不应求是全球具身智能产业发展面临的共同问题,人才引进难、培养周期长等问题导致行业人才壁垒凸显。 3、资金壁垒 具身智能作为一项前沿技术,具有技术壁垒高、研发投入大、开发周期长等特点,企业需要具备雄厚的资金实力才能构建完善的研发团及保障长期持续的研发投入。同时目前具身智能仍处于初期探索阶段,技术研发面临着较大的不确定性,这也对企业的资金实力提出更高的要求。 四、产业链 1、行业产业链分析 具身智能产业链涉及环节多,上游为零部件供应商及基础设施,包括芯片及处理器制造、无线通信设备制造、传感器制造、机械臂及其他机器人组件制造等,中游为软件开发及系统集成,涵盖人工智能引擎、软件开发、机器人制造等。下游应用领域广泛,可用于生物制造、航天航空、制造业、物流运输等行业。 2、行业领先企业分析 (1)南京埃斯顿自动化股份有限公司 埃斯顿成立于1993年,业务覆盖了从自动化核心部件及运动控制系统、工业机器人到机器人工作站的智能制造系统的全产业链。近年来,公司不断加强研发投入,2023年上半年公司完成研发投入2.54亿元,占收入比例为11.35%,具身智能作为当前研发热点,公司在该领域也有研发投入。此外公司还参股了南京埃斯顿酷卓科技有限公司,埃斯顿酷卓深耕AI+机器人领域,专注于协作机器人、人形机器人核心部件的研制与销售。 (2)亿嘉和科技股份有限公司 亿嘉和主要从事特种机器人产品的研发、生产、销售及智能化服务,拥有一系列智能机器人技术和产品,可为各行业客户提供多样化的智能产品、智能服务和系统解决方案。2023年前三季度,亿嘉和营业收入为3.83亿元,同比下降35.16%。主要系公司在2022年底的储备在手机器人订单较往年有所下滑,及2023年度获取的订单仅部分转化为营业收入,同时公司在商用清洁、新能源充电、轨道交通等新行业领域的部分产品业务已产生一定营收,但尚未形成规模化收入。亿嘉和已在具身智能机器人领域开展相关布局,宣布与腾讯云全方位深度合作开发具身智能机器人,公司在2023年12月,申请了一种具身智能机器人的通用系统、构建方法及使用方法的专利。 五、行业现状 具身智能可以应用于多种形态的硬件设备,机器人、无人汽车、无人机等都可作为具身智能的载体,其中人形机器人是具身智能最佳物理形态。2023年以来,在政策大力推动与头部企业引领下,人形机器人产业发展驶入快车道,市场热度高涨,商业化落地加速。2022年10月,特斯拉首款人形机器人“擎天柱”原型机正式亮相。2023年7月,傅利叶智能发布了一款采用电驱动技术的通用人形机器人GR-1。2023年8月,智元机器人发布了自主研发的人形机器人样机“远征A1”。未来随着技术不断突破,人形机器人有望深入各细分消费端,成为AI下一个重要落地应用场景。2022年中国人形机器人市场规模为46.5亿元,预计到2028年中国人形机器人市场规模将超过600亿元。 六、发展因素 1、有利因素 (1)多模态大模型为具身智能的技术瓶颈突破提供了重要驱动力 具身智能是人工智能、机器人等各技术分支融合发展的必然结果,部分研究者尝试将多模态的大语言模型作为人类与机器人沟通的桥梁,即通过将图像、文字、具身数据联合训练,并引入多模态输入,增强模型对现实中对象的理解,从而更高效地帮助机器人处理具身推理任务,一定程度提升了具身智能的泛化水平。因此,GPT等AI大模型为具身智能的自我感知和任务处理的优化升级提供了新的研究手段。 (2)人形机器人的逐步完善为具身智能的落地提供了方向 具身智能最大的特质就是能够以主人公的视角去自主感知物理世界,用拟人化的思维路径去学习,从而做出人类期待的行为反馈,而不是被动的等待数据投喂。人形机器人提供了各种基于人类行为的学习和反馈系统,为实现更复杂行为语义提供了迭代的基础和试验场。因此,人形机器人的逐步完善也为具身智能的落地提供了方向,人形机器人也将为具身智能的迭代优化提供方向和空间。 (3)各方资本纷纷入场 具身智能已经成为国际学术前沿研究方向,各大国际学术会议开始越来越多地关注具身智能相关工作,叠加各国为抢占具身智能发展先机,不断加大政策支持力度。在良好的发展环境及广阔的市场前景下,越来越多的企业开始布局具身智能,为产业带来人才、资金等资源,将推动具身智能产业加快发展、核心技术不断突破。 2、不利因素 (1)核心技术尚不成熟 具身智能技术尚处于早期孵化阶段,要实现真正的商业化落地,还存在诸多困难与挑战。首先,计算机视觉、语音识别和自然语言处理等核心技术远未成熟,技术有待进一步突破。其次,真实世界的不确定性和复杂性也增加了具身智能落地的难度,具身智能系统需要具备鲁棒性和适应性,能够在不确定的环境中进行感知、决策和行动,以应对各种情况和变化。 (2)面临着数据和资源方面的挑战 具身智能的落地还面临着数据和资源方面的挑战。为了让具身智能系统能够理解和互动于物理世界,需要大量的训练数据和资源支持。获取和标注这些数据是一项艰巨的任务,尤其是在复杂的现实场景下。同时,构建具身智能系统所需的硬件设备和基础设施也需要投入大量的资源和技术支持。 (3)具身智能相关法律法规和标准体系尚不健全 除技术方面的挑战外,具身智能还会涉及法律合规问题。具身智能设备具有收集、储存和处理个人信息(如面部识别、语音识别等)的能力,这可能导致个人隐私数据等被泄露,给用户带来法律风险。此外,具身智能设备在操作过程中可能发生意外事故,例如对人造成伤害和对财物造成损失等。目前,相关法律法规和标准体系尚不健全,也成为限制具身智能产业发展的因素之一。 七、竞争格局 具身智能技术发展前景十分广阔,越来越多的企业布局具身智能产业链,行业呈现百家争鸣之势。行业玩家基本上可分为三类,分别负责顶层决策的“大脑”(如谷歌的PaLM-E多模态大模型等)、负责核心运控的“小脑”(MPC技术、强化学习技术等)、负责执行动作的“身体”(智元机器 人、优必选等)。从技术成熟度来看,身体(本体/零部件)优于“大脑”优于“小脑”。在本体及零部件各细分领域多已有成熟供应商,发展方向为形态创新及细分技术的迭代,未来也将以规模化及降本为主要驱动。 八、发展趋势 在政策大力支持及企业不断加大研发投入下,针对具身智能系统的机器学习和深度学习算法将得到进一步优化,为具身智能落地应用筑牢技术基础。随着技术不断演变,具身智能体将朝着智能化及多元化方向演进,更多地满足下游应用领域的需求。随着技术应用价值不断释放及市场需求持续增长,具身智能行业规模将不断壮大,产业链供应链也将加速完善,为产业链各环节带来全新发展机遇。