AI智能总结
报告要点 人形机器人的核心价值在于通用+智能,将和工业机器人共同推动制造业智能化。工业机器人虽然技术成熟,但却无法解决泛化性的问题,不适应现 代制造业柔性生产的需要。我们认为人形机器人将作为工业机器人的补充,与 工业机器人共同推进制造业的智能化发展。“人形”只是表象,人形机器人 的核心价值在于通用+智能。未来的工厂中,工业机器人、人形机器人、人工 或将以7:2:1的比例存在。 以GPT为代表的大模型是迈向通用人工智能AGI的重要一步。之前的人工智能属于专业AI,走的是“先专后通”的发展路径。而以GPT为代表 的大模型具备了一定的常识和推理能力,有望走出一条“先通后专”的发展 路径。而具备控制、感知、执行能力的AI Agent是大模型落地的重要形式。 资料来源:Wind,聚源 LLM与机器人结合的研究在短时间取得了众多突破,让我们对产业化多了一份信心。我们把人形机器人视为LLM+机器人领域的AI Agent。LLM的引入解决了之前机器人行业的两大痛点:1)交互不便,无法理解人类的自然语 言;2)不够聪明,无法对复杂任务自主拆解。在LLM与机器人结合方面,学界取得了众多进展。Google在2022年发表的SayCan模型,解决了LLM作为语言模型无法适应现实世界的问题;2022年12月,google发布RT-1模型,使人形机器人表现出了泛化性,可以解决未训练场景的任务;2023年2月,微软发表ChatGPT for Robots,提出用LLM语言模型控制机器人的方 法,使机器人可以利用LLM模型的“常识”和推理能力;2023年3月,google发布PaLM-E模型,把具身信息融入大模型,进一步提升了泛化能力;202 3年7月,google发布视觉-语言-动作(VLA)的机器人模型RT-2,模型 直接输出机器人的动作,泛化能力进一步增长,并为解决机器人数据缺乏问题 提供了一种新的思路。 《特斯拉发布optimus gen2视频点评》(2023/12/15) 《工信部印发《人形机器人创新发展指导意见》点评》(2023/11/8) 人形机器人的商业化落地需要具体的场景。当前人形机器人产业面对数据不足、算力不足、人机交互安全性、长尾场景等挑战,终极的通用人形机 器人还比较遥远,但是基于特定场景的人形机器人可以降低对数据、算力的依 赖,有望率先落地。2023年10月,亚马逊宣布已经在仓库试用人形机器人Digit。 自动驾驶与人形机器人有众多相似之处,自动驾驶的发展历程有借鉴意义。 何小鹏认为,自动驾驶本质上是机器人科学,智能汽车公司最终也会和机器人公司在技术、产品、生态等等方面融合。参考自动驾驶的发展历程,我们认为人形机器人的发展也会有3个趋势:1)终极的人形机器人还很遥远,但基于特定场景的机器人会率先落地;2)随着人形机器人对大数据、大模型的要求越来越高,数据闭环能力越来越关键;3)端到端模型可以节省算力,但当前受限于数据、规模。区分规划算法、控制算法的多模块的方案更容易落地,其中连接LLM和控制算法的prompt是瓶颈所在。 内容目录 人形机器人的核心价值来自通用性................................................................................................................4大模型加速人形机器人产业化落地................................................................................................................6技术和成本限制人形机器人的产业化.............................................................................................................6LLM:人工智能迈出走向AGI的重要一步......................................................................................................9人形机器人:机器人领域的AI Agent...........................................................................................................15人形机器人的落地需要具体场景..................................................................................................................22未来推演:自动驾驶发展历程给人形机器人的启示..................................................................................25自动驾驶在港口、矿山已经取得进展...........................................................................................................25大数据+大模型驱动的方案成为趋势.............................................................................................................27端到端的大模型或是终极方案......................................................................................................................29风险提示..........................................................................................................................................................31 图表目录 图表1:工业机器人市场规模....................................................................................................................................................................................4图表2:工业机器人在不同行业、不同场景的应用成熟度....................................................................................................................................4图表3:汽车总装线依然大量依赖人工....................................................................................................................................................................5图表4:谷歌everyday robot(左)、波士顿动力Spot(中)和特斯拉Optimus(右)...............................................................................6图表5:2022年比亚迪员工人数..............................................................................................................................................................................6图表6:ASIMO机器人的前身..................................................................................................................................................................................7图表7:ASIMO机器人可以完成倒水任务..............................................................................................................................................................8图表8:ASIMO机器人可以做出各种手势..............................................................................................................................................................8图表9:波士顿动力推出的代表性产品....................................................................................................................................................................8图表10:AI发展的三次浪潮...................................................................................................................................................................................10图表11:生成式AI发展历程..................................................................................................................................................................................10图表12:公元前9000年至今的通用目的技术(GPT)....................................................................................................................................11图表13:AI Agent通过与真实世界交互,构建了完整的“感知-认知-执行”的信息闭环..................................................................................12图表14:复旦大学团队