您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[五矿证券]:机械设备:Figure和英伟达GTC的背后有什么技术新动向? - 发现报告
当前位置:首页/行业研究/报告详情/

机械设备:Figure和英伟达GTC的背后有什么技术新动向?

机械设备2024-03-22祁岩五矿证券欧***
机械设备:Figure和英伟达GTC的背后有什么技术新动向?

Figure和英伟达GTC的背后有什么技术新动向? 机械设备 评级:看好 日期:2024.03.22 证券研究报告|行业点评 事件描述 2024年3月1日,Figure官宣与OpenAI、微软达成合作。2024年3月13 日,Figure发布视频展示了与OpenAI合作后的进展。 2024年3月19日,英伟达举行GTC2024。本次GTC上,NVIDIA发布了自己的人形机器人方案。 事件点评 Figure是谁?Figure2022年成立,希望通过通用的人形机器人创造一个更好的未来。Figure的成员来自波士顿动力、特斯拉、谷歌DeepMind等公司。 Figure这次视频的亮点是什么?我们认为这次figure视频有四大亮点:1)语义理解能力,显示出Figure进入家庭场景的可能;2)手部动作的鲁棒性 (即robust,衡量承受干扰的能力),可用性大幅提升;3)动作的流畅性,模型层面将“大脑”和“小脑”进行了区隔,同样意味着可用性大幅提升;4)从像素到动作的端到端模型,或许意味着未来用人类视频训练机器人的路径打开。 我们认为,人形机器在数据来源、控制周期、鲁棒性上都有了明显进展,后续产业发展的卡点已经从科学问题转为了工程问题。 Figure怎么看人形机器人的商业化进程?Figure认为未来人形机器人的发展会和自动驾驶类似,在物流、工厂等场景率先应用,家庭场景则更具挑战。 2030年可能看到人形机器人在家庭场景的应用。现阶段人形机器人的硬件供应面临极大挑战,没有现成的成熟方案。 NVIDIA在本次GTC发布了什么?在人形机器人领域,NVIDIA发布的产品包括:1)人形机器人通用模型GR00T;2)人形机器人专用仿真平台IssacSim;3)统一的计算资源调度平台OSMO;4)人形机器人专用芯片jetson Thor。 本次GTC的影响是什么?1)黄仁勋在2023年就表示过AI的下一个浪潮是具身智能。本次NVIDIA发布多款具身智能相关产品,是对行业趋势的再一 次确认。2)本次GTC发布的产品意味着NVIDIA为具身智能搭建的“基础设施”初步成型,模型开发、部署难度大大降低,行业后续有望加速发展。 投资建议 建议从两个方向进行布局:1)关键的核心零部件,建议关注触觉传感器、力 /力矩传感器、谐波减速器、行星减速器、滚柱丝杠等。2)2025年特斯拉optimus有望进入量产阶段,预计相关零部件将陆续进入定点阶段,建议关注与特斯拉形成较强绑定关系的供应商。 分析师祁岩 登记编码:S0950523090001:021-61102527 :qiyan1@wkzq.com.cn 行业表现2024/3/21 4% -3% -9% -16% -22% -29% 2023/32023/62023/92023/12 机械设备沪深300 资料来源:Wind,聚源 相关研究 《人形机器人报告(一):大模型视角下人形机器人的现在和未来》(2023/12/19) 《特斯拉发布optimusgen2视频点评》 (2023/12/15) 《工信部印发《人形机器人创新发展指导意见》点评》(2023/11/8) 风险提示:1.人工智能技术仍在快速发展阶段,软硬件都在持续迭代中,行业发展存在较大技术风险。 2.人形机器人作为新兴产业,产业链尚不成熟,可能阻碍产品的商业化落地。 Figure的背后:人形机器人后续卡点从科技问题转为工程问题 2024年3月1日,Figure官宣与OpenAI、微软达成合作。2024年3月13日,Figure发布视频展示了与OpenAI合作后的进展。 我们认为,从本次figure的视频可以看出来,人形机器人产业在数据来源、控制周期、鲁棒性(即robust,衡量承受干扰的能力)上都有了明显进展,后续行业发展的卡点已经从科学问题转为了工程问题。 Figure是谁 Figure2022年成立,目标是通过通用的人形机器人创造一个更好的未来,其公司使命是“用高级AI扩展人类的能力”。Figure的成员来自波士顿动力、特斯拉、谷歌DeepMind和空中出租车公司ArcherAviation等公司。 创始人BrettAdcock。Brett是一个连续创业者,之前创立了Vettery(一个线上人才市场公司,2018年以1.1亿美元的价格被收购,后来改名为Hired)和Archer(电动航 空公司,主要开发一种电动垂直起降飞机,用于城市空中移动)。 联合创始人、首席技术官JerryPratt。JerryPratt之前是IHMC(人类与机器认知研究所)的首席研究员,也是DARPA机器人挑战赛中TeamIHMC的团队负责人。 机器人控制主管MichaelRose。MichaelRose是前波士顿动力/苹果工程师 AI团队负责人CoreyLynch。CoreyLynch是前谷歌Deepmind的AI研究员。Google 的机器人模型Palm-E的团队成员中,就有CoreyLynch的身影。 Figure至今已经获得了3轮融资。 2023年4月,Figure获得AliyaCapitalPartners等10家投资者的7000万美元A轮融资。 2023年7月17日,Figure获得BigSkyPartners和IntelCapital的900万美元融资。 2024年2月23日,Figure获得亚马逊创始人贝索斯,以及微软、英伟达、OpenAI等公司的6.75亿美元融资。 图表1:Figure获得6.75亿美元融资的投资方 资料来源:Figure,五矿证券研究所 从2023年10月以来,Figure陆续公布了自己的研究进展。 2023年10月Figure发布了代号为Figure01的首款人形机器人。Figure01重约60kg,负载能力20kg,行走速度1.2m/s,单次运行时间5h,采用电驱动的方式运行。 图表2:Figure01的参数 资料来源:Figure,五矿证券研究所 2024年1月,Figure发布了一个煮咖啡的视频。在煮咖啡的视频中,Figure展示了调整角度放置咖啡胶囊的能力。这显示出Figure01手部动作具有良好的灵巧性和鲁棒性。 图表3:Figure01煮咖啡图表4:Figure01调整咖啡胶囊的放入角度 资料来源:Figure,五矿证券研究所资料来源:Figure,五矿证券研究所 2024年1月,Figure宣布和BMW签署协议,Figure将在BMW的工厂部署人形机器人。初期,Figure01将专注于五项特定的薄板金属处理任务,之后会引入包括箱子搬运、拾取和放置任务、托盘装载等重复性任务。 2024年2月,Figure公布了Figure01在仓库进行搬运的视频。视频展示了Figure的自主导航能力和视觉检验能力、任务优先级排序能力。 图表5:Figure01拿起盒子图表6:Figure01放下盒子 资料来源:Figure,五矿证券研究所资料来源:Figure,五矿证券研究所 2024年3月,Figure发布视频展示了与人对话的能力,以及抓取苹果、对桌面进行整理的能力。 图表7:Figure01将纸团放入盒子图表8:Figure01放下盒子 资料来源:Figure,五矿证券研究所资料来源:Figure,五矿证券研究所 Figure的亮点有哪些?意味着什么? 我们在之前的报告《大模型视角下人形机器人的现在和未来》中提到,目前人形机器人行业还有几个比较重要的痛点、难点,包括1)机器人的控制周期慢,动作迟缓;2)成功率不高,鲁棒性有所欠缺;3)训练数据缺乏。在本次Figure的身上,我们看到这些痛点、难点都在被一一克服。Figure01以下几点让我们印象深刻: 语义理解能力 借助于OpenAI的能力,Figure展示出了非常强的语义理解能力。研究人员询问figure01“有没有什么食物?”,Figure01可以把桌子上唯一的苹果递给研究人员,并解释“这是桌子上唯一可以吃的东西”。强大的语义理解能力是人形机器人走进家庭场景的前提。 手部动作的鲁棒性 研究人员把一堆纸团扔在桌子上,figure可以准确抓取并放回盒子中。在研究人员“扔”的过程中,纸团的位置、状态是有随机性的,无法事先预编程。这也就展示了,figure01的手部动作有比较好的鲁棒性,可以根据实际情况随时调整。 动作的流畅性 Figur01搭载的是一个端到端的模型——Figure以10Hz的速度输入图像,并把像素转变为24Dof的动作。但目前端到端模型的响应速度依然是一个瓶颈。Google的RT系列模型只能做到3Hz的响应频率。这就导致从外界来看机器人的动作非常迟缓。而Figure01在模型层 面实现了“大脑”和“小脑”的区隔,实现了200Hz的输出频率,整个动作非常流畅。Figure的最上层是OpenAI的模型,主要是做一些语义理解、任务拆分的工作。之后OpenAI的模型把指令给到Figure自研的端到端神经网络,神经网络会以200Hz输出一些列动作,被称为high-rate“setpoint”。接着Figure01会调用传统的WBC模型,用WBC模型去跟踪high-rate“setpoint”。 图表9:Figure01模型 资料来源:Figure,五矿证券研究所 从像素到动作的端到端模型 Figure的AI负责人CoreyLynch解释figure01的端到端模型是从像素到动作。也就是说,未来figure01很有可能利用互联网上大量的人类视频作为数据来源进行训练,从而解决人形机器人数据不足的问题。Meta也在尝试类似的方案。MetaAI推出了一种新算法,使机器人能够通过观看YouTube视频来学习和复制人类行为 综合以上几点,我们认为,人形机器在数据来源、控制周期、鲁棒性上都有了明显进展,后续发展的卡点已经从科学问题转为了工程问题。比如零部件如何快速降本?零部件的使用寿 命如何保障?如何快速扩大人形机器人的使用场景? Figure怎么看人形机器人的商业化进程? Figure的创始人BrettAdcock曾接受过一段访谈。Brett谈到了很多对人形机器人商业化进程的观点。Brett强调了人形机器人的发展会和自动驾驶类似,在物流、工厂等场景率先应用,家庭场景则更具挑战。我们将Brett观点整理如下: 一个人形机器人大约有1000个零件,一个电动汽车可能有大约1万个零件。长期来看,一个人形机器人的成本应该低于一台廉价电动汽车。 如果我们的目标是全球范围内投放100万台机器人,可能需要5年或者10-12年的时间,并且主要在后半段投放。 接下来的10-20年里,机器人业务的发展将与自动驾驶汽车的发展路径类似。人形机器人也会首先解决相对容易的问题,比如在预知环境和任务的情况下搬运货物。在家中烹饪或照顾老年人,就像在城市街道上驾驶,更具挑战性。 现在大部分时间都投入到了机器人在物流方面的应用,也在一些大型汽车制造商上花费了不少时间 2030年左右,我们有可能看到人形机器人在家庭环境中的广泛应用。 硬件供应非常困难,很多决定都取决于硬软件的供应链情况。如果我们真的想做出实现高性能、高可靠性、高安全性和低成本的人形机器人,就需要开发自己的执行器、电子设备、电池和几乎所有软件,因为这些都没有现成的解决方案。 Figure所有的短期、低级别的处理都在机身上操作。对于一些不需要高带宽、不必担心延迟问题的任务,例如规划机器人的下一步行动等高级行为,这些任务可以在云端进行处理。 英伟达GTC的背后:具身智能的“基础设施”初步成型 2024年3月19日,英伟达举行GTC2024。本次GTC上,NVIDIA发布了自己的人形机器人方案,包括:1)人形机器人通用模型GR00T;2)人形机器人专用仿真平台IssacSim;3)统一的计算资源调度平台OSMO;4)人形机器人专用芯片jetsonThor。 我们认为,这意