行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

机械设备：Figure和英伟达GTC的背后有什么技术新动向？

机械设备 2024-03-22 祁岩五矿证券欧阳晓辉

本文主要讨论了Figure和英伟达GTC背后的技术新动向。Figure是一家2022年成立的公司，旨在通过通用的人形机器人创造一个更好的未来。Figure的成员来自波士顿动力、特斯拉、谷歌DeepMind等公司。本文讨论了Figure和英伟达在人形机器人领域的最新进展。Figure在2024年3月1日宣布与OpenAI、微软达成合作，并在3月13日发布了与OpenAI合作后的进展。英伟达在2024年3月19日举行的GTC2024上发布了其人形机器人方案。本文认为，人形机器在数据来源、控制周期、鲁棒性上都有了明显进展，后续产业发展的卡点已经从科学问题转为了工程问题。建议从两个方向进行布局：1）关键的核心零部件，建议关注触觉传感器、力/力矩传感器、谐波减速器、行星减速器、滚柱丝杠等。2）2025年特斯拉optimus有望进入量产阶段，预计相关零部件将陆续进入定点阶段，建议关注与特斯拉形成较强绑定关系的供应商。

事件描述 2024年3月1日，Figure官宣与OpenAI、微软达成合作。2024年3月13日，Figure发布视频展示了与OpenAI合作后的进展。 2024年3月19日，英伟达举行GTC2024。本次GTC上，NVIDIA发布了自己的人形机器人方案。事件点评 Figure是谁？Figure 2022年成立，希望通过通用的人形机器人创造一个更好的未来。Figure的成员来自波士顿动力、特斯拉、谷歌DeepMind等公司。 Figure这次视频的亮点是什么？我们认为这次figure视频有四大亮点：1）语义理解能力，显示出Figure进入家庭场景的可能；2）手部动作的鲁棒性（即robust，衡量承受干扰的能力），可用性大幅提升；3）动作的流畅性，模型层面将“大脑”和“小脑”进行了区隔，同样意味着可用性大幅提升；4）从像素到动作的端到端模型，或许意味着未来用人类视频训练机器人的路径打开。资料来源：Wind，聚源 《人形机器人报告（一）：大模型视角下人形机器人的现在和未来》(2023/12/19)《特斯拉发布optimus gen2视频点评》(2023/12/15)《工信部印发《人形机器人创新发展指导意见》点评》(2023/11/8) 我们认为，人形机器在数据来源、控制周期、鲁棒性上都有了明显进展，后续产业发展的卡点已经从科学问题转为了工程问题。 Figure怎么看人形机器人的商业化进程？Figure认为未来人形机器人的发展会和自动驾驶类似，在物流、工厂等场景率先应用，家庭场景则更具挑战。2030年可能看到人形机器人在家庭场景的应用。现阶段人形机器人的硬件供应面临极大挑战，没有现成的成熟方案。 NVIDIA在本次GTC发布了什么？在人形机器人领域，NVIDIA发布的产品包括：1）人形机器人通用模型GR00T；2）人形机器人专用仿真平台Is s acSim；3）统一的计算资源调度平台OSMO；4）人形机器人专用芯片jet s onThor。本次GTC的影响是什么？1）黄仁勋在2023年就表示过AI的下一个浪潮是具身智能。本次NVIDIA发布多款具身智能相关产品，是对行业趋势的再一次确认。2）本次GTC发布的产品意味着NVIDIA为具身智能搭建的 “基础设施”初步成型，模型开发、部署难度大大降低，行业后续有望加速发展。投资建议建议从两个方向进行布局：1）关键的核心零部件，建议关注触觉传感器、力/力矩传感器、谐波减速器、行星减速器、滚柱丝杠等。2）2025年特斯拉optimus有望进入量产阶段，预计相关零部件将陆续进入定点阶段，建议关注与特斯拉形成较强绑定关系的供应商。风险提示：1.人工智能技术仍在快速发展阶段，软硬件都在持续迭代中，行业发展存在较大技术风险。2.人形机器人作为新兴产业，产业链尚不成熟，可能阻碍产品的商业化落地。 Figure的背后：人形机器人后续卡点从科技问题转为工程问题 2024年3月1日，Figure官宣与OpenAI、微软达成合作。2024年3月13日，Figu re发布视频展示了与OpenAI合作后的进展。我们认为，从本次figure的视频可以看出来，人形机器人产业在数据来源、控制周期、鲁棒性（即robust，衡量承受干扰的能力）上都有了明显进展，后续行业发展的卡点已经从科学问题转为了工程问题。 Figure是谁 Figure2022年成立，目标是通过通用的人形机器人创造一个更好的未来，其公司使命是“用高级AI扩展人类的能力”。Figure的成员来自波士顿动力、特斯拉、谷歌DeepMind和空中出租车公司Archer Aviation等公司。 创始人Brett Adcock。Brett是一个连续创业者，之前创立了Vettery（一个线上人才市场公司，2018年以1.1亿美元的价格被收购，后来改名为Hired）和Archer（电动航空公司，主要开发一种电动垂直起降飞机，用于城市空中移动）。 联合创始人、首席技术官Jerry Pratt。Jerry Pratt之前是IHMC（人类与机器认知研究所）的首席研究员，也是DARPA机器人挑战赛中Team IHMC的团队负责人。机器人控制主管Michael Rose。Michael Rose是前波士顿动力/苹果工程师AI团队负责人Corey Lynch。Corey Lynch是前谷歌Deepmind的A I研究员。Googl e的机器人模型Palm-E的团队成员中，就有Corey Lynch的身影。 Figure至今已经获得了3轮融资。 2023年4月，Figure获得Aliya Capital Partners等10家投资者的7000万美元A轮融资。2023年7月17日，Figure获得Big Sky Partners和Intel Capital的900万美元融资。2024年2月23日，Figure获得亚马逊创始人贝索斯，以及微软、英伟达、Ope nA I等公司的6.75亿美元融资。图表1：Figure获得6.75亿美元融资的投资方从2023年10月以来，Figure陆续公布了自己的研究进展。 2023年10月Figure发布了代号为Figure 01的首款人形机器人。Figure01重约60k g，负载能力20kg，行走速度1.2m/s，单次运行时间5h，采用电驱动的方式运行。资料来源：Figure,五矿证券研究所 2024年1月，Figure发布了一个煮咖啡的视频。在煮咖啡的视频中，Figure展示了调整角度放置咖啡胶囊的能力。这显示出Figure01手部动作具有良好的灵巧性和鲁棒性。资料来源：Figure,五矿证券研究所资料来源：Figure,五矿证券研究所 2024年1月，Figure宣布和BMW签署协议，Figure将在BMW的工厂部署人形机器人。初期，Figure 01将专注于五项特定的薄板金属处理任务，之后会引入包括箱子搬运、拾取和放置任务、托盘装载等重复性任务。 2024年2月，Figure公布了Figure01在仓库进行搬运的视频。视频展示了Figure的自主导航能力和视觉检验能力、任务优先级排序能力。资料来源：Figure,五矿证券研究所资料来源：Figure,五矿证券研究所 2024年3月，Figure发布视频展示了与人对话的能力，以及抓取苹果、对桌面进行整理的能力。资料来源：Figure,五矿证券研究所资料来源：Figure,五矿证券研究所 Figure的亮点有哪些？意味着什么？我们在之前的报告《大模型视角下人形机器人的现在和未来》中提到，目前人形机器人行业还有几个比较重要的痛点、难点，包括1）机器人的控制周期慢，动作迟缓；2）成功率不高，鲁棒性有所欠缺；3）训练数据缺乏。在本次Figure的身上，我们看到这些痛点、难点都在被一一克服。Figure01以下几点让我们印象深刻：语义理解能力借助于OpenAI的能力，Figure展示出了非常强的语义理解能力。研究人员询问figure01“有没有什么食物？”，Figure01可以把桌子上唯一的苹果递给研究人员，并解释“这是桌子上唯一可以吃的东西”。强大的语义理解能力是人形机器人走进家庭场景的前提。手部动作的鲁棒性研究人员把一堆纸团扔在桌子上，figure可以准确抓取并放回盒子中。在研究人员“ 扔”的过程中，纸团的位置、状态是有随机性的，无法事先预编程。这也就展示了，figure0 1的手部动作有比较好的鲁棒性，可以根据实际情况随时调整。动作的流畅性 Figur01搭载的是一个端到端的模型——Figure以10Hz的速度输入图像，并把像素转变为24Dof的动作。但目前端到端模型的响应速度依然是一个瓶颈。Google的RT系列模型只能做到3Hz的响应频率。这就导致从外界来看机器人的动作非常迟缓。而Figure01在模型层面实现了“大脑”和“小脑”的区隔，实现了200Hz的输出频率，整个动作非常流畅。Figu re的最上层是OpenAI的模型，主要是做一些语义理解、任务拆分的工作。之后Open AI的模型把指令给到Figure自研的端到端神经网络，神经网络会以200Hz输出一些列动作，被称为high-rate“setpoint”。接着Figure01会调用传统的WBC模型，用WBC模型去跟踪hig h-rate“setpoint”。资料来源：Figure,五矿证券研究所从像素到动作的端到端模型 Figure的AI负责人Corey Lynch解释figure01的端到端模型是从像素到动作。也就是说，未来figure01很有可能利用互联网上大量的人类视频作为数据来源进行训练，从而解决人形机器人数据不足的问题。Meta也在尝试类似的方案。Meta AI推出了一种新算法，使机器人能够通过观看YouTube视频来学习和复制人类行为综合以上几点，我们认为，人形机器在数据来源、控制周期、鲁棒性上都有了明显进展，后续发展的卡点已经从科学问题转为了工程问题。比如零部件如何快速降本？零部件的使用寿命如何保障？如何快速扩大人形机器人的使用场景？ Figure怎么看人形机器人的商业化进程？ Figure的创始人Brett Adcock曾接受过一段访谈。Brett谈到了很多对人形机器人商业化进程的观点。Brett强调了人形机器人的发展会和自动驾驶类似，在物流、工厂等场景率先应用，家庭场景则更具挑战。我们将Brett观点整理如下： 一个人形机器人大约有1000个零件，一个电动汽车可能有大约1万个零件。长期来看，一个人形机器人的成本应该低于一台廉价电动汽车。 如果我们的目标是全球范围内投放100万台机器人，可能需要5年或者10-12年的时间，并且主要在后半段投放。接下来的10-20年里，机器人业务的发展将与自动驾驶汽车的发展路径类似。人形机器人也会首先解决相对容易的问题，比如在预知环境和任务的情况下搬运货物。在家中烹饪或照顾老年人，就像在城市街道上驾驶，更具挑战性。 现在大部分时间都投入到了机器人在物流方面的应用，也在一些大型汽车制造商上花费了不少时间2030年左右，我们有可能看到人形机器人在家庭环境中的广泛应用。硬件供应非常困难，很多决定都取决于硬软件的供应链情况。如果我们真的想做出实现高性能、高可靠性、高安全性和低成本的人形机器人，就需要开发自己的执行器、电子设备、电池和几乎所有软件，因为这些都没有现成的解决方案。Figure所有的短期、低级别的处理都在机身上操作。对于一些不需要高带宽、不必担心延迟问题的任务，例如规划机器人的下一步行动等高级行为，这些任务可以在云端进行处理。英伟达GTC的背后：具身智能的“基础设施”初步成型 2024年3月19日，英伟达举行GTC2024。本次GTC上，NVIDIA发布了自己的人形机器人方案，包括：1）人形机器人通用模型GR00T；2）人形机器人专用仿真平台Issac Sim；3）统一的计算资源调度平台OSMO；4）人形机器人专用芯片jetson Thor。我们认为，这意味着英伟达为具身智能搭建的“基础设施”初步成型，模型开发、部署难度大大降低，行业后续有望加速发展。 NVIDIA在本次GTC发布了什么？（1）英伟达推出了自己的人形机器人通用模型GR00T（Generalist Robot 00 Technology）。GR00T是一个针对人形机器人的通用模型。GR00T重要的两个突破：1）可以理解自然语言，2）通过观察人类动并进一步模仿学习。资料来源：英伟达,五矿证券研究所（2）英伟达推出了人形机器人的专用仿真平台Isaac Sim。IsaacSim可以提供可扩展的、逼真的和物理上精确的虚拟环境。Isaac Sim基于英伟达的Omniverse构建。资料来源：

点击免费查看完整报告

你可能感兴趣

机械设备：Figure和英伟达GTC的背后有什么技术新动向？

你可能感兴趣

电力及公用事业行业跟踪报告：高能五月最后一周，政策密集出台的背后有什么信号？

固定收益点评报告：月末票据利率大幅反转的背后有什么逻辑？

【盘中宝·独家】 A1服务器液冷机柜，这家公司与英伟达合作开发多项技术和解决方案亮相2024 GTC A1大会-20240319

机械设备行业：英伟达GTC 2026点评-物理AI全栈布局，仿真、“大脑”与生态持续升级

华泰通信GTC观察光铜英伟达在本次GTC中更新互联技术路