宇树科技王兴兴:人形机器人的 这背后建立在积累多年的四足机器狗技术上。四足机器狗和双足机器人的底层技术相通,宇树只用3个员工、不到6个月时间,就做出了人形机器人产品。 2013年,还在读研的王兴兴,自己设计电机、控制算法等,用不到两万块研发出了第一台四足机器狗XDog,这几乎是全球首个四足机器狗的技术方案;2016年,当XDog在海外展现出 市场需求,王兴兴离职创立宇树科技,不久后极客公园旗下的变量资本,注意到了王兴兴,并于次年领投了其天使轮融资。 目前,宇树的机器人本体(硬件)被全球各大科研机构、科技公司购买,用作研究。而其四足机器狗目前在全球出货量第一,包括万元的消费级机器狗Go2及最其新轮足版本Go2-W,用于工业级场 景的B2、B2-W。年初,宇树披露了最新一轮近10亿元的B2轮融资,这也让它成为目前机器人赛道估值较高的公司之一。 01□AI技术不成熟,□工业场景的落地还未到时候□Q:最近不少人形机器人公司都在提工业场景的落地商业化,包括前不久OpenAI合作的Figure02也宣布进入宝马工厂。 你怎么看今年人形机器人行业的变化?工业场景的落地是否在加速? 王兴兴:我个人感觉其实没有太明显的变化,只是说会有进步,以及会有一些尝试性落地。但目前大家基本上还是处于试点阶段,觉得工业方向有价值,先尝试下落地部署。Q:有人说今年会是POC(ProofofConcept,概念验证)之年,你怎么看?王兴 兴:只能说在一些相对容易落地的小场景、工业的局部环节能做点事情。但大部分还是针对特定环节进行定向训练,成功率也未必特别高,离通用场景还比较远。Q:关于应用场景,似乎你们之前说会看重介于工厂和家庭之间的能源场景?王兴兴:我们公司还是偏工业一点,目前大量工厂对劳动力的需求是比较大的。但能源行业大部分全是自动化设备,它对人力的需求我感觉没有那么多。 Q:你们现在在工业领域有哪些落地? 王兴兴:比如我们过去几个月有跟蔚来的汽车工厂合作,现场部署了我们的人形机器人做搬运,有激光雷达定位、机器人操作、AI识别等,整个过程是全自主的。 虽然我们也在推进落地,但可能推进的速度和效率没有那么快。我们公司还是比较有耐心的,不是说一定要今年或者说明年在工厂里部署多少台,其实没有把自己逼迫那么紧。因为我觉得目前技术发展水平还不够,没有达到真正商业闭环,比如让机器人能达到一个工人的价值。 所以我们还是尊重整个市场的反应,等到技术和产品成熟到一定程度了、已经有一些更好的商业推广的势头了,我们再大规模地推广。Q:大家都在提人形机器人进入汽车总装场景,你觉得什么时候能实现? 王兴兴:汽车总装很难,因为汽车总装最大的一个问题是汽车的零部件太大了,一般小的人形机器根本搬不动。而且车辆又特别复杂,要把机器人伸进去装,难度太大。目前进入汽车厂商的上游供应商可能 还更容易一些。Q:上游供应商指的是? 王兴兴:生产一些仪表、线缆或者什么,这可能简单一点。总装厂的难度其实有点大,个别总装厂里部分工序还是能做的。 Q:在机器人底层AI技术还没有真正突破时,怎么看大家钻到细分场景去做落地 的意义?现在针对细分场景打补丁,会不会难以跟上底层AI的技术进展?王兴兴:其实每个行业肯 定要先尝鲜、先推进一些事情,不可能等所有的技术或所有的条件都满足了,再去做一些商业化或者落地的事情。如果有能做的,大家可能都会开始尝试,这是毋庸置疑的趋势。Q:你之前提到,明年年底前全球至少会有一家人形机器人公司实现工业场景的商业闭环,这个判断是怎么做出的? 王兴兴:原因也比较简单,目前全球整个的机器人AI技术的进步还是非常快的。技术一旦变得更好 ,那有些简单工业场景的落地就可以做了,一旦比如一个工厂的一台人形机器人设备,能够产生正向商业价值,其实很多的工厂都会买,这是不可阻挡的一件事情。我觉得到明年底和后年,人形机器人真的可以大规模地在工厂里铺起来。这个是非常快的,所以当务之急还是要把AI做得更好一点。02□人形机器人AI不到GPT-1水平,□原因是数据和技术路线不清晰Q:如果把现在具身智能的智能水平跟大语言模型做对比,你觉得现在是相当于GPT几的阶段? 王兴兴:我觉得还没到GPT-1的水平。具身智能整个的模型进展是有点慢的,还没有突破一个临界点。现在就有点像ChatGPT出来前一两年,机器人AI还是有点笨拙,只能做一些非常简 单的工序、而且执行的成功率有点低。Q:这是不是悲观了点? 王兴兴:没有,这基本上是事实。我觉得目前至少公开的、大家看到的技术,还没有到。Q:你觉得达到GPT-1的标准会是什么? 王兴兴:一定的通用性和一定的使用价值。现在很多场景都是固定工位、工序的训练,能做点事情,但泛化比较差,你训练了什么就只能做什么。 你可以看到前些天,特斯拉才刚开始招数据采集的人。你说数据都没有到位,这个模型怎么出来呢?所以就GPT-1都没有。 Q:之前看到特斯拉有通过摇操的方式获取数据? 王兴兴:已经做了一点点,但是很小的、固定的一部分功能,比如把一个电池从这里拿到这里。这当然是可以的,但它跟我们想象中的通用机器人模型完全两码事,跟通用的基层模型还差挺远。Q:所以AI技术没突破主要是数据的问题? 王兴兴:数据是一方面。现在很多机器人数据都很杂、不太干净,甚至也不是给机器人专用的,就不是真正能干活那种级别的数据。所以只能做些简单的事情,成功率不是特别高。Q:应该怎么解决数据问题?特斯拉、谷歌比较强调遥操、英伟达强调仿真,你怎么看? 王兴兴:遥操、仿真都有需要的,各有优缺点。 比如虚拟数据能大概让机器人知道要往前走、或者拿个什么东西,但是真正要达到非常精密的操作,误差会比较大。你可以用虚拟数据做机器人的训练,但最后要让操作准确度达到100%,还是需要真实 的数据。我觉得如果有实力的公司,像特斯拉,多弄点人搞真实数据会比较好。不过我个人感觉,机器人的数据量没有大家想得那么夸张。现在最大的问题是。 现在每家搭的模型都不太一样,每家的想法也不一样,没人知道哪个模型是好的、也没人知道哪个什么技术路线是真正最后能跑出来,都比较模糊。 Q:行业主要分为怎样的技术路线? 王兴兴:目前市面上比较常见的有两种。一种是把大语言多模态模型直接给机器人用,然后再加一部分机器人底层的操作运动集等,让大语言模型去调用一下、完成一些事情,这是目前最常用的一个架构。有些公司可能希望更端到端一点,像特斯拉目前要搞的就是这个方向。它直接用模仿学习,让人采集大量的动作数据去训练机器人。它确实堆数据是有效果的,比如今天干这个活堆一部分数据,干一个活堆另外一部分数据,最后这两个活都能干,但更大的验证不太确定。Q:为什么技术路线还没有形成共识? 王兴兴:主要是模型和最终结果都没有看起来说,哪个技术路线特别特别好。 光硬件都没有办法形成共识,比如一个摄像头具体应该装什么位置、装几个,传感器数据应该怎么采、要不要触觉传感器,有的不想要灵巧手、有的需要很多手指……每个人的想法都不太一样。这就导致了其实很难评价哪种正确、哪种错误。 其实在ChatGPT之前大语言模型也有非常多的架构,只是后来发现这种架构更有价值,就把其他架构淘汰了。现在人形机器人有点像ChatGPT出来的前一两年,实际上没有哪家敢保票,说自己的方向是绝对正确的。 Q:那你自己更相信哪一种路线? 王兴兴:我感觉可能跟他们想法都不太一样。我们其实目前不是特别急,一方面是看能不能做一些新的模型,另一方面这些常用的我们也会用。我们就玩玩吧。Q:大家说智能汽车是机器人的一个子集,现在很多车企在入局人形机器人行业,车企从自动驾驶的端到端来做机器人会更有优势吗? 王兴兴:因为马斯克在搞人形机器人,所以车企对这块肯定是比较关注的。大家希望在机器人上用到像FSD一样端到端的自动导航技术,但很多传统的自动驾驶还是偏传统的技术,比如机器狗在一些园 区做巡逻的这种技术。 把FSD自动驾驶用在人形机器人上面,大家做得不够好。包括特斯拉,因为特斯拉大量的人力都放在FSD去了,人形机器人相对投入没那么多。当然也有一些创业公司在做,但目前还是不多。Q:你认为机器人AI什么时候能实现GPT-1的水平? 王兴兴:明年年底差不多,全球至少有一家公司应该可以搞出来。可能比这个时间还更快。 Q:虽然技术路线还不清晰,但为什么相信能这么快实现? 王兴兴:比较简单,AI技术都是阶跃性的。现在有点处于一个平台期的感觉,但技术进步本身非常快,可能今天没做出来,突然明天就做出来了,它就是突变性的。 比如我们在研发的时候,经常发现非常惊喜的事情:有同事调了(机器狗)很多天都调不好,它完全地上打滚啥都干不了。但突然一个晚上,你给它训练一个新的模型放上去,第二天早上效果就非常好。这种情况在AI里面很常见,一开始可能真的是很烂,突然间变得非常智能。 另外,这个行业越来越热了,有更多的聪明人、更多的钱在关注这个行业,那整个速度就会变快。如果还是按过去那种机器人AI研发的进度,可能等个十几年或二十年都等不到。所以目前,我还是比较 乐观。 03□全球人形机器人公司对AI的投入都很少,处在观望、共创阶段Q:目前你们在AI上的投入怎么样? 王兴兴:说实在的,我们在国内在机器AI里投入算是比较少的,跟别家比起来。Q:但你之前说希望能更相信、更投入AI? 王兴兴:对,但是毕竟财力和精力有限嘛。AI太烧钱了,光GPU算力都烧不起。如果投入太大 ,容易盈亏不平衡。所以我们还是克制一点。Q:从这个角度上来说,有更多资金的大公司会比创业公司更有优势吗? 王兴兴:我觉得还好。核心原因是,在目前技术路线不是特别清晰的情况下,你哪怕有很多钱和资源,也使不上太多劲。在这个阶段,你可以看到虽然大公司都挺关注的,但投入其实不多,其实都很保守。特斯拉的人稍微多一点,至少有几百人,别的公司大概可能有几十人。投入远远不算大。国内其实大家投入也都挺克制,没有说哪家疯狂投入啊。 说实在的,它不是说一家公司有多少钱、有多少人就能一定能把它做出来。因为在这种前沿的、全球都没有人做出来的情况下,某种程度上你可以认为看运气、或者看某个天才人物,把这个事情推动了。Q:这看起来很反差,外界都觉得人形机器人行业很热,但实际上大家投入不多。 王兴兴:这跟大语言模型比起来真的是九牛一毛。 因为大语言模型的技术路线相对确定了,如果你去看一下OpenAI的早期发展经历,它做的事情其实很杂,包括机器人、AI模型等等。后来它们是发现GPT的方向比较正确,通过投入算力和资源、可以大力出奇迹,才重注这个方向。它们并不是在路线还不太清楚的时候乱投入。Q:那人形机器人相比自动驾驶呢,哪个更远? 王兴兴:FSD更快,基本上特斯拉在这个技术路线上就跑通了,商业价值目前都完全看得到。所以它们现在投了大量的资金和人力去做FSD。 我觉得这也是为什么它们人形机器人的AI进展没有那么快,因为目前的技术路线没有特别清晰,所以投入跟FSD比起来真的是少很多。 Q:一方面是技术随时会有突破,另一方面大家又不敢投入,那怎么跟上技术进程? 王兴兴:这个不太好估计吧,就看具体的技术进展。如果突然觉得技术好了,你就多投点钱。如果技术不太好,那就少投点钱。这其实是很动态的一件事。 Q:技术突破主要是靠学术界还是科技公司? 王兴兴:目前还是全球共创的阶段,很难说是某个实验室、某家大公司。就像OpenAI能做出GPT,也用到了谷歌的Transformer技术和其他公司的一些成果。 很难说某家大公司是技术最领先或者产品最领先的,国内国外都有可能,大公司或许机会更大一点,但都不好说。AI这个领域就是这样,今天你领先,过了没几天别人更领先了、你原本老的东西都不能 用了,它的变动性和风险系数还挺高的。 我们公司还是希望全球共创、和大家一起努力,之后再根据整个产业的动向做相应的调整。Q:为什么你之前说,这次技术的突破大概率是由别的公司完成? 王兴兴:这其实是完全不可预计的一件事。不过我觉得美国的概率会更大一点,因为它们AI人才更多一点、