计算机首席刘高畅: 产业新闻:nvidia黄仁勋说下一波人工作的浪潮是具身智能embodiedAI。就是AI嵌入到身体当中,和物理世界结合,可以和物理世界互动,包括像机器人 ,还有自动驾驶。也向观众介绍了VIMA,一种多模态的人工智能技术。VIMA可以根据视觉、文本提示执行任务,比如说像这种重新排列对象,然后匹配这样的一个场景,也就是说这是一个图生文的模型,并且结合任务目标产生相应的使命。它会在nvidia开发的硬件平台中运行。 另外一个行业进展主要就是特斯拉的Optimus,这一次的这最新进展演示,它电机扭矩的控制能力,能够敲打鸡蛋,但是又不打破它。探索和记忆的能力,通过摄像头双足机器人能够探索环境并记住能力,然后为指定区域的工作做好准备。基于人类演示的AI训练方式,端到端的控制能力,能用机械手处理各种物体交互。马斯克表示机器人的电机控制器、电子设备都是自主,那和我们从产业链当中了解是一致的。马斯克认为现在做的工作被极大的低估,未来的话人形机器人的需求会远远超过对汽车的需求,整个大的硬件结构来讲的话,应该没有比较大的改变。 再一个的话,3月份的新闻OpenAI投了1x,4月25号腾讯的roboticsx实验室自研的灵巧手和机械臂灵活程度堪比人手,可以调鸡尾酒。 到今天为止,大家可以看到我们2月份提的多模态的GPT,已经不断的向机器人去演进。整个的节奏,我们这里有一些行业的资讯可以供大家参考。 第一点就是多模态GPT的发展,其实它有一个相应的过程,从国内的一些比较顶尖的厂商了解到,机器人的形成,它有一个标准的技术范式,ViT+类GPT+机械类的方案。ViT的话是CV技术的一种,能让机器能够理解你到底看到了一个什么样的一个东西。类GPT可以是ChatGPT,也可能像Google的PaLM这种模型,把你整个的一个ChatGPT这样的思维和你的任务相结合,第三个的话就是机械的方案,指令如何去执行 GPT的话,国内的绝大部分企业和海外的绝大部分企业,都是从今年才开始做这一块的深入的研发。所以国内有积累的话主要是两块,一个是ViT或者说视觉 ,包括像海康讲的这种视觉大模型和场景里面的这样的一个图生文的能力是其中的基础。另一类的话就是这种机械的方案,像机械臂这样,当ViT和GPT的泛化能力足够强的时候,再加上硬件能够支撑的时候,包括像计算、像通信能够支撑的时候,就是一个完整的通用机器人。所以我们前期做的这样的一个预测 ,从今年下半年开始的5年内,随着GPT的发展的话,会带来整个ai泛化能力的一个增强,然后的话那么伴随着场景的出现,它的硬件水平也会提高。会看到场景应该是像这种通用的这种场景的分析,比如说帮公安分析犯罪危险,一些场景环境的分析,然后结合机器给出一些相应的决策。那这里就会包括像在其次的话,就是像这种通用的这种机械臂,通用的AGV,行业机器人,比如说像工厂里的工人,咖啡店的服务员,他的工作是需要学习和调整,但是又不是说这种极度复杂,那么会从今年下半年开始会是一个持续爆发的过程,5年内我们会看到大量这样的一个场景的爆发。那即使像特斯拉的Tbot的话,我们认为早期它也是在场景当中实现通用,所以它某种意义上也是个行业机器人,虽然它的形态是通用的,但它脑子是不通用。 现在看通用机器人的话有什么样的问题?我们认为5到10年的话,通用的机器人会出现,就是如果模型要达到非常强的泛化能力的话,模型规模要非常大,对单机终端的算力要求会很高,gpt3.5大概要5张A100卡运行,更大的模型可能要十张。终端硬件能力不强也可以用通信的方式、云端的方式来解决,但中间的通信的要求就会变得非常高,所以的话现在硬件上来也并不太支持这种完全通用的机器人,应该行业机器人会是接下来的一个产业的重心。 另外的一块的话,大家比较关注的像特斯拉那些国际大厂的节奏。特斯拉我们最主要的几个国内供应商应该都是有比较好的营销,应该还在一个产品的调试当中,还在快速的迭代。目前整个硬件的方案上应该是迭代到了第三代,陆续的这些供应商都在送样不断的调试。所以一些场景的话,我们认为会在明年开始的话,有一定规模的量产。马斯克对这块雄心比较强,而且投入也比较大,自己也在亲自盯,整个无论是软件还是硬件的迭代的速度的话,都非常快。所以我们相信在未来的三年内,整个特斯拉的这样的一个快速爆发,未来三年应该是一个可预见的。所以相关的产业链的话大家可以重视。 产业的第三点我们要强调,之前看到的是以特斯拉为核心的,但其实整个产业生态在越来越丰富,包括像小米,像海外1x,还有一些非通用化的、场景化的 ,像亚马逊,像国内的一些,我们认为都会伴随GPT的发展,在未来几年快速的爆发。所以也可以不止把目光放在特斯拉身上,从投资还有产业的角度来讲的话,接下来几年视野可以放的更开一些,这是一个超级大的应用,但是它确实需要时间再好好的做事。因为我们了解到单场景的这样的GPT和ViT融合,就是比较小的一个场景,研发费用至少都是在1个亿以上,而且还需要好的这种积累。所以也不要说盲目的乐观。但是从下半年开始,明年后年,应该是一个越来越让人兴奋的产业链。因为这条线真正通往的是我们人工智能的终极形态 ,就是通用机器人。所以虽然时间会稍微长一些,相较于之前能看到AIGC,电商,接下来能看到智能助理,它的空间也会远远更大。所以仔细去研究下来,蛮适合这种长期的机构投资者去参与的赛道。 那从产业链来算的话,我们认为有三类公司会比较有机会。第一类的话就是在ViT上有积累的企业,像海康100亿,大华38亿的研发,像汇川22亿研发。VIT这类企业如果能补强机械,补强GPT的话,它会是一个好的方案。所以这里面我们看到的是大华、海康、千方、中科、云从、亿嘉和然后萤石、创达、商汤 。 第二类的话就是本身做这种机械类的这种,或者做机器人类,有一定基建的这种公司。 再一块的话就是产业链的这种供应商,目前看起来产业链很多核心的部件真的是硬件上这种突破,包括量产能力的突破,中国应该是做了巨大的贡献。像大厂的核心供应商,拓普、三花、鸣志、绿的是其中的核心标的。 风险提示: 机器人技术迭代不及预期风险:若机器人技术迭代不及预期,则对产业链相关公司会造成一定不利影响。 经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会 造成不利影响 行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。 机械首席张一鸣: 机器人它是一个典型的交叉型学科,它首先要受益于AI技术的发展,同时也要去看硬件的不断完善以及降本。机器人对于整个制造业也是也有很强的赋能,体现在两个方面。一是给制造业整体去创造一个新的一个巨大的增量,二就是给制造业去进行进一步的无人化进行降本。 第一点因为我们看到制造业过去十年主要是依靠下游,一个是房地产基建,另外一块核心就是出口。2021年之后,多种方面的原因,宏观经济的增速其实开始逐步的放缓。从微观的订单来讲,我们调研了很多公司,其实从2021年之后 ,哪怕很多通用的公司,包括像激光、像机床这一些,都表示下游的占比,风光也是占到了很大的一个比例。那么当新能源也到了或者说即将进入到他的生命周期的第二阶段,下一个是由谁来接力?马斯克说未来机器人数量,可能它的保有量要在100亿到200亿,未来赋予特斯拉的价值会远远大于汽车的价值。我们认为未来机器人它如果真的能够完善的话,它的应用空间还是很多的,包括在工业,然后是在服务行业、商业领域、民用,再走到一些类似于消防的一些特种行业。所以说我们可以选择相信未来真的能够到这么大的一个量级,它给整个制造业创造的增量真的是非常大的。所以说不光特斯拉,那么其实汽车产业链乃至整个制造业,我相信未来机器人也会给他们付更大的价值,微观上来说的话,就是可能会给到他们更多的订单。 第二点就是去给制造业降本。我们过去一直讲无人化的趋势,国外已经走了三四十年了,我们国家也讲了差不多十几年,将近20年的时间。那么现在工业机器人加上协作法,加上AGV,不是已经基本上能够实现无人化了?但实际上我们如果去多跑一跑车间的话,会发现产线上面大量的精细活还是需要人去完成 ,腾讯其实也之前在发布自己灵巧手的时候,他也提出了三阶段这么一个理念 。第一阶段机械臂这个时候不带甲爪,不带零巧手,它就能够替代一部分的产业工人。第二阶段,机器人一定要去替代更加精细一些,或者说一些关键岗位上的。说实话就是这些岗位上的工人他们的工资可能要远比机械成本替代更高一些。也是我过去一直跑车间得出的结论,不少的企业的老板聊过这么一个问题,前一阵去调研的一个公司,他的老板跟我说工业机器人差不多是替代了自己产线2/3,也就是说一条线可能原来是30人,我现在用了工业机器人加AGV ,再加上大量的这种自动化的设备加在一块,现在一条产线只有10个人就够,剩下10个人就够了,但是这10个人的工资要比过去20个人的工资还要高,因为他们都是在关键岗位上。腾讯他提出的第二阶段就是让进一步的去把这些做精细活的这些功能替代。其实这两年我们会发现随着中国对美贸易的一个关税,然后再叠加上中国工人工资水平不断的提升,已经有很多订单,包括很多海外的工厂已经建到东南亚、印度、菲律宾、印度尼西亚这些地方,那么所以说发展机器人去进一步降低中国的制造成本,把中国和东南亚、印度一些地方的人工成本拉近,有利于中国进一步保证自己世界工厂的地位。反过来美国这两年也在喊制造回流,所以说它也要发展机器人去抹平工人成本。所以未来机器人很有可能会成为中美博弈的一个焦点,至少是一个重点问题。 现在人形机器人其中40%的成本都是来自于关节,还有20%-25%来自于传感器,剩下一些主要是来自像结构件、机器视觉、电池,音箱、喇叭这一些的成本。 所以说机器人的价值量重点,实际就是两个地方,一个是关节里面,或者说组成关节的执行器以及传感器。 执行器我们现在了解到绝大部分的人形机器人,分成两个大块,一个是身体上的大型的关节执行器。还有一个就是手上面的,以特斯拉Optimus为例,根据以公开的资料来看,身体上是28个关节,然后手上一个手是六个,大拇指这里是有两个,然后其他两个手指一个。其中28个大关节里面又分为两类,一类是线性的执行器,还有一类是旋转的执行器,旋转执行器它主要是分布远一些关节的这些连接处。比如说肩膀、手肘、手腕,还有腰部、胯部、膝盖这一些地方因为关节的连接处它的运动不是直线,是一个旋转,所以说我们就把它称为旋转,或者说叫环境执行器。那么这种执行器一般来说是一个谐波减速器,配套一个永磁电机这个构成的一个结构。我们也看到了三花和绿的宣布在墨西哥建立一个工厂。可以了解到三花它其实是承担了一个给Optimus做这个大关节模型,或者说这个旋转式执行器总承的一个认可。正如同大部分的机器人公司一样,像过去的机器人大家族,abb、kuka这些,包括国内像汇川,埃斯顿这些他们其实软件或者说控制层的东西往往都是自己做的,执行层里面电机会自己做。但是一般来说这个传动层面的东西,谐波减速器基本上都是外包供应商的,所以说三花其实也不例外。他这个时候也需要一家全球顶尖的供应商去和他进行恰当合作这也就是三花和绿的会在墨西哥成立合资工厂的一个底层原因 。 第二个就是在关节的连接处是用旋转型,那么在像手臂、大腿这些地方,它用的是一种叫线性定执行器,其实我们又可以把它称之为4伏电杠。这个怎么理解?其实我们可以去对标一下过去的工程机械,我们可以看到像过去鼎力,它做的高空作业平台,包括三一这个挖机,现在都有个趋势,就是从传统的液压驱动形式会转换到一个4伏的驱动,机器人也是一样的。传统的方案像波士的动力就是这个液压的这种方案,液压的方案结构相对来说比较简单,但是液压的一个缺点就是贵,第二个就是笨重,那么对于像波士顿动力在实验室里面这种机器人来说是可行的。但是我们知道Optimus这种通用的机器人,它是要真正去推向市场应用,所以说不能太重,也不能太贵。