Q:首先请专家分享一下它的核心竞争力主要体现在哪两个方面?A:我们给大家逐条展开,看看核心竞争力在哪些方面。 刚刚看到的就是CyberDog(铁蛋)在穿越梅花桩,然后他会通过D450深度相机模组采取地面的检验数据,通过处理分析,以及去噪,可以实现实时的落足点的最优解;CyberDog的运动控制会对地面的高线图进行分析,根据高度变化因素评估各点的可通过性,标记出高度边缘或者不可通过的区域,在可通行的区域选择最优的落足点。 通过这个图可以看出红色区域不可通过,绿色是可通行区域,红色的标记点是最佳的落足点。 对于最优解落足点的选择CyberDog的控制器采用的是三单体模型,来抽象出整个的运动,并利用模型预测来控制和优化,产生在未来一段时间里机身轨迹、腿部着力点以及腿部的受力情况,根据自身的运动学和动力学模型确定轨迹、协调各个关节进行跟动,从而实现在有坡度的或者不平整的路面上的行走。 它的环境感知能力和运动轨迹的规划能力就是我们软件层面的技术壁垒和核心竞争力。 这个方案不需要我们对环境先建模,也可以是临时搭建的一些场景,它是实时更新、实时刷新然后实时计算的。 这个“穿越梅花桩”的演示视频中展现了包括了机器视觉、视觉slam、运动控制等软件能力,能使得CyberDog通过深度相机获取地图,通过视觉导航计算出最优落足点的位置,再通过电机的位控和力控在运动过程中进行路态修正,这些就组成了算法上的核心竞争力。 机器人功能上的核心竞争力在控制方式上,可以通过手机APP的虚拟遥感实现对机器人前后左右以及航向的一个控制;也可以通过航模传统的遥控器进行操控以及模式的切换;同时,还可以语音控制。 在视觉控制方面,“铁蛋”还有视觉监工、视觉避障等相应的功能,这些功能也就是我们所说的运动方面的功能。在运动控制方面,它涵盖了所有的步态,包括我们传统所说的走、跑、跳跃等。 在APP上,可以点击舞蹈表演、摇尾巴、扭屁股、恭喜发财等让铁蛋做动作;可以切换室内模式和室外模式;可以录入人脸实现机器人的自动跟随。 同时机器人还支持牵引绳遛狗模式,支持倒地飞扑等高难度工作。 “铁蛋”的视觉导航、视觉跟随、视觉避障、语音控制、语音聊天,以及智能家居、物联网IoT相应的功能都是我们所说的功能上的核心竞争力。Q:您刚刚分享的是技术上的壁垒,那可以分享一下硬件上的壁垒吗?A:好的,我接下来介绍一下硬件方面的核心竞争力还有核心部件构成。 通过系统图我们可以看到这个机器人的传感器非常多,主要是一些视觉传感器、惯性测量单元(MU模块)、TOF传感器(避障)、触摸传感器 (交互)机器人的核心部件,机器人拥有12个关节伺服电机,最大输出扭矩三十二牛米。 当我们想要完成一些高难度的动作(比如后空翻、前空翻、跳跃等)需要非常大的动能和势能,而且动能和势能相互转化的过程,我们可以看到电机的最上面是一个9:1的行星减速器,采用直驱的方式,减速器的作用是将我们高速旋转的电机的速度降下来,转化为力矩输出。 通常的电机是不会有这么大的扭力,他一般是转速比较大,而我们是利用减速器把转速转为扭力的输出。 我们看到电机的第二级的话是电机的转子,第三级是电机的定子,第四级是电机的核心驱动部分,看图可以看出它是集中在驱动器里面而且体积非常小,通常如果我们用其他同等的伺服电机体积是非常大的,机器人从趴下到站立我们需要设计好摆放的位置以及转子、行星减速器输出端末端的位置,需要进行速度闭环、位置闭环以及力矩闭环,同样是做到三个闭环同等的伺服驱动器如果用其他来做体积会非常大。 由此看来如果做到相同功能和相同性能的驱动器,能做到体积如此的小,这也是一大核心竞争力。 当然驱动器里面还包括核心的算法(FOC),批量的产品、力矩标定、摩擦力补偿等,逐个展开的话都是一个小的科目吧。 Q:可不可以讲讲别的公司的产品跟小米的一个差别? A:我们刚刚讨论到电机我们就先来看一下电机哈,淘宝上同等规格的电机市场价是两千块钱左右,而小米铁蛋整机发布价格是九千九百元,包括了12个电机,而且输出力矩要达到32牛米,能做到同等规格如此性能和如此成本,这里面就涉及到非常核心的项目管理、供应链。 这个是小米第一代仿生机器人,整个研究开始的时间国内要比国外晚一些。 现在波士顿动力以及完全进入专业化了,波士顿动力我们是可以拿来作为工具使用的,比如野外的地形测绘,国内还达不到应用层面,但在应用层面讲的话,首先有了一个入门级的机器,有了更好的一个平台,持续优化的过程中,会跟波士顿动力的产品更接近。 从价格上看的话,波士顿动力产品一台机器五十到七十万一台机器,我们这一台机器不到一万人民币,价格方面也有一定差距。 Q:可以展开一下核心部件小米比波士顿动力少哪一些吗?或者他们的什么部件更贵一些? A:波士顿动力有几个版本,有一种用的是液压的系统,液压的系统可以提供非常大的动力,比方说用于军事的,我们用的是直驱的电机(行星直驱)。 波士顿动力有用谐波减速器,谐波减速器和行星减速器就不是一个级别,行星减速器就是一个太阳轮加几个行星齿轮构成的一个减速器的组合,只要我们把减速比设计好,齿轮的啮合和相应的参数能够在加工的时候控制好,基本上电机都是可以实现目标输出力矩的,但如果需要更高精度就是谐波了,谐波的内部机械结构是非常复杂的,涉及到润滑、密封、高精度的配合,同时,谐波减速器的成本也是我们电机的好多倍。 接下来我们看看小米铁蛋仿真机器狗的近距离的结构图前面搭载了双目相机、英伟达的相机、Ai相机以及感光。波士顿动力他也是用的双目,但跟我们用的不是一个型号,可能用的精度会偏高一些。 除了硬件上的差异也有软件上的差异,SLAM波士顿动力已经深耕了很多年,这一块也是现在比较大的一个攻克技术点,如果视觉SLAM做好的话,比如自动驾驶的避障等问题也就迎刃而解了。 我们现在也用了视觉跟随还有避障,但毕竟我们机器狗的行走速度还是非常有限的,所以对精度方面的要求不是特别高。 接口非常丰富,3个Type-C接口、1个HDMI接口,通过Type-C给机器狗充电,而且可以直接使用小米电脑充电器的快充给机器人进行快速充电。Q:国内四足机器人现在发展到什么水平? 如果跟波士顿比差距是什么,第二代产品会往哪个方向靠,小米跟腾讯比现在是什么样一个竞争水平? A:我们前面也看了腾讯过梅花桩的视频,以及小米铁蛋过梅花桩的视频,为什么产品的展示都是通过梅花桩来做性能的展示,这都是有一个共同点的,有很多技术的难点就在于其中。 接下来讲一下腾讯里面所涉及的有哪些难度的动作点:我们看到前面过梅花桩可能需要精准的落实点位置,跟小米铁蛋是类似的。这个梅花桩他做的面就会更小一点,也就是需要控制的精度会更高一些。 他在梅花桩的上面增加了一个坡度,而且是需要精确控制落主点,增加坡度的。这种情况对机器人的整个控制协调性就要求更高了。 我们通过其中的这一个动作我们可以看出来,腾讯的这一个不仅是传统的四足仿生机器人,而且它引入了电机,不仅是可以适度的行走,也可以用电机驱动。 刚刚通过视频最后的部分,就变成了一个小车,在平地非常稳定的一个情况下往前开了。他在这一个动作不仅是四足,而且是四足跟轮子相结合的协调性控制。 而且轮子控制的时候,它抬起了前腿之后,后面需要前腿落入到梅花桩上。这一个动作也是具有一定的控制难度。 而且他不完全是运用了惯性,有可能说我们做一些动作,比方说翻跟头,我们冲刺一下,翻过去可能运用惯性就达到了控制的效果。 但我们可以看出来,他抬腿的动作并不是特别快,并不是运用了惯性去控制,而且在整个抗干扰的情况下,控制的非常的平稳,而且机器在有限的区域做了一个闭环,没有使机器在抬头的过程中往后出现下滑的情况。 我们看这个动作(视频),普通的可能做得比较容易,只要电机的力矩能够克服自身的重量,相应的做功就可以完成。 但是如果像这么慢的全程,完全没有运用到机器的惯性是有一定的难度的,起来且落下去还要落到梅花桩上,这个就更加难了。 我们可以看出来,在后面是没有视觉的,在这个控制需要做成一个机器人模型撑起来再落回去这个动作可以看出来这个的控制做得鲁棒性非常的好。 我们还可以看更大的一个亮点,我们在小米的发布会上可以看到小米铁蛋进行了一个空翻的动作,博得了大家的很多掌声跟尖叫。我们再看一下腾讯的这一个,他不仅做了一个空翻的动作,而且他是做了一个前空翻加台阶的空翻的一个动作。 前空翻由于腿部机械结构,我们是采用全身L型这种折叠的机构,对于后空翻发力是非常有利的。 但对于前空翻的这一种发力,不是特别的友好,需要做到前空翻对机器人的性能以及电机的性能要求非常高的,整个算法的实现以及它从高台阶前空翻落地之后做一个缓冲,再稳稳地站立。 这一个过程的实现就是非常具有核心竞争力的一部分。 如果拿它跟波士顿动力来说,可能我们做的这些动作是有一部分是说为了炫技,这一部分的动作波士顿动力也都能做得出来。比方说波士顿动力的机器狗跳舞前空翻、后空翻、侧空翻这一些他们都能做出来。 但实际应用场景做测绘的这一些,场景应用以及场景应用的落地可能是我们国内机器人后续需要完善进一步发展的。 我们这个图展现就是波士顿动力的一个图了,这是它的体结构,上面搭载了一个机械臂,这样她就可以完成相应的一些作业任务。如果只有下半身,我们是可以完成一些运动的任务。 技能未来的发展就是自主加机械臂加多传感器的这种的应用,必须要具备健全的一个环境感知。 波士顿动力的机器人身上的传感器是非常多的,面头部传感器非常的丰富,尾部有传感器,侧面有传感器,波士顿动力的机器。 跟我们的现在机器的相比,与大疆无人机进行相应的对比,我们可以看得出来,大疆无人机前面的传感器,侧部的传感器,后部的传感器底部以及顶部的传感器都布置得非常丰富。 一个全环境的感知,四周就必须拥有传感器,进行一个环境感知。健全的环境感知是一个前提条件,也是一个核心竞争优势。 Q:从四足机器人做到这个,像特斯拉这样的人型机器人有哪些技术跨越,或者说后续有没有可能也有这种能力做到。主要是对比一下四足机器人,还有特斯拉的人形机器人的比较和技术的差异。 A:四足机器人的下半身主要是用于四足的运动控制、上部分机械手以及机械臂部分,是用于安全作业的一些相应的应用。四足以及其他类型的机器人的发展方向也肯定会趋于一个集群控制。 我们通过这个视频可以看出来,它是拥有两台机器人,一台机器人是先到达了这个仓库的门,用机械臂把门打开了,顶住了门。 另外一个机器人顺利的通过了一群协同作业,就会考虑到多机器人协同性以及任务规划性,发展肯定是趋于机器人协同控制作业的这个方向发展。目前我们国内的机器人可能是还普遍是趋于单体控制,但对于我们发展时间比较久的无人机,我们就可以看到相的协同控制。 比方说我们所通常看到的,无人机编队开始有5架10架15架20架,现在发展成1000架、2000架的总规模,无人机的这个技术的积累,以后国内的足式机器人以及轮式机器人或者是以后的我们所说的人形机器人的发展,也奠定了一定的技术积累跟技术方向。 特斯拉在今年宣称要在9月发布人形机器人的原型机,现在已经8月份了。他说今年主要工作重点就在于人形机器人上面。 今年的汽车不是一个发展的主营特点。 左边的这个是特斯拉机器人的整体的一个外观。 右边我们可以看到的是特斯拉机器人的一个内部结构,架构以及关节电机的排布。特斯拉擎天柱的一个成功问世开启了人形机器人新的纪元。 马斯克宣称将在9月30号就发布它的样机了。电动车的掌门人都要入局人形机器人了。 由此可以看出,人形机器人肯定是一个将有很大发展的一个方向。为什么要做人形机器人呢? 我们可以看到人类的进化史都是从古猿到猿人到新人再到现代人的一个发展。 可以看到原来可能是趋于四足行走慢慢到半站立到全站立的一个这个进化的一个过程。 我们可以看到我们由动物的这个方向猫跟狗,现在国内兴起的是仿真四