part1特斯拉发布新型人形机器人Optimus 基本参数配置: 内核(大脑)——FSD计算机Tesla自研芯片 电池——52V电压、2.3kWh容量、内置电子电气元件的一体单元行走功率500W 坐下功率100W整体重量73KG 电池包总电量2.3KW•H 理念: 汽车化:汽车是四轮机器人,而机器人是双轮汽车。汽车的模拟碰撞实验用于机器人的跌倒测验,动作可视化处理,继续使用关键帧分析,运用相似模型进行运动规划,使得轨迹和支撑力量相契合。 仿生学(人体工学设计): 可实现的动作——打招呼/四处走动/跳舞/拿放东西/下蹲捡东西/爬楼梯/用水壶浇花 除了外形与人相似,其各关节的设计也模仿了人的各个关节,其机械手具有超200档的关节自由度、27档的手部自由度和11档的手掌自由度,这使得Optimus能做出人的动作,可提起20磅(9kg)左右的物品,还能对其进行优化,提高效率,金属肌腱能够带动机器人精确抓住小而薄的物体;膝关节复刻生物学上非线性逻辑,贴合直立到弯曲的受力曲线,采用类似于平面四杆机构设计使得发力效果与人类的膝关节效果接近。 动力学:在“肌肉”的设计方面,Tesla公司为Optimus从力度大小的角度设计了6种促动器,相较于业界几十种的平均水平大幅减少,其原因在于Tesla的工程师们考虑到量产指标和功耗指标,对人体各种运动进行了点云分析,找出这些运动的共同点,减少四肢线路传感,集中到躯干中心,即电池的PCB里,计算运动时的扭矩,尽可能大地提高每种促动器的使用效率,但预期效果仍有待考验。 保护机制:在Optimus受到外力冲击时,能够使其内部结构不受损伤。行走相关: Optimus训练FSD用到的神经网络和在线仿真模拟,通过多个微型摄像机进行 场景识别,并能够进行立体渲染、路径规划、视觉融合和视觉导航。 此外,Optimus采用运动重心控制算法,能够像人一样在行走时或者在受到一定外力冲击的情况下保持平衡。 项目进展:没有明确交付日期,但是人工智能团队将于6-18个月内做出进一步的成果。 预计售价:实现低成本量产后,预计售价将比该品牌汽车低许多,单个整体售价将低于$2W part2无人驾驶FSD1.OccupancyNetwork——将3D向量绘制成矢量图 Tesla的应用该技术进行网格化的3D模拟,用决策边界描绘物体边缘2.TrainingOptimization 优化后视频选帧更为智能,大幅度减少数量,可以提高30%训练速度,文件体积缩小11%,训练效率提升2.3倍 3.车道 应用地理几何学和拓扑几何学、车道导航、公交车计算、多乘员车辆车道计算等方法编写“车道语言”,可在10ms内的延迟思考超过7500w个可能影响车辆决策的因素,并且功耗不足8w。 part3DOJO 高集成度、高自研率,全自研VRM(电压调节模组),单个VRM模组可以在不足25美分硬币面积的电路上,提供超过1000A的电流。 但高集成度会带来一些问题,例如CTE(热膨胀系数)处于极限状态,即便CTE只是稍微失控,都会给系统结构造成巨大破坏。因此过去两年内,Tesla的这套VRM迭代了14个版本,才终于进入负载测试阶段。 每个DOJOPOD机柜由两层计算托盘和存储系统组成,每个托盘由6个计算瓦片组成,提供高算力深度学习性能。每层托盘连接着超高速存储系统,640GB运行内存可以提供超18TB每秒的运算带宽和超1TB每秒的网络交换。 可以提供1.1E算力、13TB运存、1.3TB缓存的EXAPOD,将于2023年Q1,正式量产。 part4Q&AQ:机器人的设计是弹簧负载的原因何在?为什么不采用其他方式? 工程师分析执行器连接策略后,选择了强度更大的基于金属件的设计,电缆的应用会有更大优势。小零件、小连接,肌腱使得手指更有活动力,弹簧能够为整个机体带来最高的活动自由度。该设计现在还没固化,目标是快速量产出有效率的机器人。 Q:机器人是否具有人格特点,例如能否实施讲笑话、微笑等操作? 会形成更为有趣的版本,可以成为伙伴,有吃喝玩乐等各种陪伴的方式,但都基于核心智能问题的解决。 Q:当机器人的行为与预期设想不一致时是否能够进行干预? 可以实行远程控制。并通过奖惩机制,使其在之后优化服务行为。 Q:会考虑研发交谈功能吗? 交谈功能势在必行,从技术角度,仍需进一步升级,最终目标尚在考虑中,敬请期待。 Q:人形机器人未来将会有什么样的发展?是否能够了解人的情感? 过去的几年里,AI取得了日新月异的进步,目前市场上的机器人已经可以生成电影、讲笑话,可以说是一种创造艺术的形式。Optimus致力于创造物理艺术 ,而非数字艺术。 Q:Dojo平台的前景如何?是否会应用类似于AWS亚马逊云之类的服务?造价 、开发成本及商业场景如何? 冷却装置、能耗和成本问题仍需考虑,有望作为亚马逊云服务的方式供给市场 。 Q:Autopilot目前偏语言模型的原因?能够做出什么样的改变? 可以帮助用户在不同的情况下关注单一车道预测,图像预测和连接预测。 Q:FSD神经网络如何做软件单元测试?每次测试样本的批次规模如何? 没有固定的测试规模,从单元测试入手,聚焦神经网络失效的地方,选取过去不太成功的例子,运用到汽车上,与传统模式进行比较,在摄像头等方面进行相关深度检测预测,依据模型动力学和几何特征进行修改,提升效率,避免风险。 目前阶段,仍需更大的数据样本。 Q:特斯拉的AI安全研究分解? 尝试建立专家委员会,对于涉及公共安全性的事务,政府需要进一步提高企业生产方面的安全意识和敏感程度。 Q:Semitruck在计算机视觉感知方面的新变化? 产品有不同的需求。车辆会搭载基于摄像头的最新神经网络,技术层面上依赖于如何感知环境以及提供原始数据,目标是使得车辆和生物体一样能够感知移动。 Q:Optimus在不同场景中对于部署软硬件有什么考虑,是否会将神经网络与Optimus结合? 暂时没更多的信息。 Q:Autopilot海外推广的最大困难?相对落后国家的障碍主要有哪些? 从技术角度看,FSD目前已经非常成熟,可以适应不同的路况,年底可以推出 。 在海外面临监管审批等问题,需要和监管方保持密切沟通。FSD目前可以适应全球各地区的状况。而Autopilot和FSD之间,要视具体差异点以定堆栈的发展,并仍需要针对极端天气情况做进一步验证。 Q:(非技术问题)回到20多岁会给年轻的自己提什么建议?加入特斯拉;和聪明人交朋友;多读书。 工作和生活,不一定要非常激烈,看工作和生活之余,享受生活;抓住灵感。Q:特斯拉机器人市场化时间? 3-5年,最长不会超过5年。 Q:Optimus控制器的带宽是多少?对于特斯拉的未来会有什么想法? 以任务为导向,深度和广度可以让特斯拉机器人更加灵活、降低延迟,不需要增加到20-50赫兹。随着时间,带宽肯定是提升的。 特斯拉现在已经是非常大的公司,在不同领域有所专长。未来想在无人驾驶领域精研,通过与初创企业的M&A。相信会有方向大获成功。 Q:Autopilot的团队面临哪些挑战,如何解决?数据引擎怎么收集数据? 要建立基础模型,模拟真实的物理世界。很多模型实现了3D。采取的应对措施不同,会有不同方式寻找数据。从客户端反馈。 Q:AJI(广义人工智能)有不同定义,对于特斯拉来说是如何定义的?关注哪些? 没有特别关注,是未来很有机会的产业,会发展这一块。现在在研发全自动驾驶,需要对数据进行处理,很多是真实世界的数据。 无人驾驶汽车,后面会比正常司机更好,机器人也会更像人。 Q:Tesla的风险承受能力?与业绩做一个比较?是否需要更高的透明度? 特斯拉关注汽车的机械安全,专家、工程师、政府对于汽车的测试非常广泛,要改善被动安全,也要兼顾主动安全。碰撞测试需要经过很多认证,因而在安全方面已经有一定保障,相较于人类驾驶员甚至更为安全。硬件3.0中,FSD得到了很好的改善。政策和监管有积极的迹象。目前外界对于Tesla的安全隐患担忧主要是来源于看问题的角度。Autopilot目前发展态势良好,有300多万辆汽车在路上行驶,安全性持续提升。 Q:对称性到底意味着什么? 机器人与人是一样有双手,有肌肉。希望做基本的人造机器人,做了很多开发工作。希望通过Optimus产品,帮助更多的人,提升工作效率。之后会考虑产品形态,硬件版本存在提升空间,可以添加附件,安装功能模块以期实现更多功能。-民生证券