您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:一个很酷的BOT应用需要哪些技术积累? - 发现报告
当前位置:首页/行业研究/报告详情/

一个很酷的BOT应用需要哪些技术积累?

信息技术2022-09-25刘高畅、张一鸣国盛证券小***
一个很酷的BOT应用需要哪些技术积累?

机器人是超越版的智能手机,仅有硬件无法应用,需要配合软件算法形成综合协同,唯有人形机器人才有生态可能。硬件是机器人的躯体,软件是机器人的灵魂,软硬综合、灵肉结合,才能形成完整可用的智能机器人。对标苹果IOS生态可发现,统一硬件+开放算法框架有望塑造出异彩纷呈的强大生态。IOS最初相对封闭,第三方应用程序功能开发受限,2008年3月开放生态后app store上应用数量爆发式增长,截止2022年3月苹果app store上上架的app数量已接近480万。我们认为,机器人作为超越版智能手机,具备和智能手机发展类似的特征,因此具备硬件能力、软件基础以及开放框架的机器人厂商有望复刻智能手机时代的发展,随着渲染、开发语言、开发工具、应用经验日益丰富,开发者越来越多,应用不断迭代升级,创造出异彩纷呈的强大生态。而非人形机器人硬件形态单一、功能受限,无法承载多种场景应用,因而无法吸引大量开发者,也无法形成生态。 因此,唯有人形机器人才相当于超越版的智能手机。 机器人智能感知认知技术:机器人的“眼睛”。计算机视觉是一个从视觉传感器获取图像并利用计算机进行处理、检测、识别、理解和推理的技术,是智能机器人感知和认知世界的最主要途径。由于机器人的运动性,相比于其他领域的计算机视觉技术,机器人面向的是一个动态环境,因此视觉技术面临更多的挑战。需要的技术包括:1)通用目标检测算法:通过计算机视觉检测物体场景、人体、人体关键点、行为识别、目标跟踪、动/静态手势等。2)人脸检测相关技术:对人脸进行识别检测,包括人脸检测/识别、人脸口罩状态识别、人脸属性识别等。3)除此之外,还需要图像增强、视觉特征检测算法等其他计算机视觉底层算法。 机器人运动控制技术:机器人的“四肢”。运动控制系统是伺服系统、减速器、控制器等硬件与运动控制算法的集成,作为智能机器人核心技术之一,决定了机器人的行动、执行能力。运动控制系统系统包括硬件、算法两个层面:1)硬件层面,拆解传统机器人产业链,核心零部件包括伺服系统、减速器、控制器等,减速器/伺服系统/控制器/本体制造分别占工业机器人成本的35%/25%/10%/15%,其中核心零部件成本合计约70%。2)算法层面,运动控制算法是智能机器人实现运动智能的核心基础,是目前大型仿人服务机器人领域的世界性难题。以优必选为例,公司已具备运控硬件多项自研技术储备,并且是国际上少数具备仿人机器人整机设计能力及仿人机器人运动控制算法开发能力的企业之一,其伺服控制器、伺服舵机及运动控制算法已在多款机器人上实现应用。 感控一体技术:机器人的手眼协调。1)手眼协调算法:是解决服务机器人操作能力的核心关键技术,是对视觉感知技术和运动控制技术的综合应用,包括视觉伺服算法(用于精准操作、准确抓取)、动态避障抓取算法等。2)自主导航定位算法:智能机器人的自主导航定位算法包含了建图、定位、导航和避障等核心技术,是机器人自主决策、规划和控制,从而将自身安全准确地引导至目的地的过程。 从技术路线上来说,包括激光与视觉融合的建图和定位技术、全局与相对位姿信息融合的定位算法、以及动态场景下的智能导航避障算法等。 机器人算法生态:开源框架。目前最主流的AI框架PYTORCH/TENSORFLOW已经具有实现逻辑能力的可能,而机器人也可以拥有自己的操作系统应用框架,例如优必选的ROSA。ROSA采用模块化设计、层次性架构。主要面向两类人群:对于开发者,提供机器人本体上的API SDK,便于操控机器人实现业务逻辑,同时开发和机器人联动的终端软件;对于硬件厂商,提供Robot SPI,帮助快速驱动移植硬件,以及适配硬件的服务定制。以此为例展望Tesla Bot,我们预计特斯拉机器人会发展出类似IOS的自己的框架。以统一的硬件承载无限多元多场景的算法应用,开发者定义软件,而软件定义机器人并定义未来。目前,根据路透社报道,特斯拉招聘信息显示公司有望在工厂中部署上千人形机器人Optimus,现在工业范围内应用,未来拓展到各个领域,在世界范围内的出货量有望达到百万级别。 投资建议:建议关注1)三花智控、绿的谐波、鸣志电器、双环传动;2)江苏雷利、禾川科技;3)中科三环、拓普集团、保隆科技、恒帅股份、旭升股份、银轮股份;4)汉宇集团、中大立德、大族激光、国茂股份;5)奥普光电、汉威科技; 6)软件相关:科大讯飞、拓尔思、海康威视、优必选、云从科技、奥普特、奥比中光、凌云光等具备机器人布局的AI龙头。 风险提示:特斯拉人形机器人延迟发布风险;假设和测算误差风险;销量不达预期、经济下行超预期风险。 1.机器人是超越版智能手机,软硬件综合有望创造强大生态 机器人是超越版的智能手机,仅有硬件无法应用,需要配合软件算法形成综合协同。 1)统一的硬件是机器人作业的基础,要求的是高精度、高灵敏度、高力矩,以最大限度地满足不同活动对机器人活动的要求。2)而机器人的功能实际上则由综合算法来实现,需要智能感知能力、运动控制能力、感控一体技术、AI算法等软硬件能力的综合配合。 一言以蔽之,硬件是机器人的躯体,软件是机器人的灵魂,软硬综合、灵肉结合,才能形成完整可用的智能机器人。 图表1:特斯拉人形机器人将搭载AI软件算法 对标苹果IOS生态可发现,统一硬件+开放算法框架有望塑造出异彩纷呈的强大生态。 回顾苹果生态发展之路: 1)最初的封闭:2007年1月MacWorld大会,划时代的苹果iPhone首次面世,将创新的移动电话、宽屏幕的触控iPod、突破性的通讯装置融于一体,引入多点触摸屏幕和全新的用户界面,并开创了移动设备尖端功能的新纪元,重新定义智能手机,一经推出即产生极大影响。然而起初,iPhone只能运行第三方的Web应用程序,利用Safari引擎,开发者可以借助Web 2.0 + AJAX创造出应用程序,然而当时移动网络速度较慢,因此该路径发展速度并不理想,第三方应用程序功能开发受限; 同年七月,iPhone的破解使得黑客们开始自行编写程序,iphone生态日渐繁荣。在此基础上,原本反对开放的乔布斯最终亦走向官方开放苹果生态。 图表2:初代iphone仅允许开发者采用Web 2.0 + AJAX来创造第三方应用程序 2)走向开放:2008年3月,苹果召开一次特殊的发布会,正式发布了iPhone SDK。对于如何进行开发,Scott Forstall首先揭秘系统架构(Cocoa Touch、媒体、服务、内核),其次介绍开发基础(API)、开发工具(Xcode)、应用商店(AppStore),最后展示首批应用,标志着IOS系统从此向开发者开放生态。 3)快速繁荣:在此之前,iPhone OS已有上千款的Web应用程序和数百款原始应用。虽说如此,由于没有官方支持、底层接口尚未探清,黑客破解后工具链来开发的原始应用并不稳定,程序显得相当稚嫩。iPhone SDK则终结了这一乱象——它为iPhone OS提供可靠、快速和安全的开发方式,免除开发者的后顾之忧,掀起一股移动开发狂潮。根据statistia数据,截止2022年3月,苹果appstore上上架的app数量已接近480万。 图表3:2008-2022年苹果Appstore上架app及游戏数量 苹果不仅可以从appstore中出售的应用处收取佣金,并且应用生态的存在具备平台规模效应,极大地巩固了苹果的竞争护城河。根据analysis group由苹果支持撰写的报告预计,2020年苹果Appstore总销售额高达约640亿美元,2021年该金额预计可达860亿美金。 图表4:2020年苹果App store总销售额高达约640亿美元 我们认为,机器人作为超越版智能手机,具备和智能手机发展类似的特征,因此具备硬件能力、软件基础以及开放框架的机器人厂商有望复刻智能手机时代的发展,随着渲染、开发语言、开发工具、应用经验日益丰富,开发者越来越多,应用不断迭代升级,创造出异彩纷呈的强大生态。而非人形机器人硬件形态单一,功能受限,无法承载多种场景应用,因而无法吸引大量开发者,也无法形成生态。因此,唯有人形机器人才相当于超越版的智能手机。 2.机器人智能感知认知技术:机器人的“眼睛” 感知认知技术是机器人的“眼睛”。作为人工智能最主要的核心技术之一,计算机视觉是一个从视觉传感器获取图像并利用计算机进行处理、检测、识别、理解和推理的技术,是智能机器人感知和认知世界的最主要途径。计算机视觉为机器人安上了感知外界的“眼睛”,使其具有人一样的视觉功能,从而实现各种任务。 由于机器人的运动性,相比于其他领域的计算机视觉技术,机器人面向的是一个动态环境,因此视觉技术面临更多的挑战。机器人在运动、移动和操作中,视觉传感器所获取的视频信号会遭受不同程度的质量下降,例如视频的抖动、模糊、闪烁等,这会造成后续的图像识别检测困难;同时机器人自身配备的大部分是嵌入式、低功耗的硬件平台,对视觉算法设计的复杂度以及优化要求更高。 以下以国内人形机器人领军企业优必选为例,分析人形机器人所需智能感知认知能力: 2.1通用目标检测算法:对人和物体进行特定检测与识别 通用目标检测算法是智能机器人通过视频输入对人和物体等进行特定的检测与识别分析,进而输出结果的一种人工智能技术,是智能机器人感知世界的主要途径。优必选深入理解机器人应用场景下的计算机视觉需求,建设了一系列与机器人相关的检测、识别、跟踪算法,并且针对机器人嵌入式端有限的计算能力,公司通过对算法进行汇编级优化,实现了低功耗嵌入端高精度、毫秒级的响应,解决了智能算法在资源有限的终端实时运行的困难,满足了公司各类机器人产品在多种应用场景下的需求。 图表5:优必选机器人中用到的通用目标检测算法 2.2人脸检测相关技术:对人脸及相关元素进行识别 面向智能机器人应用,优必选研发了包含人脸检测、人脸对齐、人脸识别、人脸口罩识别在内的相关技术。1)在人脸检测技术上,优必选自研了多任务框架完成人脸检测和关键点定位,成功提高了人脸的召回率和降低人脸误检率。2)人脸识别任务上,自研了数据增强技术以及在训练过程中加入类实际场景的运动模糊增强,解决机器人主动拍摄中的运动模糊问题。在机器人的人脸识别应用上,复杂场景中如不同角度、表情及低分率、低照度都会给人脸识别造成一定的挑战,公司自研了基于深度学习的人脸质量评估、人脸姿态估计、人脸逆光检测等算法;并基于上述算法,大大改善了人脸识别的效果。3)除人脸识别外,公司还自研了人脸属性多任务算法,单个模型完成多个实用属性的预测,如人脸姿态、年龄、性别、颜值、微笑、眼镜状态、口罩状态等,提升了机器人的智能性及趣味性。详细技术总结如下表: 图表6:优必选机器人中用到的人脸检测相关技术 2.3计算机视觉底层算法:图像增强、视觉特征检测等其他技术 除了上述检测识别和理解推理算法外,公司还研发了计算机视觉底层算法,如图像增强算法和视觉特征检测算法。 1)图像增强算法。由于机器人常需要在行走及颠簸、光照不足、逆光等困难条件下拍照而造成图像质量不佳而影响交互。为了克服这样的问题,公司研发了核心的图像增强技术,能够在逆光、抖动等条件下拍摄出较佳的图像,提高了人脸检测、人脸识别等的准确性,改善机器人与人交互的效果。 2)视觉特征检测算法。由于机器人交互经常面临光线、场景变化等挑战,给视觉导航与定位也带来不少困难。公司研发了深度步态模板分析技术,通过与深度学习相结合,以及大量的样本训练形成较为完善的模型,从而较好地克服了光线、场景变化所带来的挑战,在室内和室外以及变化的环境下能够有效提取不被干扰的视觉特征,提高视觉定位的成功率和准确性。 图表7:优必选机器人中用到的计算机视觉底层算法 3.机器人运动控制技术:机器人的“四肢” 3.1硬件部分:伺服系统、减速机、控制器等为机器人核心零部件 机器人核心零部件为伺服电机、减速机、控制系统、驱动器等。机器人产业链的上游主要为零部件供应商,核心零部件为伺服系统、减速器、控制系统等;产业链的中游为机器人本体提供商与集