发言人00:00 海天瑞声20240711_原文 2024年07月11日21:53 今天我们非常有幸邀请到了海天卫生来给咱们做一个分享。海天卫生是自动驾驶领域非常中药的数据相关方,然后在产业方面也是深耕了非常久了。下面有请这个公司的袁总来给大家做一个具体的分享。 发言人00:21 你好,我是海天运营的张哲。今天代表海天来分享的是两位,一位是我们的VT兼CTO兼自动驾驶事业部的负责人黄一凯黄总,然后是我本人,现在先请黄总跟大家开始介绍我们自动驾驶这块的业务。好,国盛证券的朋友和各位领导老师大家好,我是黄玉凯,海淀这边的CTO也同时也分管自动驾驶的业务,然后我先用大概15分钟左右时间,快速的讲一下我们海天瑞生这边在自动驾驶这个板块的一些业务的一个状态。行,我就快速过一下。这个PT稍微有点多哈,我前面公司介绍部分我快速略略过了,我们主要会谈一谈我们的一些定制数据,服务平台化管控和产品数据集这三块。最后如果还有时间可以快速看一下我们一些基地方面的一些信息。 发言人01:21 公司这一边的话,我估计大家肯定也知道,我们是全球领先的一个人工智能这种AI训练数据的提供商。然后也是国内首家应该也是行业唯一的一家上市企业。然后我们这个主要的服务的业务形态,就是我们提供这种训练数据的服务。 发言人01:42 然后涵盖的方向其实从基本上人工智能这个方向都涵盖,语音的话ASRTTS,然后计算机视觉,文本大模型都做。当然自动驾驶是这一场我们今天主要关注一点。所以这个PPT也是着重摘录了一些内容,专注讲这个自动驾驶数据服务相关的一些内容,这个是我们的一个客户形态。其实我们已经其实几年前做到了全球的这种AI产业巨头全覆盖这么一个状态,所以能看到其实上面的话是我们整个AI行业比较大的这种客户群。比如说国外的是像微软、谷歌,meta、亚马逊。然后国内的话bat然后像字节跳动,华为之类,都是我们常年的,有的都是十几年的客户。 发言人02:32 然后因为这个是主要关注自动驾驶,所以下面两个矩阵主要是从自动驾驶这块来看。左边的是这种以车企包括传统车企新势力造车势力为主的一些客户,然后右边是一些TOone算法公司。基本上也能看到我们国内常见的这种客户群体都是我们都是我们这个服务的对象。 发言人02:55 安全合规。其实这块,因为其实整个AI数据服务安全的位置是我们的一个红线,也是从事这么多年来一个竞争力之一,文字我就不多做表述了。其实在AB这个自动驾驶数据服务这个方向,就对于这个数据的安全数据和会尤其看中。所以这块我们也是提一下是我们的一个区别,或者说针对我们的同行是一个比较有竞争力的一个点。 发言人03:23 然后另外一个就是因为自动驾驶数据和很多和社会有关,所以我们也是行业最早拿到这个一侧资质的公司所以这块也是帮助我们能够做一些和比如说道路一些数据采集相关的一些业务也能展开,这个就不过了。我们有很多大量资质来保证我们整个做AI数据服务的合规性。 发言人03:49 然后我们的这种服务的或者合作方式,其实分成这么几类。最大的一类其实就是定制的数据服务,包括数据采集、数据标准或者质检。然后还有一类右上角那个产品数据库,我们其实有大量的,我们有1500多个1500多1500多个数据库的。这个能够工程化的非常高质量的,而且完全合规可可销售的这么一个数据库。这个在全球来说应该也是是啊非常领先的一个状态。Ok然后当然软件方案我们的因为我们投入大量的研发实力,打造了一个一体化这种数据标注服务平台。然后在自动驾驶领域,数据标注这个平台是非常关键的。 发言人04:28 所以我们也能提供很多的技术平台的这种对外的服务能力,当然激励也是一个重要的一个服务的方式。好前面是简单过了一下我们公司的一些基本情况,主要针对的还是自动驾驶的这块业务这块。然后定制服务这边的话看一下主要我们基本上我们这边对于针对自动驾驶这个场景的话,我们各种各种的应用场景,各类场传感器和这各种数据场景基本上都有过经验,都做过这种相关的或者相似的这种项目。就是。 发言人06:04 是一些案例,主要是我们做这种数据采集的,就是一种就分成大的话分成两类,道路采集有窗外的,我们 会有国内采集也都做过。然后国外像欧洲这种要求采集能力其实挺高,要求很严格,这种我们也都有实际的成熟的案例,然后也做过一些项目。然后仓内的话其实主要是这种这种偏这种DMSMS的这种采集其实也都都做过。 发言人06:35 这块是标注标注我后面几页,其实标注会分的细一些。因为标注现在还是在整个自动驾驶数据服务领域是比较应该说最重的一块,所以这里的话我们像传统的,我们最早切入的是2D料组,也是算法最早对于数据有大量要求的这个领域。我们这边其实基本上可以认为所有的形态都做过,平台都能支持。然后刚前面那个障碍物,这个是路面标线的这种检测的标志标注。而且其他的类型,停车、泊车、泊车场景,还有一些特殊的这种设备的一些标注。然后3D标注是接下来我们后面也是前两年开始做的比较多的,包括这种二三D融合的3D的,然后是单帧的标注,然后现在是连续针,标注会比较多一些。然后也是以这种比如说拉框,或者是二三D联合的标注,以及这种点云分割的大点云的这种处理,都是我们做过的实践项目,也是我们平台一直在改善支持的一个一个一个一个方向。 发言人07:47 盈余分割导体特别是我们现在也能关注到这个趋势。我们因为现在从算法的演进角度来看,AD这边前两年我们推BEV,然后现在是往OCC发展的这么一个趋势来看的话。其实从对数据标准来说,予以分割的这种需求量会缓慢的增加。所以这一点上来说,对于我们怎么去服务商业领域分割这种需求,其实也是做了很多的投入来去做这种支撑。 发言人08:20 第一列标注,然后4D标注,4D标注的话其实也是从去年开始,这种需求也慢慢的会起来了更多。特别是有一些公司,有一些车企,其实偏前瞻性的去投入一些算法力量的话,对于这块的数据是有一些特定的要求的那这样的话对我们这种数据服务行业企业来说,我们也是需要针对性的去做很多的这个能力的建设,包括这种像停车场景的,这里应该是啊车道线的一些标注,然后火车场景的这种实际标注情况。那这里有个稍微有点动画,这个是这种连续阵的,然后点云是这种叠加起来,然后通过这种根据2D视图和这个3D点云的联合的这种效果来去做一些标注。这是这种比较现在还是比较难的一种标注方式,就是点云叠加。我们最大我们现在接触到就是上百帧的这种叠加,然后千万级的这种点点的那种数量的一些标注方式。然后整个的标注也是可能会牵扯到几十类的这种类型的语义分割。 发言人09:37 其实对于标注能力,以及对于这个平台的这个要求,以及对于这个算法预处理和数据质检能力都是提出很高要求的。所以这块我们海天在这块其实走的也是相对比较前面。我们投入了很多的技术人员和项目人员去做做这种项目能力的建设。 发言人09:58 这个可以看一下我们湿地,湿地标注里面,现在来看比较常见的这种实际车道线的标注,主要是帮助现在像NOA,包括不管是这个高速外城区的很多这种自动驾驶的场景,需要的一种数据的标注方式。可以看到这个是我们现在海天自研的平台上的一些配置。像我们基本上能够把大量的算法都,提前放到了这个平台里面。所以能够帮助我们在做这种高难度的标注的时候,能够提高这个数据质量和标注效率的时间。所以。 发言人11:00 其实这块这种这种车道线的在C点一下这种车道线的标注,现在我看到的需求也是往这种演员更密集的情况来看。然后同时我们也能看到有些需求是希望在在点云状态下标注出来的这个车道线能够反向映射回2D的这种视角。然后通过2D图像中多个连续灯里面的那种2D图片的车道线的贴合,长期能够感觉到就是说车企还是希望一定程度希望在能够摆脱对于点云的这种点云设备的高度依赖来去看达到一定的有像车道保持这种基本能力。只依赖于这个2D的摄像头来做,能看到这些的趋势,所以对于我们来说,其实在数据处理的过程中是需要去做一些调整的,来适应算法的一个不断的发展。 发言人11:54 对,这里我们看一下,其实有一个句话叫一建议设置100帧。所以这个其实里面有一个技术难度在于说,我们其实在实体点云标注完了以后,是通过去基于这个内外参的信息以及我们标注的一些人工标注一些结果。然后我们内不是有算法能够把4D标注的数据能够一下映射到不同帧的这个数据中的能力。当然这个可能需要做一些人工的稍微的调整,但整体的标注输入是一个可能说十几倍到几十倍的提升的一个结果。请过来稍微快一些,这个是跳过,这是我们做一些预言性的。 发言人12:41 我们想做一些价值场景的空间重构,希望能够通过这种语义信息来去重构出一个类高清地图的这种方式。前面是做了一些这种,所以从标注就面向标会员的一些平台的一些展示能力的展示,这块其实是面向我们的项目管理。其实像这种面向自动驾驶的数据服务,其实经常要的这个数据量是非常庞大的,而且这个工期一般有很紧。因为其实自动驾驶这个行业,其实对于数据的这个算法的迭代周期是要求是比较高的。所以这点上来说,我们对于项目管理是有一些特殊的一些,我们会做了一些升级,通过平台的方式真情。这 些我都不过了。说我们一些平台上的一些项目管理的能力,这块是说我们平台上其实做了很多这种小的功能,能够帮助我们对于这个数据质量进一步的做做保障。 发言人13:53 比如说像比较有特色,像这个应该我们行业的也比较少的。就是说是通过这种点云框按ID点阵的方式叠完了以后,其实可以看到这辆车在后面几帧中的整个框的预测的就是这个叫什么行动的轨迹。帮助我们的人工来判断一下这个轨迹是否是一个合理的相对比,根据常识来看是否合理。比如像这里可能会大家能看到可能是缺了一个框,所以他就会去去就跳到内层来去再看一下是否是漏发漏标了。 发言人14:32 这一页我们看一下有几个例子,就是我们其实因为海天是有一个独立的算法团队的那上海团队里面我们是针对我们数据服务的整个全过程中,对于算法有需求的。对于算法的需求我们都会做出及时的响应。同时我们也是希望说能够跟紧客户在于自动驾驶这个领域的算法的演变趋势,来帮助我们前瞻性的去做一些数据服务的能力的建设。 发言人15:02 像这里的话我们有一些例子,比如这个是我们视频目标跟踪。基本上这个例子我看到的所有的框可能有点小看不太清,都是我们算法,我们自己的模型识别出来的这种效果。然后这个是点目标检测,这里面的这些数据是我们做预刷出来效果。就说我们拿到这个数据以后,我们会用我们自有的模型先去对数据做一个预处理预标注。然后在这个基础上再看在介入人工的方式,对于数据做精准的校正,来提高数据质量。 发言人15:46 这个是我们比较早的一个模型,是让我们帮我们做这种点云框自动贴合的。也就是说我们行行俗称叫弹性框。就是说当我们在做物体检测的时候,我们拉一个框的时候,其实有一个基本要贴合度。但是对于标准上来说,如果你完全贴合它的调整那个框的大小是占用它主要的一个时间的那对算法这边来说,通过一些聚类算法或者一些深度学习一些方式,是能够帮助他做框的收缩,使得它能够最小最大概率的贴紧的点云的这个物体。 发言人16:17 这个智能追踪也是我们现在能做到。我们有两类的算法,一类就是刚刚前面上面说这种预算的效果,另外一类就是交互式的交互的方式。就是说通过这个标出来,能够在前面一针或者两针对标准的情况下,我们 会去预判这个车后面的行动轨迹,然后去预测后面若干帧的位置和标注效果。当然我们会去交互式的方式说人和算法是迭代的,一帧一帧的往前去处理。所以这也是能够极大提高我们的标注效率的一个手段。可以看到这些红箭头指的都是我们算法的效果。 发言人16:50 这个是我们今年做的一个比较主要的一个模型的升级。我们其实对于路上的这种障碍物,各种目标物做预处理的时候,我们发现对于动态物和静态物的标注方式和模型效果是可以区分开的。所以我们做了一些模型的拆分和标注交互方式的拆分。这样能够帮助我们在处理静态和动态物的不同的物体的时候,能够有不一样的手段。这样其实我们现在综合来看,整个标准效率可以进一步的做提升