1 版权声明 本报告版权属于CCSATC601大数据技术标准推进委员会,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:CCSATC601大数据技术标准推进委员会”。违反上述声明者,将追究其相关法律责任。 前言 近年来,汽车行业数字化程度不断提升,正在由传统硬件制造向“电动化、智能化、网联化”方向转变。“十四五”时期,随着人工智能、大数据等基础技术的渗透应用,汽车产业数据治理、应用及服务能力将加速成熟,并孕育产生庞大市场需求。 近年来,我国汽车数据迎来快速发展,但汽车企业数据能力参差不齐、数据能力体系建设缺乏规范指导、数据安全合规与应用难以平衡等问题依旧突出。为促进数据要素与汽车产业深度融合,推进汽车数据优秀实践经验和共性知识的积累推广,CCSATC601汽车数据工作组编制了《汽车数据发展研究报告(2023)》。报告对汽车数据产业发展现状、产业整体视图、相关政策法规、能力体系建设进行了系统梳理和深入调研,汇集了汽车数据产业发展典型实践和经验做法,研判了汽车数据产业发展关键趋势,总结机遇和挑战,并为下一步建设发展提供参考建议。 本报告提出了汽车数据能力体系建设的整体视图,展示了汽车数据发展创新中的典型实践,研判了汽车数据在新时代的主要发展趋势,总结了汽车数据面临的机遇挑战并给出建议,旨在为汽车行业数字化中的数据发展提供参考和指导。由于时间仓促,水平所限,本报告仍有不足之处,欢迎联系liubin1@caict.ac.cn交流探讨。 编制单位 中国信息通信研究院云计算与大数据研究所、中国第一汽车集团有限公司、广州汽车集团股份有限公司、广州小鹏汽车科技有限公司、赛力斯集团股份有限公司、吉利汽车研究院(宁波)有限公司、一汽-大众汽车有限公司、北京罗克维尔斯科技有限公司、广州汽车集团乘用车有限公司、广汽埃安新能源汽车股份有限公司、广汽集团汽车工程研究院、广东行致互联科技有限公司、广汽丰田汽车有限公司、大圣科技股份有限公司、广州汽车集团商贸有限公司、广州祺宸科技有限公司、华为云计算技术有限公司、腾讯云计算 (北京)有限责任公司、北京菱云科技有限公司、联通智网科技股份有限公司、瓴羊智能科技有限公司、思特沃克软件技术有限公司、杭州趣链科技有限公司、中电金信软件有限公司、北京科杰科技有限公司、北京数安行科技有限公司、国汽智图(北京)科技有限公司、浙江数新网络有限公司、湖北数据集团有限公司、杭州比智科技有限公司、上海零数众合信息科技有限公司、海南数造科技有限公司、北京精益价值科技有限公司、合肥市智能网联汽车创新中心、北京火山引擎科技有限公司、杭州云之重器科技有限公司。(排名不分先后) 编制专家 刘宾、姜春宇、蒋汉卿、许明月、刘年强、陈智宏、王潼、姜雅君、刘纪陇、王思涵、杨力、尹雷、孙涵蕊、姜鹏、徐聪颖、谢俊超、刁榕辉、孔繁健、谢宇政、万海涛、邓卫华、冯韬、黄敬、刘恺、邱剑辉、梁鹏程、刘海成、陈湛、李博、郭佳、张♘、黄超、杨华卫、陈红、安志远、陈德江、李骁、王增鑫、蔡洁、方婷婷、邢栋、夏世纪、张一剑、冉熙、杜啸争、王笑非、郭振强、朱建勇、刘玉红、张珣、狄凌、王翠丰、张云青、董志威、海胜、周佳乐、范艺萌、兰春嘉、杨珍、史凯、鲍立飞、李家振、胡坚耀、汪勋绩、邬亚林、孙昕。(排名不分先后) 目录 一、汽车数据发展现状1 1.1汽车数据发展背景及范围1 1.2全球汽车数据发展现状5 1.3我国汽车数据发展现状7 二、汽车数据能力体系9 2.1汽车数据能力体系整体视图9 2.2汽车数据平台体系11 2.3汽车数据治理体系13 2.4汽车数据应用体系17 2.5汽车数据流转体系19 2.6汽车数据安全与合规体系23 三、汽车数据典型实践28 3.1数据平台建设类28 3.2数据资产管理类31 3.3数据安全合规类33 3.4行业数据应用类34 3.5数据流转运营类38 四、汽车数据发展趋势40 4.1构建统一互通的汽车数据基础设施40 4.2汽车数据治理和运营能力全面提升41 4.3汽车数据要素化驱动价值释放44 4.4技术与制度协同助力汽车数据安全合规45 4.5数据全方位赋能汽车行业数字化转型47 4.6基于数据的汽车行业大模型加速涌现48 五、总结与展望50 5.1机遇与挑战50 5.2发展建议51 一、汽车数据发展现状 1.1汽车数据发展背景及范围 1.1.1数据驱动汽车行业高质量发展 近年来,汽车行业数字化程度不断提升,正在由传统硬件制造向以“电动化、智能化、网联化、共享化”为特征的新型移动出行终端转变。汽车与电子、通信、交通、软件等产业加速融合,带来爆发式的数据增长。据公开数据统计,每辆智能网联汽车每隔几秒钟就会产生超过150个参数,每个小时生成5G-250G数据,每天将收集多达10TB的数据,要对这巨量数据进行传输、存储、处理都存在着巨大挑战。与此同时,云计算、物联网、人工智能、区块链、5G等新一代信息技术正加速向汽车行业渗透,随之而来的数据环境也呈现出多样化、复杂化、个性化等特征,大量文本、图片、视频等非结构化数据被产生、存储和使用。在智慧交通的场景中,各类传感设备采集的数据逐渐从单一内部的小数 据形态向多元动态的大数据形态发展,产生的海量数据蕴藏了巨大价值,对于汽车行业数字化转型意义重大。 数据是实现汽车智能化和网联化的基础要素。通过收集、处理和分 析各类传感器采集到的环境信息、用户行为信息以及其他来源(如地图服务商)提供的信息,智能网联汽车可以实现对周围环境和自身状态的感知,并根据预设或学习算法进行自主决策和控制。此外,数据也是促进产业创新和协同发展的重要资源。通过对海量数据进行挖掘和利用,可以为产品设计、服务创新以及跨领域融合提供支撑,并为用户提供更加个性化和高效便捷的出行体验。 数据赋能汽车行业数字化转型。一是驱动汽车技术创新与产品能力 提升。通过汽车数据进行价值挖掘与持续反馈,可以优化车辆的自主驾 驶、智能导航、安全驾驶等功能,实现与用户及外部环境的实时交互,从而提高驾驶的舒适性和安全性,提供更高效、更安全的交通服务。二是通过降本增效为汽车制造产业带来显性价值提升。数据要素贯穿了汽车设计、研发、制造、质检、物流、销售、运维等全生命周期的各个环节,通过数据采集、分析和预测,能够优化设计周期、生产计划、制造过程、库存管理、供应链协同与客户管理,提高生产效率、质量与供应链水平,降低管理成本。三是提升汽车行业市场化服务能力。新一代汽车消费者不再只关注车辆本身,对于汽车改装、专业维修、配件推荐等多元化的服务需求将越来越大,通过分析用户行为、习惯和需求,车企可以更好地了解用户需求,有助于预测市场趋势、调整销售策略,同时支持个性化的维修和维护服务,助力拓展市场空间。 汽车数据要素市场蓬勃发展。汽车行业上下游链条长、参与主体多、 规模化程度高,数据资源类型多、总量大、范围广,是我国数据要素市场建设的重要组成部分,具有数据要素创新、场景应用、示范、标杆效应。汽车产业链的不同环节,包括研发、验证测试、销售、售后等,都存在以数据赋能发展的需求。当前,新兴数字化技术与汽车产业的加速融合,汽车的用户需求、产品形态和产业价值链正在发生巨大变化。汽车产业从造车到用车构造出一条传统服务价值链,链条上每个环节持续产生数据,数据附加值随着数字化的深入而持续增长并实现拓展,构建出新的数据赋能价值链。构建面向汽车行业数据要素流转、交易的统一大市场,有助于释放汽车数据要素价值,推动汽车行业高质量发展。 1.1.2汽车数据定义及内涵 汽车数据作为一项新兴产业,相关概念落地时间较短,其内涵及范围正在发展过程中逐步形成。从定义来看,目前我国已出台了多项指导 文件及国家标准,对汽车数据概念进行了明确。2021年7月,国家互联网信息办公室等部门联合印发《汽车数据安全管理若干规定(试行)》 (以下简称《若干规定》),指出“本规定所称汽车数据,包括汽车设计、 生产、销售、使用、运维等过程中的涉及个人信息数据和重要数据”,并对个人信息、敏感个人信息和重要数据进行了解释和定义,其中个人 信息是指以电子或者其他方式记录的与已识别或者可识别的车主、驾驶人、乘车人、车外人员等有关的各种信息,不包括匿名化处理后的信息。国家标准GB/T41871-2022《信息安全技术汽车数据处理安全要求》沿用了这一定义,规定了汽车数据处理者对汽车数据进行收集、传输等处理活动的通用安全要求、车外数据安全要求、座舱数据安全要求和管理安全要求。根据上述汽车数据定义,其范围覆盖了与汽车相关的各类业务活动所产生或关联的数据,包括“车”“路”“云”“网”“图”等各类数据。 为保证与国内现有政策标准的一致性与连贯性,本报告中涉及的汽车数据沿用上述定义及内涵,从汽车设计、生产、销售、使用、运维等过程中涉及的个人信息数据和重要数据出发,聚焦数据采集、传输、存储、治理、分析、应用、安全和合规等方面,推动汽车数据相关研究。 1.1.3汽车数据分类及范围 随着技术的进步和市场的需求,汽车行业正在经历一个前所未有的数据量增长期。一是数据来源和类型多样化。智能网联汽车的数据来源丰富多样,包括车辆状态的实时监测数据、用户与车载系统的互动信息, 以及车与车、车与基础设施之间的通信数据。这些数据从车载传感器的物理参数到用户界面的行为习惯,再到车联网的动态交互,共同构成了一个覆盖车辆运行、驾驶行为以及车辆健康状态的全方位数据集合,为智能驾驶和个性化服务提供了基础。 二是数据分类明细化。汽车数据的细分是理解和应用这些数据的关 键,目前大体上可以分为三类:记录车辆的机械和电子系统操作情况的操作数据,如发动机转速、油门位置、刹车使用等。它们对于确保车辆性能和安全至关重要;反映驾驶员的使用习惯和驾驶风格的行为数据,如加速和刹车模式、转向习惯、速度偏好等。这些数据有助于个性化用户体验并可以提高驾驶安全;以及从车辆的外部传感器收集的环境数据,包括道路类型、交通状况、气象条件等。这类数据对于自动驾驶系统至关重要,能够帮助系统做出更准确的决策。 2022年3月7日,工信部印发《车联网网络安全和数据安全标准体系建设指南》(以下简称《建设指南》),其中提出要制定《智能网联汽车数据通用要求》,该标准草案中根据主权边界和来源,将汽车数据分为车辆数据、个人数据及车外环境数据,涵盖了数据的采集、传输、存储、使用、共享、销毁等全过程,具体如下表所示。 表1《智能网联汽车数据通用要求》规定的数据范围 大类 小类 数据范围 车辆数据 车辆基础数据 车型型号、生产企业、品牌、VIN、发动机号、电池编码、软硬件版本号、车牌、颜色、尺寸等车辆特性数据 车辆运行数据 车身系统、动力系统、电气系统、舒适系统等车辆运行状态参数 感知决策数据 车辆行驶控制、灯光控制、环境感知融合算法等指令数据 应用服务数据 出行辅助数据(如天气预报、交通拥堵、导航等)、影音娱乐数据(收音机、新闻等)及生活服务数据(日程提醒、停车场推送)等 个人数据 个人身份数据 用户身份证号、电话号、住址等身份信息,用户网络身份标识信息及个人面部特征、指纹、虹膜、声纹等生物识别信息等 用户服务隐私数据 用户使用习惯数据、个人通话数据、车内音视频数据、用户财产信息及用户监测数据等 车外环境数据 环境感知数据 通过摄像头、雷达等传感器从汽车外部环境采集的道路、建筑、地形、基础设施数据等 V2X数据 实时道路交通信号及监控数据、车路协同数据等 位置信息数据 卫星定位数据、惯性定位数据、差分定位数据等 1.2全球汽车数据发展现状 1.2.1全球汽车数据政策发展现状 欧洲围绕汽车数据领域开展全方位布局,率先探索数据伦理、数据安全、数据监管等专项政策,从法律层面为使用个人信息的企业提供保障。2018年5月,欧盟出台了《通用数据保护条例(GDPR)》,成为全 球个人数据安全立法中极具标志性的一部法案,其中对于欧盟内智能网联汽车产品的个人数据安全具有直接约束力。2021年3月,欧洲数据保护委员会最终通过了关于在联网车辆和出行相关应用程序