技术说明 美国校车仓库的数据集 作者 : 杨绍、利亚 · 拉泽、格雷戈里 · 塔夫 CONTENTS 本技术笔记描述了创建美国首个学校巴士停车场位置数据集所采用的方法。该国约有五十万辆学校巴士,但几乎没有关于它们存放地点的公共信息,尽管学校巴士停车场可能产生空气污染热点,并可能需要电网基础设施升级以适应未来的巴士电动化。 我们通过基于对象的方法并使用遥感数据创建了这个数据集。我们的主要空中影像来源是国家农业影像计划(NAIP)数据集。我们分析了NAIP影像以根据车辆的颜色和大小定位单个校车,并随后将校车群聚类识别为潜在的仓库,然后通过视觉验证这些聚类。生成的数据集包含全美48个州及华盛顿特区共计11,309个仓库点。其中,51%(5,730个仓库)位于学校附近,定义为距离最近的学校不超过350米。 我们通过与包含506个仓库的独立参考数据集进行比较来评估数据集的准确性,这些数据集来源于两家校车运输公司的记录。我们发现了一致性良好,遗漏错误率为15.2%(77个仓库)。这个数据集代表了仅有的几个使用亚米到一米分辨率的数据进行大陆尺度应用的对象检测的遥感项目之一。 技术说明文档记录了出版物、交互应用或工具背后的研究或分析方法。. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .建议引用 :邵,Y.,L. 泰泽,和G. 塔夫。2023. “美国校车仓库数据集”。技术说明。华盛顿特区:世界资源研究所。在线访问:doi.org/10.46830/writn.22.00019. 介绍和动机 可在地方政府或学区一级访问 , 但尚未以集中方式汇编沿学校巴士路线居住的人群较之于其他人群较少受到校车产生的污染影响,因为校车在整个车辆车队中数量相对较少,且大多数校车每天仅运行几次指定路线。因此,本研究的主要目标是在高分辨率遥感数据的基础上绘制学校巴士停车场的位置,创建一个开创性的数据集,该数据集能够精确指出美国各地的停车场位置。 近一个世纪以来,标志性的黄色校车在使数百万无法通过其他方式上学的孩子获得教育方面扮演了革命性角色。全国约有50万辆校车每年行驶27.1亿英里(SBFM 2023年),校车在美国是最普遍和可见的车辆之一,无论是在哪个州或社区,都能见到它们的身影。在2019-20年间,每天有超过2000万学生乘坐校车上学,全国范围内大约有5390万从幼儿园到12年级的学生(NCES 2022a)。 此外,尽管缺乏与学校巴士停车场直接相关的确切数据,但大量环境正义和公共卫生文献描述了此类不受欢迎或危险设施(如卡车停车场和污染工业设施)如何不成比例地位于或靠近有色人种社区、低收入社区,或是其他被边缘化或服务不足的人群附近,导致健康危害(Brown等,2003;Cook等,2021;Linden,2008)。研究还描述了靠近许多学校的交通相关的空气和噪音污染的高水平,这些污染往往分布不均且与健康危害有关(Brunekreef等,1997;Li等,2009;Chakraborty和Aun,2023)。 现今超过90%的校车采用柴油动力(APP n.d.)。柴油尾气污染已被证实与严重的身体健康问题有关联,可能导致哮喘、癌症和其他呼吸系统疾病,对儿童的认知发展也会产生影响(Austin等,2019;Beatty和Shimshack,2011)。历史上受到不公平待遇的社区更有可能因种族歧视的借贷、交通、住房及规划政策而遭受车辆产生的空气污染。 集中的黑色和棕色社区靠近高速公路和其他污染源(ITDP 2021).部分原因在于其关联的健康和气候效益,学校巴士的电气化需求正在增长(Lazer 和 Freehafer, 2023),同时公共资金大幅增加用于购置电动学校巴士(Levinson 和 Achury, 2023)。尽管美国的学校巴士数量相对于中型和重型车辆总数较小,但学校巴士的电气化可以提高公众对电气化的认识,并为社区成员提供学习机会。 因此,此数据集的主要应用场景之一是分析校车停靠站在服务不足区域的位置程度,并建立一个证据基础,以更好地支持社区成员、倡导者和其他利益相关者的工作,从而提高服务不足地区的空气质量、公平性和公众健康(胡等,2021)。 此学校巴士停车场数据集的其他可能用途包括电力电网规划和韧性建设。学校巴士停车场的具体位置可以帮助公用事业公司评估未来电动校车的电力需求,并帮助他们规划新的充电站(Huether, 2021)。此外,该数据集可用于识别面临气候和其他灾害风险的学校巴士停车场,这些停车场可能不是投资大型电力基础设施的理想候选地。相反,它还可以用于识别可以作为韧性中心的停车场,利用电动校车电池中可以存储和移动的电力,或者将其馈回到电网。 根据与世界资源研究所(WRI)电校车倡议项目员工的咨询,我们了解到有两个群体特别容易受到校车尾气的影响。第一类是乘坐校车的人群,包括学生、司机和助手。关于校车柴油尾气对这些人的影响,已有越来越多的研究文献探讨。第二类则是居住在学校公交枢纽附近的人们,因为校车通常会长时间停放在枢纽内,并频繁进出。截至2023年5月,我们未能找到全国性(或甚至州级)的学校公交枢纽位置数据集或地图,也没有研究探索居住在学校公交枢纽周边社区的特点,或者这些枢纽如何影响周围的社区环境。此类信息可能是 方框 1 | 校车车辆段的定义 校车停车场(也称为校车场、车库、车库或停车场)通常是用于停放多辆校车的停车区域。这些停车场可能由学校、学区或私人车队运营商所有并运营,位置可以位于学校校园内或单独的位置。一些停车场还提供维护设施。它们作为车队管理人员、驾驶员和其他工作人员的工作场所。这些校车停车场的位置对于规划公交路线至关重要,包括满足各种限制,如旅行时间、学校时间表和校车容量。a 如果一个设施内包含四辆或更多校车,但不属于提供校车运输服务的实体,则该设施并非校车停车场。这一标准导致了汽车修理店、废品回收站、农场和滑雪度假村等地点的剔除。 在对象检测和聚类阶段(“详细方法”部分的步骤1-3),我们使用了标准1。而在视觉解释过程(“详细方法”部分的步骤4)中,我们应用了标准2-4。标准2和3基于假设,这些附近的停车场很可能由同一学区或车队运营商所有或管理,并且考虑到它们作为仓库可以更好地支持数据集的预期应用场景,因为它们在诸如电动汽车电网升级等场景下被视为一个实体。尽管仅通过空中图像的视觉检查无法完全准确地应用此操作定义,但我们利用对学校运输和土地使用模式的知识来作出决定,并根据需要与Google Maps上的街道视图或商业信息进行核对。 为了创建这个数据集,我们制定了一项工作定义,以确定学校巴士的布局构成一个学校巴士停车场的标准,并确立了以下四个条件,只有满足这些条件才能被认为是这样的设施: 1. 在移动窗口大小为80米(m)x 80米的情况下,四辆公交车被视作一个学校巴士停车场。2. 如果一个设施包含多个停车场或一组公交车,仍然被视为一个停车场(参见图B1-1)。3. 同样地,如果公交车停放在相邻或直接对面街道的两个停车场内,仍然被视为一个停车场(参见图B1-2)。 图B1-2. 两座直接对面位于街道两侧的学校巴士停车场(紫色点)示例,被视为一座学校巴士停车场 图B1-1. 学校停车场示例,包含两个校车停放区域(紫色点),被视为一个校车停驻点 方框 1 | 校车仓库的定义 (续) 尽管大多数校车停车场是露天停车场,但有些地方设有遮盖区域或完全封闭的结构(称为“封闭式停车场”)(见图B1-3)。这些也被视为本数据集的目的地。封闭式停车场在极端气温或天气条件以及密集城市地区较为常见。我们使用的方法检测到了一些封闭式停车场,因为它们也包含了停放在户外的校车,如图B1-3所示,但我们认为我们遗漏的大部分停车场应该是封闭式的。有关潜在遗漏错误的进一步讨论,请参阅“挑战与局限性”部分。 Note: a. Park 和 Kim 2010。来源: Esri 2023. 方法和数据 这种做法未能成功实施。开源地图如OpenStreetMap上关于学校巴士停车场的信息非常有限。Google Maps上的信息质量更好(尽管仍然不完整且偶尔存在错误),但根据其服务条款,从Google Maps抓取数据是被禁止的,我们为非营利研究目的请求豁免也被拒绝。 考虑的其他方法 在确定下文描述的遥感方法之前,我们首先探索了几种替代方案。我们最初尝试从州级机构收集数据,如教育厅或交通部门,这些机构在许多州维护校车库存信息。这种方法成功地编纂了美国校车车队的数据集(Lazer等,2023年),但没有我们联系到的州级机构持有关于校车仓库的信息。我们也考虑从学区获取信息,因为它们有关于为学区服务的仓库位置的信息。然而,在美国有超过13,000个学区(再加上数百个或数千个私人车队运营商),他们并没有任何标准化的数据请求流程或仓库位置信息格式。从近14,000个学区和运营商中逐一收集数据是不可行的。 方法概述 我们采用的方法来寻找校车停车场是分析高分辨率航拍图像(分辨率为0.6至1米)以识别单个校车的集群。由于校车具有特定的光谱特性和尺寸特征,我们能够将检测校车视为光学遥感中的典型目标检测问题。它们被法律要求涂成“校车黄色”(尽管有些有白色顶棚),并且仅制造了三种主要类型(A、C和D)以及具有特定尺寸。类型B的校车非常罕见,在美国车队中仅占约0.25%(Lazer等人, 2023),使用遥感技术很难与类型C区分开来。我们标记密集的校车集群为潜在的校车停车场(在移动窗口大小为80米x80米内包含四个或更多校车——选择至少四个校车作为平衡发现小型停车场并避免标记全美各地道路上过多非停车场集群的折衷)。在一米甚至更精细的空间分辨率下,单个校车和停车场在视觉上可区分,这使得可以进行停车场的视觉验证(参见...) 另一个初步尝试涉及网络信息检索。我们尝试使用网页爬虫(一种系统性浏览互联网并收集网页信息的网络机器人)从学区网站中提取校车停靠站的位置,这些信息基于国家教育统计中心(NCES)的通用数据集,该数据集包含了多个学区的网址(NCES 2020)。然而,由于学区网站的格式和标签不一致,以及关于校车停靠站信息的发布频率较低,这导致了爬取过程中存在诸多挑战。 美国利用空中影像(Robinson等,2022年);我们的研究与众不同之处在于我们检测的是更小的对象,并采用了多阶段方法以提高准确性。鉴于需要处理的空中影像数量庞大,我们的方法平衡了数据可用性、算法性能和速度、数据存储以及整体操作效率等因素的考虑。例如,由于缺乏现成的学校巴士训练数据,开发大规模深度神经网络并不现实。传统的基于对象的图像分析或基于知识的方法,结合常用的机器学习算法如随机森林,更适合此研究。然而,大量的数据和计算强度仍然构成了显著挑战。 第四步. 视觉解释)。我们也研究了识别整个学校巴士停车场作为单独对象的方法,但这种方法因停车场表面材料的多样性(如沥青、混凝土、沙子或草地)以及停 车场规模和布局的广泛差异而不太成功。 已开发出多种算法和方法,利用高分辨率(低于五米