授权公开披露 授权公开披露 授权公开披露 授权公开披露 在评估中利用图像数据 遥感与街景图像分析的应用 VirginiaZiulu IEG方法和评估能力发展系列工作文件 ©2024国际复兴开发银行/世界银行1818HStreetNW 华盛顿特区20433 电话:202-473-1000互联网: www.worldbank.org 归属 Pleaseexitethereportas:Ziulu,Virginia.2024.LaveragingImageryDatainEvaluations:ApplicationsofRemote- SensitionsandStreetscapeImageryAnalysis.IEGMethodsandEvaluationCapacityDevelopmentWorkingPaperSeries.IndependentEvaluationGroup.Washington,DC:WorldBank MANAGINGEDITORS JosVaessenAriyaHagh Diana-MarianaStanescu 编辑和生产 阿曼达·奥布莱恩 平面设计 LuísaUlhoa RafaelaSarinho 这项工作是世界银行工作人员在外部贡献下的产物。这项工作中表达的调查结果、解释和结论不一定反映世界银行、其执行董事会或他们所代表的政府的观点。 世界银行不保证本作品中包含的数据的准确性。本作品中任何地图上显示的边界,颜色,面额和其他信息并不意味着世界银行对任何领土的法律地位或认可或接受此类边界的任何判断。 权利和许可 本作品中的材料受版权保护。由于世界银行鼓励传播其知识,因此只要赋予该作品全部或部分归属,就可以出 于非商业目的复制该作品。 有关权利和许可,包括附属权利的任何疑问,应向世界银行出版物,世界银行集团,华盛顿特区西北1818 号H街,美国,DC20433;传真:202-522-2625;电子邮件:pubrights@worldbank.org。 利用图像评估中的数据 遥感与街景图像分析的应用 VirginiaZiulu 独立评估小组 2024年2月 CONTENTS 作者———————————————————————————————————— —————————————————————————————————————— ————————————————————————v抽象缩略语...ix确认书介绍xiii 1.项目背景与挑战 项目Description4 实用挑战5 2.方法学 方法1:光学卫星图像的多光谱监督分类 衍生土地使用/土地覆盖类10 方法2:数字照片的语义分割以获得细粒度 Urban指标19 3.进一步的应用领域 4.结论书目 ii AUTHOR VirginiaZiulu 对应作者 VirginiaZiulu,vziulu@worldbank.org 作者从属关系 世界银行集团独立评估小组 独立评估小组|世界银行集团v 摘要 图像数据提供了回答有关发展举措的相关性和有效性的关键问题的潜力,为决策和完善政策和计划提供了事实基础。 图像数据包含从遥感图像到数码照片的各种来源,为了解城市发展变化和其他地理空间现象的动态提供了大量未充分利用的资源。尽管图像数据无处不在,但在评估国际发展干预措施时仍然相对被忽视,这主要是由于感知到的相关障碍。 然而,机器学习的最新进展和不断增加的计算资源使图像数据更易于访问。 本文探讨了图像数据在评估中的潜力,并介绍了各种数据类型和方法,展示了它们的优势和局限性。 独立评估小组关于世界银行在阿尔巴尼亚巴托雷的城市发展项目的案例研究说明了不同图像数据和方法的实际应用。 通过利用图像数据,评估人员可以深入了解发展干预措施的地理影响。此外,将图像数据与调查和社会经济统计等其他信息源相结合,为加深对复杂现象的理解提供了强大的潜力。 独立评估小组|世界银行集团vii 缩写 GIS地理信息系统 IEG独立评估小组 独立评估小组|世界银行集团ix ACKNOWLEDGMENTS 本文中描述的分析是作为《关于预测城市基础设施项目的经济影响的学习参与》的一部分进行的 。作者承认VictorVergara和MariaElenaPinglo(担任学习参与的共同任务团队负责人)和HiroyukiYokoi(为土地覆盖建模提供分析输入)的宝贵贡献。 独立评估小组|世界银行集团xi INTRODUCTION 图像是最普遍的数据源之一,图像数据涵盖了各种各样的数据类型,包括遥感图像(例如由光学卫星,成像雷达或无人机产生的图像),数码照片,医学图像(例如X射线或从磁共振成像获得的图像)和视频。正如Tanimoto(2012,3)所述,“可能有更多的像素 在现在的世界上(在[网站]上,在人们的个人电脑中,在他们的数码相机中,[等等])比世界上所有图书馆中都有印刷字符。此外,由于更多的数码相机、更高的分辨率和更丰富的格式,全球像素数据量正在增长。Taimoto描述的可用图像数据量的爆炸性增长为分析提供了新的机会。 然而,在国际发展的背景下,与数字和文本数据等其他来源相比,图像仍然是一个被忽视的数据源。这种忽视部分是由于从计算和数据收集的角度来看,使用图像可能非常昂贵。此外,图像数据承载着这样的期望,即需要高度专业化的知识和软件来从图像中提取任何有用的含义。 尽管这些挑战在某种程度上仍然存在,但新机器学习算法的发展和最近计算资源的增加使图像数据更易于访问,并大大降低了使用它们的障碍。地理信息系统和统计软件的强大开源替代方案现在包括用于处理和分析图像数据的强大库。许多基于图像的数据产品也很容易获得,这些产品已经执行了所有所需的预处理任务,并且可以直接用于分析(例如,卫星夜间灯光数据的每月和每年的合成)。 特别是,评估可以从结合图像分析中受益匪浅,特别是那些在定义的地理区域(例如运输路线或开发区)中交付的项目,或者侧重于可以使用地理空间分析工具建模的现象(例如珊瑚白化,海洋垃圾或农作物替代)。通过遥感获得的图像-通常使用数字记录电磁能量与物质之间相互作用的传感器系统从飞机和卫星获得的图像和相关数据的获取,处理和解释(Sabis和Ellis2020)-与地理空间分析特别相关。 独立评估小组|世界银行集团xiii 此类图像通常在全球范围内公开可用,可用于理解广泛的现象,并且具有很高的时间覆盖率,因此适合进行时间序列分析。尽管它们的使用不如遥感图像广泛,但数码照片(例如街景图像)也正在成为地理空间分析的重要数据源,尤其是在计算机视觉时。 技术应用。在评估的背景下,地理空间分析可用于精确量化感兴趣的现象(例如城市范围的变化,大流域的水平衡或森林砍伐模式)中跨时间和空间的变化;可以为了解干预措施的有效性或相关性提供有价值的投入;并且可以集成到更复杂的因果分析中。 本文讨论了使用图像数据可以解决的评估中的具体挑战,并探讨了使用不同类型的图像数据及其相应的方法,同时强调了使用每种类型的数据的优势和局限性。它以独立评估小组的分析为例,选择该分析是因为它包含了1998-2005年世界银行在阿尔巴尼亚巴托雷的城市发展项目的不同类型的图像数据和方法。最终,该文件旨在向评估人员和其他利益攸关方提供信息,说明如何在评估中有效利用图像数据,以帮助确定和理解发展干预措施的地理影响,并在最需要的地方指导发展努力。 xiv在评估中利用图像数据|Introduction 1 项目背景和挑战 地理边界的识别 确定适当的数据源 项目说明 独立评估小组(IEG)一直在探索使用不同的图像分析技术,包括使用遥感图像和数字图像,以了解空间现象随时间的变化(例如,评估土地利用的变化或监测森林砍伐),并帮助回答有关发展干预的相关性和有效性的问题。一个例子是IEG对1998年至2005年在阿尔巴尼亚实施的世界银行土地开发项目(P040975)的影响的评估。该项目旨在为参与城市的服务不足和被忽视的地区提供基本基础设施,并加强负责在国家和地方各级提供城市服务的机构。它大力关注基础设施发展,包括道路 ,供水,排水,污水处理,电力,街道照明和生活垃圾收集。该项目与几个飞行员有关,其中一个 (我们研究的主题)发生在巴斯雷。 Bathore位于卡姆兹(地拉那县卡姆兹市)的行政单位,位于阿尔巴尼亚首都地拉那西北约7公里处,该地区以前是农业用地,主要是国有合作社的一部分。1990年代初进入住房市场的困难以及大量人口从周边地区向中心转移,使地拉那附近的几个农业地区成为非正式发展的沃土。由于该地区吸引了许多试图在地拉那附近定居的移民,因此这种移民和由此产生的快速城市化导致了1994年底在巴托雷的非正式定居点的形成。该地区开始迅速发展,国家当局无法应对这种快速发展。 与基础设施。很快,巴托雷成为一个高度密集但非正式发展的城市周边地区,严重缺乏基础设施和服务(Shutina2021)。世界银行的项目旨在升级这些非正式社区。 IEG研究试图确定Bathore试点地区的城市增长程度以及非正式住区与正式城市结构的整合水平。更具体地说,该研究旨在解决两个问题: 1.在项目实施期间,土地利用/土地覆被变化到什么程度?“Landuse/landcover”describeslandisusedacrossclass(suchasagriculturalland,water,woodlands,andbuild-upenvironment). 4在评估中利用图像数据|第1章 干预措施。这项研究对了解这一时期从农业用地向建成区的转变特别感兴趣。 2.由于道路改善,升级社区的家庭在多大程度上融入了正规经济?邻里改善刺激私人投资,将非正式定居点纳入正式的城市结构,并以凝聚力的方式增加社区的密度。将社区 与交通系统联系起来,为他们提供了获得当地服务和工作的机会。非正式定居点往往与运输网络隔绝,使家庭无法获得工作机会和服务。根据该项目的《实施完成和成果报告 》,项目区只有20%的家庭有成员在项目前受雇,这反映了非正规住区与正规经济的隔离。 实际挑战 地理边界的识别 地理空间分析通常涉及将多层数据相互叠加,所有这些数据共享相同的空间范围(即分析区域) 。因此,构建用于分析的适当数据集的第一个构建块是开发一个数据层,该数据层可用于定义研究区域的精确边界线。然后,该边界将定义任何后续数据层的地理范围。定义区域边界有时可能是一个简单的操作,因为它通常与政治或行政边界(例如国家,省或城市的边界)匹配。但是,在这种情况下,分析区域与任何先前存在的边界都不匹配。 进行分析的小组通过对多个数据源(包括世界银行报告中的印刷地图以及该地区的可用卫星和无人机图像)进行三角测量,并与项目团队和参与实施项目的当地组织进行多次咨询,解决了这一挑战 。一旦确定了精确的项目区域,我们使用地理信息系统(GIS)软件QGIS用适当的地理坐标参考系统来映射与该区域相对应的多边形(形状文件)。 一旦我们精确地划定了研究区域,下一步就是测量其表面积-重要的信息,因为它通常会指导选择适当的 独立评估小组|世界银行集团5 用于分析的数据源(图1.1)。在这种情况下,我们确定研究面积约为45公顷。 图1.1.研究区域和研究区域的位置和范围 a.研究区域b.研究区域在阿尔巴尼亚的位置 资料来源:独立评估小组。 注意:面板a显示了研究区域(红色),覆盖在OpenStreetMap数据库的基础地图上的Kamez和Tirana的当前行政边界上(有关更多信息,请参阅OpenStreet-MapFoundation(2022年10月21日访问),https://www.openstreetmap.org)。面板b显示研究区域在阿尔巴尼亚国家边界内的位置和范围。 确定适当的数据源 这项研究的分析范围很小,再加上项目实施于1998年开始,从空间和时间的角度寻找兼容的数据