政策研究工作文件 动态、高分辨率财富数据稀缺环境中的测量 卓正蒂莫西吴理查德李大卫纽豪斯塔利普基利奇马歇尔伯克斯特凡诺埃蒙大卫B 洛贝尔 发展经济学发展数据组2025年2月 11058 政策研究工作文件11058 Abstract 准确而全面的家庭生计测量对于监测减贫进展和社会援助计划的目标群体至关重要。然而,传统数据收集的高成本历来使全面测量成为一个难题。本文利用来自四个非洲国家的详细家庭普查提取数据,评估基于卫星的深度学习替代方法,以加速实现大规模、精细尺度和动态的资产财富全面测量。结果表明,变换器架构解决了多个开放问题。 测量问题,通过提供对各国和各城市家庭资产财富本地水平变化的最准确测量,以及家庭资产财富随时间的变化。人工限制数据可用性的实验展示了模型在数据有限的情况下实现高性能的能力 。所提出的方法证明了结合卫星图像、公开的地理特征以及新的深度学习架构,以在数据稀缺环境中实现高度本地化和动态的财富测量的潜力。 这篇论文是由发展数据组、发展经济学部门所产出的。它是世界银行为提供研究的开放访问并为全球发展政策讨论做出贡献的一项更大努力的一部分。政策研究工作论文也在网上发布于httpwwwworldbankorgprwp。作者可以联系dnewhouseworldbankorg和tkilicworldbankorg。 ThePolicyResearchWorkingPaperSeries发布工作中的研究成果以促进关于发展方面的思想交流。问题。该系列的一个目标是尽快发布研究成果,即使展示内容尚未完全打磨。论文保留了 作者的名字,并且应当据此引用。本文中表达的发现、解释和结论完全是作者的观点。由作者提供。它们不一定代表国际复兴开发银行世界银行的观点。 其附属组织,或世界银行执行董事或他们所代表的政府的组织。 由研究支持团队制作 数据稀缺环境下的动态高分辨率财富测量 Zehuo郑a蒂莫西Wua理查德Leebc大卫纽豪斯dTalipKilicd马歇尔伯克c StefanoErmonaand大卫BLobellbc a斯坦福大学计算机科学系,斯坦福大学,加利福尼亚州94305,美国 b斯坦福大学地球系统科学系,斯坦福大学,加利福尼亚州94305,美国 cCenteronFoodSecurityandtheEnvironmentStanfordUniversityStanford9430CAUSA dDevelopmentEconomicsDataGroupWorldBankGroupWashingtonDC20433DCUSA eStanfordUniversityStanford94305CAUSA ARTICLEINFO 关键词:Economicwell being高分辨率贫困卫星图像Deeplearning JEL代码C45I32 准确、及时且高分辨率的经济福祉测量对于监测和实现国际减贫目标至关重要。这些目标包括联合国可持续发展目标1(消除贫困),该目标的原始截止日期为2030年,以及无数其他国际和地区减贫目标。对于理解这些目标是否正在实现,以及在进展滞后地区进行减贫干预的定位和评估 ,详细的Household贫困和财富估计至关重要。6 官方对低收入和中等收入国家的贫困测量长期以来依赖于家庭调查,这是一种不可或缺但耗时较长的生活水平测量工具。鉴于进行可靠调查所需的技術能力以及开展全国或地区代表性的生活水平调查所面临的重大后勤难题,这类调查往往在全球许多地方很少完成,导致许多地区和时期 无法获得全面和及时的贫困及相关结果的衡量数据。69与此同时,调查数据通常基于旨在更大空间尺度上具有代表 性的样本,因此通常无法生成村庄或小区层面的可靠估计 这是反贫困干预措施往往需要针对的层面。因此,迫切需要更具成本效益且可扩展的替代方案来衡量生计状况 ,以补充和扩大现有基于家庭调查的努力。 在近年来,公开可用的遥感数据日益丰富,以及机器学习的最新进展已逐步改变了生计测量的格局,逐渐从国家人口普查和相关家庭调查转向结合这些信息与卫星和其他传感器的信息。早期的研究使用粗略的、公开可获得的数据 。 利用可用的卫星图像和or移动电话数据,结合早期的机器学习和深度学习架构,展示这些新型信息源如何被用于支持大规模的财富和贫困测量。417 29subsequent研究引入了进一步的改进,使用了公开可用或专有的地理空间数据以提高基于卫星的财富测量精度8122这些进展证实了利用卫星图像和机器学习可以提供一种准确、经济且可扩展的解决方案来估计 62123 财富 我们汇集了一个大规模、多分辨率和多时序的财富数据集 ,使用了国家人口普查或从国家统计局获取的提取数据,以及来自多个公共和私人传感器的多光谱卫星图像。该数据集涵盖了四个非洲国家(马拉维、莫桑比克、布基纳法索和马达加斯加)超过120万户家庭的数据,并且独特地包含了两个马拉维城市精确地理参考的测量数据,以及同一地点随时间的重复测量这两项特征在以往的研究中是缺失的。 我们利用这些数据对早期研究做出了四点贡献。首先,我们直接测试了一种新的深度学习模型具体来说,是视觉变换器(VisionTransformers),与文献中常见的基于卷积神经网络(CNNs)的早期深度学习架构进行对比,同时也与使用地理空间特征和表格机器学习方法(如XGBoost)进行预测的较简单模型进行了对比。具体而言,我们设计了一个条件模块,使我们的变压器模型能够处理多模态输入,同时整合卫星图像和地理空间特征(参见“方法”部分 )。我们测试了使用不同分辨率的卫星图像的数据集,包括来自Landsat(30米像素)、PlanetScope(3米像素)和SkySat(05米像素)传感器的数据。然后我们将这些更复杂的模型和输入方法与依赖于较简单方法的模型进行了比较。 共11页第1页 仅在一系列来源的预定义地理空间特征上。 这些比较非常重要,因为依赖公开可用数据的更简单的approach在大规模应用中可能会既更容易实施又更经济,尤其对于希望广泛使用这些方法的公共组织而言。因此,理解不同模型架构和输入下的性能权衡对于理解如何扩展有前景的新测量方法至关重要。 其次,在我们的情境中,一个关键优势在于使用来自国家人口普查或提取的高精度准确数据进行模型训练和评估。与早期依赖公开可用的家庭调查数据(这些数据通常具有空间定位不精确且样本家庭数量有限)的研究相比,我们的数据覆盖了给定位置中更大范围的家庭样本,并且在某些情况下可以精确地地理参考。与这种“黄金标准”数据进行对比,使我们能够理解模型预测误差是由于预测不准确还是真实地面测量中的噪声所致这一点在早期发展中国家的研究中往往难以明确区分。629此外,这使我们能够考虑广泛的样本大小范围,以评估先进机器学习方法产生准确估计所需的最小训练数据需求。为了量化训练样本大小对性能的重要性,我们在多个场景下广泛测试额外训练数据对模型性能的影响。 国家单独进行,并对每个模型进行逐个国家五折交叉验证 。CNN模型仅使用陆卫影像作为输入。XGBoost利用地理空间特征(地理特征)单独或与卫影像统计特征结合 使用。所有模型均被训练以预测资产财富指数(AWI)29 在马达加斯加、马拉维和莫桑比克,AWI估计值是在精细行政级别上生成并链接到影像数据的。在布基纳法索,只有334个市镇的AWI估计值可用(表中)。1这减少了布基纳法索训练数据的有效样本大小,如图中右面板所示的调查测量资产财富的聚集模式所见。1dThisdifferenceisreflectedintheresultsAsshowninFigure1一个简单的变压器模型,在不一致地依赖地理特征的情况下,AcrossMalawi、Mozambique和Madagascar的数据集中表现优于其他模型。在这些国家,使用变压器模型进行的预测达到了2当使用完整的人口普查提取数据进行训练时,其值分别为083、070和062。在布基纳法索,由于有效的样本大小较小,基于卫图像和地理空间特征的XGBoost模型在这些模型中实现了最佳平均性能(解释了629的变异性)。仅使用卫图像的朴素变压器模型也保持竞争力 (解释了574的变异性)。我们还限制训练样本的数量为原始训练数据集的1、5、10、25和50,以分析模型性能随训练样本数量变化的情况。根据这四个国家的结果,我们经验性地确定10是模型性能的关键转折点,在此之下估计精度会迅速下降。 第三,我们高分辨率的人口普查数据使我们能够对卫影像和其他地理空间数据如何用于预测非洲城市区域内生计变化获得新的理解这一能力在以前的研究中由于样本有限和训练数据中的空间噪声难以评估。即使在小区域范围内,生计在空间上表现出显著的差异性,这一点在以往的研究中也尤为关键。利用马拉维两个城市的全面且精确地理参考的人口普查数据,我们能够使用不同分辨率的卫 数据进行模型的训练和测试,并发现这些模型在预测这些城市街道和街区层面的财富差异方面出乎意料地准确。 第四,人口普查和提取数据使我们能够评估基于图像的模型是否能够准确预测财富随时间的变化。先前的努力再次受到实地数据的显著限制,这些数据未能在不同的调查中重复采样相同的地点29因此,尚不清楚一个主要基于图像训练以预测财富或消费的空间变化的模型是否能够预测时间变化,因为后者通常较小且可能由在图像中难以检测的变化驱动。马拉维和莫桑比克两地相隔十年的重复人口普查数据使我们能够评估模型是否确实可以从图像中提取出能够预测资产财富时间变化的信息。 Results 国家一级财富预测的绩效 对于国家一级的财富预测,我们在每个模型上训练每个模型 另一个降低财富预测训练样本采集成本的关键因素是每个样本汇总的家庭数量。为了分析这一因素,我们随机从每个行政区域中抽取10户家庭构建训练样本,从而为每个国家生成一个“10户家庭”的训练数据集。然后,我们在这个“10户家庭”的训练集上训练一个朴素的变压器模型,同时仍然在 其原始完整的家庭测试集上评估其性能。结果(如图所示)1b 表明我们的变压器模型使用10户家庭的数据进行训练时,在性能表现上与使用所有户家庭数据进行训练的模型相当。以马拉维为例,10户家庭的数据仅包括大约23的调查户家庭。使用所有户家庭数据训练的模型与使用10户样本训练的模型之间的性能差距仅为3个百分点(82对79)。相比之下,当减少训练样本数量时,使用全部训练样本训练的模型与使用25样本训练的模型之间的性能差距达到12个百分点(82对70)。 这些结果为高效的数据财富测量提供了重要的见解。当每张图像至少有10户家庭时,在预测财富方面,优先考虑调查更多的地理区域而非在当前地理区域内调查更多家庭。空间地理特征被认为是提高经济测量准确性的重要辅助数据。2 1在财富预测中广泛应用。在这里,我们设计了一个条件模块(详见“方法”部分),使我们的变压器模型能够高效地融合地理空间特征和深度视觉特征。结果如图所示。 1C,建议地理空间特征显着改善 图1:国家一级资产财富指数预测的表现。性能比较:四个国家在不同机器学习模型训练下基于各种普查提取数据的不同比例的表现 。NegativeR2值未显示。变压器结果不整合地理特征,并使用来自所有样本家庭的资产财富进行训练。bTransformer模型在使用全部Household资产财富和每行政区域10户家庭构建的资产财富进行训练时的性能对比。c具有和不具有集成地理空间特征的Transformer模型之间的性能比较。d调查测量的资产财富与表现最佳的预测财富的散点图。 模型在所有国家的表现均有所提升,尤其是在布基纳法索 ,这主要是由于将图像与commune级别的调查数据链接后导致的有效样本量较小。当训练样本量较小时,地理空间特征显得尤为有益,表明在小样本量的情况下,模型可能难以从原始图像中学习到最优的视觉表示,此时地理空间特征可以作为财富预测的重要补充。如图1中所示的方法,使用地理特征的变压器模型(Transformermodelwithgeofe