利用卫星数据改善东加勒比的社会援助目标 SophiaChen,RyuMatsuura,FlavienMoreau,JoanaPereiraWP/24/84 货币基金组织工作文件描述了作者正在进行的研究,并发表了这些论文,以引起评论并鼓励辩论。 基金组织工作文件中表达的观点是作者的观点,不一定代表基金组织、其执行董事会或基金组织管理层的观点。 2024 APR ©2024国际货币基金组织WP/24/84 IMF工作文件 西半球部 SophiaChen、RyuMatsuura、FlavienMoreau、JoanaPereira* 由ChristophDuenwald授权发行 2024年4月 货币基金组织工作文件描述了作者正在进行的研究,并发表了这些论文,以引起评论并鼓励辩论。基金组织工作文件中表达的观点是作者的观点,不一定代表基金组织、其执行董事会或基金组织管理层的观点。 摘要:优先考虑最需要社会援助的人口是一项重要的政策决定。在东加勒比,社会援助的针对性受到数据有限以及在经济和自然灾害遭受巨大冲击时需要迅速支持的限制。我们利用机器学习和卫星图像处理的最新进展,在面对这些限制的情况下提出了可实施的策略。我们表明,可以使用卫星数据在东加勒比地区高精度地预测本地福祉,并且可以通过减少聚集偏差,更好地跨区域分配资源以及代理难以验证的信息来提高目标。 JEL分类号:C63、H12、I38、O12 社会援助目标;卫星数据;机器学习;东加勒比;小岛屿发展中国家。 关键字:作者的电子邮件地址: *作者要感谢EmineBoz,AlejandroGuerson以及第七届西印度群岛经济会议,东加勒比中央银行经济研讨会,国际货币基金组织西半球部门研讨 会,国际货币基金组织西半球部门加勒比1分部研讨会的与会者提供了有益的意见和建议。 工作文件 利用卫星数据改善东加勒比的社会援助目标 SophiaChen,RyuMatsuura,FlavienMoreau,JoanaPereira1 Contents 1.Introduction3 2.相关文献6 3.数据和方法8 数据说明8 社会经济数据8 卫星数据9 方法9 4.预测结果11 模型估计和选择11 国家一级的人口密度预测13 国家以下一级的人口密度预测14 国家一级的人类发展指数预测14 国家以下一级的人类发展指数预测15 5.政策模拟16 减少地理定位中的聚集偏差16 改善资源分配18 代理难以验证的信息20 6.结论21 附录1:图和表23 附录2:附加结果37 参考文献41 1.Introduction 社会援助计划在保护弱势群体免受困境和减轻贫困方面发挥着至关重要的作用。然而,在大多数国家,用于社会援助的资源仍然有限。因此,在设计社会援助计划时,优先考虑有需要的不同群体是决策者面临的最重要的决定之一。 在东加勒比地区,优先考虑社会援助或目标的任务具有挑战性,那里的一个关键问题是数据的可用性有限。大多数国家缺乏关于收入或相关家庭信息的集中数据系统,大量非正规部门的存在使收入难以核实。1也缺乏关于生计和人类福祉的其他数据来源,部分原因是在小经济体进行定期调查的成本相对较高,行政能力有限。缺乏数据反过来又限制了为谁以及最需要社会援助的地方进行表征的努力。 在巨大的经济和自然灾害冲击时期,这个问题变得更加严重,这往往需要迅速为受冲击影响最严重的人提供支持,包括最近的COVID-19大流行和生活成本危机。该区域还高度遭受自然灾害,从飓风到地震和火山爆发,这些灾害往往对经济活动和生计造成重大损害。 这些挑战在发展中经济体,特别是在小岛屿发展中国家(SIDS)中很常见。在这种情况下,确定目标通常取决于基于可观察和代理数据的贫困和脆弱性估计。估计可以基于位置特性(e.Procedre,贫困地区或遭受自然灾害的地区的家庭),人口特征(例如Procedre,老年人或有年幼子女的家庭),以及其他个人和家庭特征(例如Procedre、教育和家庭资产)。在小岛屿发展中国家,国家和地方当局可能拥有默契知识,可以帮助他们瞄准弱势家庭。例如,他们可能知道生活在特定非正式定居点的家庭很脆弱。制定更正式和数据驱动的方法可以帮助评估这种非正式形式的目标的准确性,并为全国的预算分配提供信息。 在进行广泛、定期和有代表性的家庭调查的国家,可以从具有调查数据的计量经济模型中得出估计。然而,在没有这种调查的国家,估计往往是从过去或同行国家的经验中推断出来的。这种做法会导致不准确的估计,因此可能会出现很大的目标错误。常规 1Jensen(2022)估计,税收制度仅包括低收入国家1-10%的经济活动人口,中等收入国家30-50%,而高收入国家为90-95%。 与来自调查的真实数据相比(McBride等人,2016年),目标系统估计会产生超过25%的排除错误(反映覆盖范围不足)和包含错误(反映泄漏)。2缺乏调查数据的国家的错误是未知的,可能更大。 在本文中,我们通过利用机器学习和卫星图像的最新进展来解决这些挑战。我们假设可以通过卫星图像中的粒状地理空间数据来改善东加勒比地区的目标定位。近年来,高分辨率卫星数据已变得可用,可以使用机器学习技术对其进行有效分析,以做出决策。这些数据可以提供宝贵的当地信息,填补传统数据的空白。我们问两个具体问题。首先,可以使用卫星图像来准确测量东加勒比的当地福祉吗?其次,可以使用这些措施来改善目标定位,如果可以,通过什么渠道? 我们遵循最近一项研究的方法,该研究为二级行政单位提供了联合国人类发展指数(HDI)的第一个全球估计 (例如Procedre县、教区、直辖市;谢尔曼等人。2023年)。我们扩展了Sherma等人的开创性工作。( 2023)以三种方式。首先,我们为东加勒比国家和地区提供全面的教区和(1平方公里)网格级HDI预测 ,以填补谢尔曼等人的覆盖空白。(2023).3其次,我们通过将模型估计与来自该地区的地面实况微观数据进行比较来验证预测模型的性能。第三,我们量化了这些估计在地理和混合目标设计的各种环境中可以改善社会援助目标的程度。 人类发展指数总结了福祉的三个关键方面:人口健康,人力资本和生活水平。它比收入或财富更全面地衡量福祉,已在发展援助和全球资源分配领域被决策者和学术界广泛使用。在社会援助的背景下使用人类发展指数与从多层面而不是仅从收入角度评估脆弱性的日益流行的方法非常吻合。为了促进在国家社会援助政策中使用人类发展倡议,有必要在国家以下一级制定人类发展倡议措施。为了估计国家以下的人类发展指数,谢尔曼等人 。(2023)开发了一种降尺度技术,其中模型在省级数据上进行训练,并在更精细的地理水平上进行预测。在这种方法的基础上,我们评估了大量的预测模型。 2在拉丁美洲,在有条件现金转移的情况下,排除错误似乎比纳入错误更大(Ibarrarán等人。 2017). 3Shermanetal.(2023)在其估计中不包括以下东加勒比国家或领土:安圭拉、蒙塞拉特、圣基茨和尼维斯和圣卢西亚。它们为我们样本中的其他国家或领土提供了国家一级的估计。 包括降尺度模型,并评估它们在东加勒比区域不同尺度上的表现。 我们发现,国家一级的人类发展指数估计与东加勒比国家一级的真实人类发展指数数据密切相关。我们还发现 ,在有此类分类数据的国家中,教区和地区级的人类发展指数预测与收入以及其他福祉指标密切相关。这项交叉验证工作表明,教区或地区一级的人类发展指数预测可以很好地代表这些国家的当地福祉。4更重要的是,这也为在其他国家使用我们的国家以下一级的估计提供了高度的信心。没有此类数据的国家,考虑到这些国家的地理、经济和社会人口特征的高度相似性。我们对一公里乘一公里网格水平的估计使我们能够更详细地了解当地的福祉。 然后,我们评估是否可以使用当地福祉措施来改善社会救助目标以及通过何种渠道。为此,我们模拟政策方案,在这些方案中,政策制定者旨在将社会救助福利分配给最需要的人。我们的前两个政策模拟类似于地理定位-一种常见的定位方法。以最纯粹的形式,地理定位选择社会助理计划将运行的区域,并为这些区域的所有人带来好处。这种方法在自然灾害导致某些地区普遍损失的情况下非常相关。一个常见的变体是选择该计划将运行的地区 ,并使用其他资格标准来选择该地区将受益的家庭。在另一种变体中,该计划在所有领域都运作,但政策制定者选择如何在所服务的领域分配计划资源-包括通过配给案件量和行政资源。在后一种情况下,行政资源在地理上是有针对性的,而不是计划利益。 在第一个模拟练习中,我们评估了本地幸福感估计是否可以通过减少最纯粹形式的地理定位中的聚集偏差来改善定位。我们发现,与仅使用国家一级的措施相比,使用国家以下一级的福祉措施来选择计划受益人可以显着减少目标错误。在这种情况下,由于粒度地理空间信息比汇总数据提供了更准确的社会援助需求代理,因此可以实现针对性的改进。 Inthesecondsimulationexercise,weevaluatethedegreetowhichlocalwell-beingestimatescanimprovetargetingbybetterallocationofresourcesacrossgeographicareas.Wefoundthatprogramswitheligituderulesinformedbylocalwell-beingestimentshave 4一级行政边界在安提瓜和巴布达、巴巴多斯、多米尼加、格林纳达、圣基茨和尼维斯、圣文森特和格林纳丁斯以及圣卢西亚的“区”被称为“教区”。 与具有统一资格规则的计划相比,错误。在这种情况下,本地福祉估计允许政策制定者按需要按比例分配案件量。此结果也适用于使用地理空间数据将管理资源分配到各个地理区域的情况。 在我们的第三次政策模拟中,我们通过提供难以验证的信息或隐性知识的代理来评估本地福祉估计可以改善目标定位的程度。我们的政策情景类似于混合目标,其中可以验证有关个人或家庭社会经济状况的一部分信息,而另一部分则需要估算或预测。我们考虑一种情况,在这种情况下,现有的计划资格基于对社会援助需求的代理,例如人口统计和正式收入。在另一种情况下,政策制定者还掌握了当地福祉平均值的信息。我们表明,本地信息可以与受益人选择中的现有代理相结合,以减少定位错误。对此结果的一种实用解释是,本地福祉可用于代理诸如非正式收入之类的难以验证的信息,并补充其他社会经济指标和正式收入,以指导方案设计。此外,在小岛屿发展中国家,地方当局可能利用关于脆弱地区的隐性知识进行社会援助,地方福祉可以用来验证这种知识的准确性和补充这种知识。 本文的其余部分组织如下。第2节讨论了相关文献。第3节描述了数据和方法。第4节比较了模型性能并提 供了基线估计。第5节讨论了模拟结果和政策含义。第6节总结。 2.相关文献 我们的论文与有关社会救助目标的丰富文献有关。5尽管每种目标方法的一般优点和缺点都是公认的,但6这些文献在目标方法之间的排名并不确定。它认识到,目标方法的选择应基于计划目标以及上下文和能力。随着新数据和技术的出现以及能力的发展,每种方法的实践和潜力也在发生变化。在这种背景下,我们的论文提供了一个有价值的案例研究。 5有关文献的综合总结,请参见Banerjee等人(2020)和Grosh等人(2022)。 6例如,代理均值检验(PMT)需要详细的家庭和个人特征数据,这些数据在行政能力有限的国家也受到限制(Skoufias等人,2001年)。由于其捕获消费和收入变化的能力有限,它也可能遭受高度排除误差(Brown等人, 2018年;lasen和Lang2015年;Kidd等人,2017年)。 关于数据驱动的目标方法是否优于自由裁量方法的证据好坏参半。Alatas等人。(2012)表明,在印度尼西亚,社区定位的表现比PMT差。Haseeb和Vybory(2022)通过在巴基斯坦的大规模无条件现金转移计