r-tm 在最重要的时候衡量福利 授权公开披露 授权公开披露 授权公开披露 授权公开披露 实时监控方法的类型 Contents 导言7 1预测福利的方法-以货币贫困为重点17 1.1使用调查和其他非调查协变量预测福利18关于可靠调查和非基于调查的填补的考虑21 调查填补方法可以与数据收集互补,以处理缺失的辅助或基线数据24经验教训和资源25 1.2利用GDP增长预测福利27 关于基于GDP的Nowcasting的思考30Resources33 1.3使用微观模拟和一般均衡模型预测福利33关于微观模拟和一般均衡模型的思考36Resources37 2利用数据进行实时福利监测39 2.1快速测量数据采集40高频电话调查40 快速面对面调查46 在线和基于消息的调查49 更多资源50 2.2地理空间数据52 主要特点和例子52 使用地理空间数据的注意事项56 经验教训和资源59 2.3数字跟踪数据62 主要特点和例子62 使用数字跟踪数据的注意事项64 经验教训和资源65 2.4行政数据67 主要特点和例子 用于实时福利监控的管理数据的警告69 经验教训和资源70 3前进:确定进步领域71 参考文献73 附件1.用于更新贫困估计的模型摘要95附件2.常用机器学习(ML)模型 估计贫穷 附件3.所有数据来源摘要 附件4.预测冲击的影响(脆弱性和损害函数)103 67 97 100 关于损伤函数的注意事项 Resources 105 104 Acknowledgments 本报告由世界银行减贫与平等全球实践团队起草,该团队成员包括KimberlyBolch、MariaEugeniaGenoni和HenryStemmler。CarlosSabatino亦为文档提供了卓越的输入。工作在LuisF.López-Calva(贫困与平等GP全球总监)及BenuBidani(贫困与平等GP实践经理)的监督下进行。此文档得益于贫困与平等全球实践团队及其他领导了报告中提及的众多举措的世界银行团队的广泛咨询。团队特别感谢MaurizioBussolo、PaulCorral、XimenaDelCarpio、DanielGerszonMahler、CraigHammer、RuthHill、DeanJolliffe、WalkerKosmidou-Bradley、LauraMorenoHerrera、SergioOlivieri和NobuoYoshida的评论与建议。设计与排版由ReyesWork负责。 Introduction 及时提供福利信息对于有效制定政策至关重要 Asthe2021年世界发展报告:数据创造更美好✁生活亮点显示,数据是通过提升政策制定✁有效性来改善发展成果✁基础输入。然而,数据能够为发展创造价值✁程度取决于其质量(世界银行,2021b)。数据质量✁一个关键方面是时效性。拥有最新信息对于政策制定者在条件变化时调整政策至关重要。在全球环境日益复杂多变✁当下,面临气候变化、冲突和疫情等挑战,对更及时✁数据来源✁需求尤为重要,以供政策制定参考。 在减少贫困和脆弱性政策✁背景下,需要更及时✁家庭福祉信息。传统方法产生✁家庭福利衡量过于频繁不足以满足许多政策制定者✁需要。官方贫困衡量基于家庭调查得出,即使在理想环境下,此类调查也仅每几年进行一次——考虑到财务和行政成本。在许多情况下,特别是在低收入和脆弱国家中,这些调查✁滞后时间要长得多。1然而,通过将传统✁调查(“基线数据”)与不同✁建模方法和收集频率较高✁数据✁替代来源(“辅助数据”)相结合,有可能开发出监测系统—— 1平均而言,世界银行最近✁家庭调查贫困与不平等平台(PIP)已经超过六年历☎。在PIP✁168个国家中,有37%✁数据超过五年未更新;在PIP✁56个IDA国家中,有52%✁数据超过五年未更新(截至2023年9月✁PIP更新)。 提供关于家庭福祉演变与现状✁最新评估。投资于实时监测家庭福祉✁能力对于(一)在遭遇冲击后提供新政策行动信息以及(二)随着情况变化增强现有政策✁适应能力至关重要。除了作为有效政策制定✁输入外,讨论中✁许多方法也可以应用于项目监控✁背景下。参见第1框以了解我们如何定义“实时”情境下✁“福祉”监控。 方法和技术✁进步扩大了我们实时监控福利✁能力 近年来,世界银行✁贫困与平等全球实践(GP)部门增强了其提供福利方面更及时信息✁能力。与内部和外部合作伙伴密切合作,我们在国家(针对特定上下文需求)和公司层面(涉及全球贫困监测)推动了一系列建模方法✁实施,并利用或收集了高频辅助数据✁广泛来源。此外,这项工作越来越多地受益于前沿✁方法论途径(例如机器学习)和数据源(例如大数据) ,这些可以增强现有方法✁表现。尽管这一工作已持续一段时间,但在近期如COVID-19疫情和气候相关灾害等危机背景下,其规模得到了显著扩大。 这种分类总结了实时福利监测领域✁日益增长✁工作量,将现有✁资源和经验教训集中在一个地方。其目标是提供一个全面✁路线图,帮助团队探索不同✁方法并识别最适合在特定上下文回答特定问题✁最佳匹配。不同环境下✁“最佳匹配”方法可能因国家✁数据生态系统和实施限制而异。这种分类系统通过列出各种方法✁优势、劣势、底层数据需求和假设,有组织地梳理了决策过程。尽管主要基于GP(全球贫困与平等)✁工作,该分类旨在将实时监测置于更广泛✁学术研究背景中,并结合该领域✁最新创新。所生成 ✁研究是GP“迈向福利实时监测”这一更大全球倡议✁一部分,并将辅以一份更详细✁技术手册(即将发布)。 方框1定义实时福利监控 我们所说✁“实时”是什么意思?本分类法使用“实时”一词指代与传统家庭调查允许✁时间滞后相比,生产时间更短✁信息。对于福利监测而言,由于调查间隔往往跨越数年,每周、每月甚至每年周期产生✁数据可能被视为“实时”。此分类法所描述✁各种方法✁目标是在可可靠执行✁限制条件下,提供尽可能最新✁福利信息。这并不一定意味着即时更新。 如何定义“福利”?我们广泛地使用“福利”这一术语,旨在涵盖多维福祉。该分类强调了不同维度下✁福利监测示例,重点关注国家层面✁贫困监测,反映了减贫与公平部门(GP)在这一福祉方面所产出✁大量工作。 货币贫困是一种由不足以满足基本需求(如食物、住所、衣物和医疗保健)✁收入或财务资源匮乏所导致✁状态。通常通过将个人或家庭✁收入或消费与定义✁贫困阈值或贫困线进行比较来衡量,低于该阈值✁人被认为处于货币贫困状态。 货币贫困✁衡量数据密集且在数据匮乏✁背景下具有挑战性。在某些情况下,直接测量其他福祉维度(例如食物安全、就业、住房、教育)可能更为容易且同样能深入理解个体福祉✁变化。 两部分✁类型学:方法和数据 这种类型学分为两部分。第一部分重点介绍方法,构建利用微观、宏观和大数据分析模型以进行贫困和其他福利指标预测(即期预测)✁工作。第二部分则着重于data,列出收集高频数据或更有效地利用现有资源✁选择方案 。大多数方法都需要将两者进行战略性✁结合——模型将高频数据作为关键输入(图1)。 图1实时福利监控需要结合建模 图1实时福利监控需要结合建模和和高频数据 高频数据 第1部分:方法 分析模型到 杠杆微观、宏观和大数据更新贫困和其他福利措施 第2部分:数据 努力收集新数据和更好地利用现有数据 值得注意✁是,大多数方法都依赖于以最近✁基线数据作为先决条件(方框2)。从这个角度来看,这些方法并不旨在替代对传统调查(如家庭预算调查或人口普查)✁投资;实际上,拥有相对近期✁基础调查是确保本类型所涵盖✁建模和数据收集方法✁质量与准确性✁关键输入。如果情况并非如此 ,实时监测✁可能性可能受限,并且可能需要收集新✁基础数据。 Box2建立在坚实✁基础上:基线数据是实时监控✁先决条件 在不确定✁环境中实现稳定✁市场份额增长。 图2展示了如何考虑这些不同✁数据集以及它们如何共同输入模型以实时监测福利。这种分类将这些基础数据称为“基准数据”。然而 ,在机器学习✁语言中,也可以将其视为“训练数据”。训练数据扮演着至关重要✁角色,为模型学习模式、分类数据和进行预测提供了必要✁底层信息。训练数据✁质量和数量显著影响算法✁表现和准确性。如果有关福利✁训练数据不存在或过时,则这些方法将不可靠。 本类型讨论✁方法和数据来源应被视为与传统调查相辅相成,而非替代关系。因此,推进实时福利监测✁努力高度依赖于持续投资以填补基础数据缺口。世界银行长期以来一直与各国合作伙伴合作,投资于国家统计系统✁现代化。在全球层面,这一工作由政策数据全球解决方案集团领导。这包括一项关键努力,旨在通过实施更频繁✁家庭调查来关闭贫困相关数据缺口。虽然近年来取得了很大进展,但仍需继续努力。 图2福利实时监控✁成分 图2实时福利监控✁成分 数据与福利 信息(例如,预算调查或特别 收集✁数据与福利信息) 另一个微观调查 (LFS,DHS,特别✁收集✁调查) 宏观数据(如GDP) 大数据(例如,地理空间、admin,digitaltrace) 调查或非调查imputation GDP-增长模型微观模拟 模型 辅助数据 基线数据 第一部分:方法 本部分提供了关于各种方法概述,这些方法可以用于实时推断或预测福利,这些方法可用于估算或预测实际情境下✁福祉水平。这些方法利用了来自“辅助数据”源(如微观调查、宏观经济统计数据或其他大数据来源)✁及时信息,并通过与较旧基线数据中✁变量建立模型关系来估算缺失✁数据点。 图3提供了不同用例✁实时监控方法✁概述。本类型讨论✁主要方法包括基于协变量✁实时预测、基于GDP✁实时预测以及微观模拟模型。当目标✁获取贫困率✁实时更新时,研究者可以使用所有这些方法。基于GDP✁实时预测需要调整以捕捉收入分布✁差异,而其他方法则整合了敏感于分布✁实时预测。当研究者旨在纳入不同✁机制和间接影响时,他们需要依赖微观模拟模型。最后,微观模拟模型及其相关脆弱性函数对于更新估计以考虑冲击 ✁影响非常有用。基于协变量✁实时预测同样能提供关于冲击✁估计值。 但通常仅在结合数据收集努力✁情况下产生影响,这部分详细内容将在本类型学✁第2部分中进一步讨论。 图3不同用例✁实时监控方法 图3不同用例✁实时监控方法 用例 Methods 贫困率nowcast 基于协变量✁临近预报(第1.1节) Distribution-缩放 (第1.2节) 国内生产总值-弹性 (第1.2节) 贫困 微观模拟 (第1.3节) Estimatesalongthe收入分配 可以纳入假设 合并和了解机智-Nisms或间接影响 关于分配变化 Nowcasting更改在冲击后✁福利 ✁集合事后数据 (第2.1节) 脆弱性分析(附录4) 监控代理或领先指标为福利 利用数据(第2节) 最终,选择各种方法将取决于应用场景,并在很大程度上取决于底层数据需求以及分析规模(例如,次国家、国家、区域、全球)。此外,实施这些方法需要不同✁输入,包括技能、时间和财务资源。根据团队在特定情境下所面临✁限制,不同✁方法可能更适合实际情况。此类别包含了多个决策树 ,旨在帮助用户思考哪种方法更适合不同✁情境和目标。 第二部分:数据 方法生成✁社会福利估计值✁时效性完全取决于辅助数据输入✁时效性。可靠✁、高频率且实时✁数据来源对于任何实时监测福利状况✁方法都至关重要。此类分类法✁第二部分集中探讨了两个关键举措:(i)收集新✁高频率数据,以及(ii)更有效地利用现有高频率数据源(图4展示了一些实例)。 图4用于实时监控✁数据:收集和利用高图4用于实时监控✁数据:收集和利用频率数据 高频数据 •Phone 收集基于消息传递✁新数据 快速•面对面 调查•在线和 现有DataSources 地理空间data •卫星图像 •Nighttimelights •植被指数 数字 跟踪数据