授权公开披露 授权公开披露 政策研究工作文件10916 实时指标在新冠肺炎危机期间跟踪发展中国家家庭福利变化的情况如何? DavidNewhouseRachelSwindleShunWangJoshuaD.MerfeldUtzPapeKibromTafereMichaelWeber 发展经济学贫困与公平全球实践与人力资本项目2024年9月 政策研究工作文件10916 Abstract 这篇论文调查了源自互联网搜索、手机和卫星的实时指标在COVID-19危机期间对约300个行政级别1地区家庭社会经济指标变化的预测能力。每个地区的社会经济状态变化数据来自于高频电话调查。使用2020年4月至8月收集的第一波数据时,采用最小绝对收缩和选择操作符选择的模型解释了37%的跨地区家庭报告总收入下降的比例变化,以及34%的受访者自危机开始以来报告工作停止的比例变化 。实时指标在解释收入损失和当前就业情况的地区内变化方面所解释的比例较低,当前就业的R²值为15%,收入下降的频率则为15%至19%。当将样本限制为城市地区时,实时指标在解释地区内变化方面更为有效。 收入损失和当前就业情况存在差异,R²值分别为约0.54和0.38。收入增长、自我报告的食物不安全状况、社交距离行为以及儿童学校参与度更难以预测 ,R²值范围从0.06到0.17不等。与食物、金钱、工作和宗教相关的Google搜索词在第一次调查波中是最强大的工作停止和收入下降的预测指标,而与食物、锻炼和宗教相关的搜索词更能追踪收入下降和就业变化随时间的变化。Google移动性指标也是就业变化和特定类型收入下降普遍性的强大预测指标。总体而言,关于植被、污染和夜间灯光的卫星数据的预测能力远不如前者。Google移动性和搜索数据,以及在一定程度上植被和污染数据,可以提供有关区域经济困境和复苏的重要信号,尤其是在像COVID-19这样的重大危机的早期阶段。 这篇论文由发展经济学、贫困与平等全球实践领域以及人力资本项目共同完成。它是世界银行为提供研究成果的开放访问并为全球发展政策讨论做出贡献的一项更大努力的一部分。政策研究工作论文也在网上发布于<http://www.worldbank.org/prwp>。作者可联系至dnewhouse@worldbank.org。 该政策研究工作论文系列发布正在进展中的研究成果以促进关于发展问题的ideas交流。该系列的一个目标是尽快发布这些发现,即使展示尚不完全成熟。这些论文标注有作者姓名,并应相应地引用。本文中的观点、解释和结论完全是作者的意见。它们不一定代表国际复兴开发银行/世界银行及其附属组织的观点,也不一定代表世界银行执行董事会成员或他们所代表的政府的观点。 由研究支持团队制作 实时指标在新冠肺炎危机期间跟踪发展中国家家庭福利变化的情况如何 ?1 大卫·纽豪斯、雷切尔·斯威德、王顺、约书亚·D·默菲尔德、乌兹·帕佩、基布罗姆·塔费尔、迈克尔·韦伯 EL:JD31,D74,I31,O15 关键词:COVID-19;幸福感;工作;收入;谷歌流动性;NO2;谷歌搜索 1团队感谢韩国经济与和平建设转型信托基金(KTF)提供的资金支持。韩国财政部支持的韩国全球基金由世界银行管理,旨在为脆弱、冲突和暴力局势下的关键发展运营和分析提供资金。 1.Introduction COVID-19引发了自二战结束以来对household和regional经济影响最为剧烈和戏剧性的冲击之一。世界卫生组织于2020年3月11日宣布COVID-19为全球大流行病后短短几周内,病毒便蔓延至世界大部分地区。2随着危机的展开,立即获取有关疫情经济影响的快速、准确数据变得极为迫切。世界银行集团与成员国的国家统计局合作,在数十个国家开展了电话调查,旨在迅速评估疫情对家庭的影响 。这些调查询问了受访者关于收入变化的方向性信息,包括总收入和各类收入来源的变化。此外,还询问了受访者获得关键服务和资源的情况、食品安全状况、就业状态、行为调整以及整体福祉等方面的信息。这些调查数据提供了宝贵的见解,有助于记录许多发展中国家家庭因冲击而遭受的影响,并为政策响应提供信息:它们能够更精确地针对援助和支持计划的目标群体,无论是直接向居民发放现金转移支付,还是帮助受打击最严重的行业中的企业。然而,开展电话调查需要宝贵的时间,而在重大危机期间这并非总是可用的资源,并且需要大量资源才能长期维持。 实时指标——如卫星图像、污染数据和Google移动数据——可以以低成本立即获取。因此,毫不令人惊讶的是,例如,谷歌移动数据已成为理解疫情对社区响应的认识流行工具。当实施封锁措施时,谷歌移动数据显示商业区域活动相应减少 ,而在住宅区停留时间增加。这些数据几乎实时可用,并可用于记录对移动限制的遵守情况。类似地,在冲击之后,有关氮氧化物污染的近实时数据表明某些地区污染减少(Masaki等,2020)。不同国家和地区危机爆发的速度以及恢复进程的不同速度引发了自然的问题,即这些实时指标如何跟踪通过手机调查收集的经济指标,以及哪些实时指标最为信息丰富。 2总干事在2020年3月11日关于COVID-19的媒体吹风会上的开幕词。 世界卫生组织总干事在COVID-19媒体简报会开幕式上的开场致辞——2020年3月11. 这项研究结合了大量近实时指标与世界银行的高频电话调查数据,以评估这些指标预测家庭经济福祉各种替代指标变化的能力。除了使用谷歌移动数据外,还利用了谷歌搜索趋势、夜间灯光、植被和污染数据来开发预测不同结果趋势的模型 。首先,该研究考察了这些实时指标预测危机初期冲击严重程度变化的能力,具体表现为自2020年4月至8月各国首次调查波中报告的收入减少和失业率下降的普遍程度。其次,研究考察了这些实时指标随着时间推移预测区域(通常为州或省 )内变化的能力,随着危机影响的变化而演变。 虽然在经济研究中使用实时数据相对新颖,但多项研究提供了关于预测建模最佳实践的见解,并探讨了这种数据如何为贫困研究做出贡献。许多实时指标,如谷歌移动数据、卫星夜间灯光以及二氧化氮(NO₂)等,已被用于此类研究。2),并且通过关键词的谷歌搜索量有可能预测传统福祉指标。谷歌移动数据最近被用于预测疫情期间的工业生产增长(Sampi&Jooste,2020)和经济增长(Putra&Arini,2020)。谷歌移动指数显示了每个地理区域中访问地点的变化情况。该指数按六大类场所进行测量,包括工作场所、住宅、超市和药店、公共交通站、零售和娱乐场所以及公园。然而,这些数据并不具有代表性,因为它们仅来源于开启了地理位置服务的智能手机用户。 经济学家们越来越多地利用卫星探测到的夜间灯光作为经济指标的替代指标(Chen&Nordhaus,2011;Gibsonetal.,2021;Hendersonetal.,2012;Ishizawaetal.,2017;Mellanderetal.,2015)。在经济和社会统计系统质量较低的发展中国家,或者当卫星图像比此类数据更频繁可用时,基于卫星的夜间灯光数据可能为社会和经济发展提供有价值的信息。除了广泛使用的夜间灯光数据外,最近在经济学领域还探索了其他类型的遥感数据。例如,Castellanos&Boersma(2012)发现(原文中似乎缺少部分信息,假设此处为句子的一部分)NO2与经济活动相关,因此可以用来衡量社会和经济活动的规模(Keola&Hayakawa,2021)。normalizeddifference 植被指数(NDVI)解释了斯里兰卡人均消费变化约4%的差异(Engstrom等,2021)。白天的卫星图像也被证明可以预测撒哈拉以南非洲地区村庄级资产指数变化的15%至17%(LivingStandardsMeasurementSurveys数据提取)。然而,当预测村庄层面资产所有权变化的指数时,这一比例上升到35%,而当该指数聚合到区县层面时,这一比例达到50%(Yeh等,2020)。Khachiyan等(2021)发现 ,基于卫星图像训练的模型可以解释美国十年间收入和人口变化的32%至46%。 搜索引擎数据也被用于评估人们当前的福祉状况,而不依赖于调查问卷。Google趋势并且基于搜索频率,其本地等效工具(如中国地区的百度趋势和韩国地区的Naver趋势)可以为某一地理区域内特定主题或术语的搜索强度(或相对热度)提供一个指数。近年来,许多研究使用了这些数据。Google趋势探讨COVID-19大流行期间心理健康的变化(Brodeur等人,2021年;Foa等人,2020年 ;Ma等人,2021年)然而,这些研究侧重于衡量封锁措施对搜索行为的影响 ,并未将搜索数据与大规模电话调查数据进行比较。此外,搜索引擎的数据也不具备全国代表性,因为这些数据仅来自可以访问互联网的地区,并且仅收集了使用Google进行在线搜索的用户数据;而卫星数据则受到云层覆盖的影响,这对其广泛跟踪经济变化的能力提出了质疑。 在本文中,我们利用来自不同来源的一系列实时指标来预测新冠肺炎疫情期间发展中国家福利变化的情况。六个主要发现如下: 1.选定的实时指标预测了危机初始影响在跨地区变化中占据显著份额。在20个国家约300个地区中,八个谷歌搜索项解释了自2020年4月至8月危机开始以来 ,报告总收入下降的家庭比例变异性中的36%。同时,在同一时期,十个谷歌搜索指标解释了报告就业损失的受访者比例变异性中的34%。 2.与初始影响相比,选定的实时指标在解释2020年4月至同年之间收入下降和就业状况变化的变异方面解释得较少。 2021年2月.TheR2这些模型的值仍然相当显著,收入下降的发生率范围在22%到26%之间,当前就业的影响为15%。 当样本限制在城市地区时,实时指标在解释2020年4月到2021年2月之间收入下降和就业变动的城市内部差异方面更为成功。R2这些模型中收入下降的发生率值范围从29%到55%,当前就业率为33%。改进的城市地区的预测性能似乎部分归因于Google搜索词更高的预测准确性。 4.谷歌移动指标与工作停止以及当前就业变化有强烈关联,并且与初始阶段及随后时期内农业收入、非农业企业收入和工资收入的下降有密切关系。 5.与食物,金钱,工作和宗教相关的Google搜索词也很强危机初期收入下降和停工的预测因素。 Google搜索与食物,援助,宗教有关,在某些情况下还包括锻炼收入下降和就业率变化的有力预测因素 危机演变。 6.一般来说,谷歌搜索和移动信息对收入的预测要好得多。和就业变化,而不是来自植被、污染和夜间的卫星数据灯光。然而,植被水平强烈预测粮食不安全和 退学的学生比例,而污染是一个中等强度的预测指标停工,当前就业以及非农业和工资变化。夜间LASSO在任何预测模型中都没有选择灯光。 我们的发现综合起来表明,这些实时指标,尤其是谷歌移动性和搜索词,能够预测相当一部分幸福感变化的变异。正相关或负相关的迹象通常很直观,尤其是在解释时间变化的变异时。实时指标比预测重复波次调查数据中结果的时间变异更能有效地预测初始危机影响的横截面变异,这些影响是通过回顾性变化来衡量的 。此外,实时指标在预测收入损失方面比预测收入增加更为准确。不同指标的重要性也因具体情境而异,这突显了训练适用于不同情境的模型的好处。 结合多个不同来源✁信息。此类模型可能是监测某一地区经济状况变化✁一个有前景✁方法,尤其是在遭遇突然且大规模冲击时,传统调查数据尚未(或尚不)广泛可用✁情况下。 本文remaining部分✁结构如下:第2节介绍数据和实证方法,第3节描述福祉指标 ✁趋势,第4节呈现分析结果,第5节总结本研究。 2.数据与实证方法 该分析使用了两种类型✁数据:(1)高频率电话调查,用于测量COVID-19危机期间✁家庭福祉;(2)实时✁移动性、互联网搜索活动、污染和夜间灯光等指标 。我们基于实时指标,以地区汇总✁高频率电话调查(HFPS)数据作为预测✁因 变量。 2