授权公开披露 授权公开披露 政策研究工作文件10656 使用加权和贫困投影模型校正电话调查贫困估计中的抽样和无响应偏差 KexinZhangShinyaTakamatsuNobuoYoshida 贫困与公平全球实践2023年12月 政策研究工作文件10656 Abstract 为了监测COVID-19大流行期间家庭生活条件的演变,世界银行在大约80个国家开展了COVID-19高频电话调查。电话调查既便宜又容易实施,但它们有一些主要的局限性,例如缺乏贫困数据,由于许多发展中国家的电话覆盖不完整而导致的抽样偏差以及对电话采访的免费答复。为了克服这些限制,世界银行在20个国家进行了试点,在这些国家中,采用了一种快速贫困监测工具,即通过即时和经常跟踪进行的福祉调查,以根据通过电话采访收集的10至15个简单问题估算贫困率,以及抽样权重。 进行了调整,以纠正抽样和无反应偏差。本文基于COVID-19高频电话调查,研究了重新加权程序和通过即时和频繁跟踪方法进行的幸福感调查是否可以消除贫困估计中的偏差。使用人工电话调查样本的实验表明,(i)重新加权程序不能完全消除贫困估计中的偏差,正如先前的研究所证明的那样,但是(ii)当通过即时和频繁跟踪贫困预测与幸福调查相结合时,它们有效地消除了贫困估计和其他统计数据中的偏差。 本文是贫困与公平全球实践的产物。这是世界银行为开放其研究并为世界各地的发展政策讨论做出贡献的更大努力的一部分 。政策研究工作文件也发布在http://www.worldbank.org/prwp的Web上。可以通过kzhang2@worldbank.org与作者联系。 政策研究工作文件系列传播了正在进行的工作结果,以鼓励就发展问题交换意见。该系列的目标是快速得出发现,即使演示文稿还不够完善。论文带有作者的姓名,应相应地引用。本文表达的发现、解释和结论完全是作者的观点。它们不一定代表国际复兴开发银行/世界银行及其附属组织的观点,也不代表世界银行执行董事或它们所代表的政府的观点。 由研究支持团队制作 使用加权和贫困投影模型校正电话调查贫困估计中的抽样和无响应偏差* 张可欣、高松新也、吉田信夫a 关键词:电话调查,加权,贫困预测/估计,抽样偏差和无反应偏差的校正JEL代码:I32,C83,C81 *作者要感谢克里斯汀·希姆林,李雪琪,阿齐兹·阿塔马诺夫,克里斯蒂娜·维瑟,安娜·路易莎·帕夫豪森对本研究的支持。作者还感谢同行评审员KeviMcGee和DaielGerszoMahler,以及2021年11月在世界银行举行的质量增强审查会议,2022年欧洲经委会欧洲统计学家会议以及2022年IARIW会议的所有参与者的有用评论。 a)张可欣,中国人民大学农业经济与农村发展学院,zhangkexin629@ruc.edu.cn ShinyaTakamatsu,贫困与公平全球实践,世界银行,stakamatsu@worldbank.orgNobuoYoshida,贫困与公平全球实践,世界银行,nyoshida@worldbank.org I.简介和背景 电话访谈为社会科学的实证研究开辟了新的可能性。它大大降低了进行调查的成本,因为所有交流都没有传统调查中习惯的面对面互动。随着COVID-19大流行的爆发限制了面对面的采访,电话调查在学术机构、调查公司和个人研究人员中更为普遍,用于个人层面和家庭层面的数据收集。为了在大流行期间及时跟踪家庭的生活条件,世界银行启动了新冠肺炎高频电话调查(HFPS),自2020年3月以来,该调查已在大约80个国家进行。这些调查使决策者能够及时和频繁地监测各种社会经济指标。 电话调查有缺点。首先,使用COVID-19HFPS很难监测贫困。COVID-19HFPS不收集消费或收入数据,这对于在传统贫困监测方法下衡量贫困和不平等是必要的。收集这样的数据是耗时、昂贵且复杂的。面试官必须向家庭询问许多有关其最近消费,支出和详细收入组成部分的复杂问题。这样的面试需要至少30分钟和两个小时,即使是训练有素和合格的面试官。在电话连接并不总是足够稳定以完成如此长的面试的发展中国家管理面试也具有挑战性。 挑战1的解决方案:作为快速贫困监测工具的SWIFT 2020年3月,世界银行启动了一项试点,使用快速贫困监测工具“通过即时,频繁跟踪的幸福调查”(SWIFT ),使用COVID-19HFPS估算货币贫困。SWIFT在COVID-19HFPS问卷中增加了10到15个简单问题,这些额外的问题需要3到5分钟才能提问。根据家庭对这些问题的回答,可以采用SWIFT方法来估算感兴趣人群中的贫困和不平等率。 SWIFT在许多贫困预测方法中被选中,因为它已经过世界银行内外专家的全面测试和审查。结果令人鼓舞-真实和基于SWIFT的贫困预测之间的差异平均为1.2个百分点,并且在+/-2个百分点内,除了一个案例(请参阅附录5或Yoshida等人的更多详细信息。,2022a)。该试点在全球20个国家进行,吉田等人总结了七个国家的结果。(2022b)。 其次,COVID-19HFPS的样本不太可能具有全国代表性。在许多发展中国家,移动电话或陆地线路的覆盖范围有限。没有电话的贫困家庭被排除在电话采访之外。此外,电话面试通常比面对面面试面临更高的无回应率。这种不回应通常集中在忙于参加面试的城市居民中。因此,在电话调查中收集的样本往往远非全国代表性,可能导致贫困预测出现偏差。 挑战2的解决方案:重新加权-采样权重调整以解决采样偏差 已经开发了许多调整采样权重或“重新加权”的方法来校正各种类型的采样偏差。本文将它们分为两大类:(1)倾向得分加权(PSW)和(2)“非PSW调整”。 倾向得分加权是一种根据倾向得分调整抽样权重的方法,是根据Rbi和Rosebam(1983年和1984年)提出的倾向得分匹配方法发展而来的。在因果推断的背景下,倾向得分匹配使对照组和治疗组具有可比性,从而最大程度地减少了估计治疗效果的偏差。除非随机选择对照组和治疗组的样品(观察数据通常不是这种情况),否则可能会表现出基线特征。 两组之间的差异。通常估计倾向得分来解决这个非可比性问题。倾向评分是以协变量为条件从群体中选择样本家庭或个体进入治疗组的概率。如果满足一组假设(有关详细信息,请参阅Rosebam和Rbi1983和1984),则对照组和治疗组之间结果指标的加权平均值的比较为治疗效果提供了无偏估计。 Taylor(2000)和Lee(2006)在网络调查中采用了倾向得分匹配技术来调整抽样权重和纠正抽样偏差。首先,他们选择了代表感兴趣人群的参考调查(例如Procedre,一个国家的全部人口,城市人口或一个国家的所有难民)。他们结合了参考和网络调查,并使用此组合样本估计了倾向得分。然后,他们根据倾向得分将组合样本分为五分位数,并调整了网络调查的抽样权重,以使网络调查的权重之和与每个五分位数中的参考调查的权重之和相等。 另一种倾向得分加权方法是“逆概率方法”,该方法使用倾向得分来构造样本被选择进行参考调查的几率,该几率进一步用作网络或电话调查的抽样权重(Morga和Todd2008,Schafer和Kag2008和Asti2011)。本文根据倾向得分将这些类型的重加权技术分类为倾向得分加权(PSW)方法。如果满足Rbi和Rosembam(1983年和1984年)中的假设,则在网络或电话调查中应用基于PSW的权重的汇总统计数据将代表感兴趣的人群。 第二类重加权技术,我们称之为非PSW方法,在电话或网络调查和参考调查之间的指标比在家庭/个人层面上更全面地匹配。这组方法包括raig,后分层和最大熵。非PSW方法选择一组指标并调整采样权重,以便所选指标的加权平均值在电话/网络调查和参考调查之间紧密/精确匹配。 PSW和非PSW调整通常一起进行。我们考虑PSW和非PSW方法的组合应用的两个优点。首先,为了使PSW消除采样偏差,需要满足一组假设,比如强可忽略性,这些假设不能轻易测试,对于这些假设,非PSW作为加权目的的补充。其次,非PSW方法匹配电话/网络调查和参考调查之间的关键指标的手段,但不能保证这些指标的分布也匹配。相比之下,PSW方法与倾向得分的分布相匹配。由于两种方法都有自己的优势,因此进行PSW和非PSW调整都是合理的。 本文研究了重新加权是否可以纠正SWIFT方法产生的贫困预测偏差。重新加权技术的性能因匹配的数据和目标指标而异,文献中一致认为,重新加权技术可以减少目标统计中的偏差,但不能消除它们(Lee(2006)和DrezeadSomachi(2023))。Dreze和Somachi(2023)通过从家庭调查中删除贫困家庭来创建有偏差的样本,并测试了非PSW重新加权技术(最大熵重新加权或最大熵)是否可以减少贫困率和平均家庭支出的偏差。尽管贫困率估计和家庭支出手段的偏见有所下降,但仍然存在很大比例。 然而,现有的文献缺乏评估重新加权技术如何能够减少SWIFT或任何其他贫困预测方法产生的贫困预测偏差。使用电话或网络调查来估计贫困需要使用贫困预测方法。Dreze和Somachi(2023)使用了实际的消费和收入数据,并表明即使在重新加权后,贫困率和平均家庭支出仍然存在很大的偏差,但没有评估重新加权与贫困预测方法相结合的情况 。 实际上,我们的研究发现,当与SWIFT等贫困估算方法相结合时,加权估算贫困的性能可以得到改善。 实验 本文研究了重新加权技术和SWIFT贫困预测方法的结合是否以及在多大程度上可以消除基于有偏差调查样本的贫困估计中的抽样偏差。为了看到这一点,我们首先使用卢旺达,圣卢西亚和乌干达的参考家庭调查,并通过选择至少拥有移动电话或固定电话的家庭来构建子样本。这些样品受到结构抽样偏差的影响。如果没有重新加权和SWIFT贫困预测,这些电话所有者子样本中的贫困率低于完整样本中的贫困率。然后,我们研究重新加权和SWIFT贫困预测是否可以纠正上述偏差。 电话和网络调查数据收集面临抽样和无响应偏差,但上述实验仅关注因手机所有权不均而产生的抽样偏差。为了了解SWIFT和重新加权技术调整无响应偏差的能力,本文使用埃塞俄比亚高频电话调查第7轮(HFPS7)的样本进行了额外的实验,该样本是2018/19年埃塞俄比亚社会经济调查第4轮(ESS4)的子样本。由于ESS4的此子样本仅包括电话所有者,因此存在采样偏差。此外,由于它仅包括对HFPS7做出反应的ESS4家庭,因此它也受到无反应偏见的影响。使用此子样本,我们进行了与上述相同的分析,以评估重新加权技术和SWIFT是否可以纠正因采样和无响应偏差而导致的贫困估计偏差。 本文组织如下。第二节介绍了SWIFT贫困预测方法和重新加权技术,第三节展示了四项实验研究(圣卢西亚、卢旺达、乌干达和埃塞俄比亚)的结果。第四节最后,根据四个案例研究,评估了重新加权和基于SWIFT的贫困预测模型在消除贫困估计中的偏差方面的组合。 II.SWIFT和重新加权方法 II.1.SWIFT贫困预测方法 SWIFT是一种应用调查到调查的估算技术(S2S)来快速监测贫困。SWIFT通过对贫困代理的家庭支出/收入进行回归,在训练数据集中训练了一个估算模型。然后,通过将输出数据的贫困代理插入模型,将家庭支出和贫困率估算到另一个称为“输出数据”的数据集中。图1说明了该过程。 标准SWIFT方法有两个关键假设:第一,输出数据中家庭收入或支出与贫困之间的关系可以用等式(1)表示: 𝑙𝑛𝑦ℎ𝑜=ℎ𝑜′𝛽𝑜+ℎ�( 1)在哪里𝑢ℎ𝑜~𝑁𝑜) where𝑙�𝑦ℎ�是指输出数据o中家庭h的家庭收入或支出的自然对数。𝑥ℎ�是a(�×1)输出数据中家庭h的贫困相关向量 ,o。𝛽�是a(�×1)贫困系数的向量相关(𝑥ℎ𝑜).𝑢ℎ�指的是残差,通常被假定为服从正态分布𝑁𝑜).1输出数据包括贫困代理数据[𝑥ℎ𝑜]但不包括 ℎ=1 1这种正态分布和线性可以放宽。为