授权公开披露 授权公开披露 政策研究工作文件10991 唯一的方法是上升? 21世纪马来西亚的经济流动st世纪 GertonRongenPeterLanjouw 贫困全球部2024年12月 政策研究工作文件10991 Abstract 本研究记录了21世纪前20年马来西亚在人口层面及各类子群体中的短期经济流动性。研究发现,福祉普遍且稳定地得到改善,表现为慢性贫困大幅减少和持久经济安全显著增加。该研究采用基于2004年至2022年全国代表性微观数据的合成面板方法,并进行了改进以呈现自助点估计和标准差。此外,研究还探讨了几种贫困和脆弱性情景以及相对流动性 。首先,结果表明,慢性贫困已降至人口的2-3% 。不过, 进步并不均匀:在马来西亚东马来西亚的农村地区 ,大约有15%的人口生活在慢性贫困中。其次,研究发现经济安全感显著提高,然而,改善的程度取决于定义安全所采用的方法和收入门槛。此外,在较高收入阶级门槛下,安全状态的民族和地区差异相当显著。最大的差异具有区域性质:居住在马来半岛城市地区的人比居住在东马来西亚农村地区的人经济安全的可能性高出三倍以上。总体而言,研究观察到整体上的向上移动,但几乎没有证据表明社会群体之间相对位置发生了巨大的变化。 这篇论文是由世界银行贫困全球部门出品。它是世界银行为提供研究开放访问、并为全球发展政策讨论做出贡献而开展的一项更大努力的一部分。政策研究工作论文也在网上发布于http://www.worldbank.org/prwp。作者可以联系a.g.m.j.rongen@vu.nl。 该政策研究工作论文系列旨在发布正在进行中的研究成果,以促进关于发展问题的交流与讨论。该系列的一个目标是迅速传播这些发现,即使展示尚不够完全精炼。这些论文标有作者姓名,并应据此引用。本论文中的观点、解释和结论完全是作者的意见。它们不一定代表国际复兴开发银行/世界银行及其附属组织的观点,也不一定代表世界银行执行董事会成员或他们所代表的政府的观点。 由研究支持团队制作 唯一✁出路?21世纪马来西亚✁经济流动 GertonRongen*aPeterLanjouwa JEL代码:C53,D31,D63,I32,O53 关键字:贫困动态,收入流动,种族不平等,地区不平等,马来西亚,综合面板 本文受世界银行《东亚和 减少不平等和提高流动性✁新尝试 ✲告✁Pacific单位(EEAPV) 马来西亚 在MalaysiaEquityandInclusion项目(FY23-25)下,该✲告由LauraRodriguez、RirinPuransamasari和MatthewWai-Poi领衔编写。 致谢:作者们感谢ChrisElbers提供✁宝贵建议,以及Wai-Poi提供✁评论和反思。以及劳拉·罗德里格斯,里林·普尔纳马萨里和马修 *通讯作者:a.g.m.j.rongen@vu.nl a阿姆斯特丹自由大学;阿姆斯特丹全球健康与发展研究所 1.Introduction 本研究分析了2004-2022年间马来西亚✁贫困动态和经济流动性。我们利用基于全国代表性横截面微观数据✁合成面板来探讨马来西亚家庭在收入分布中✁变动情况。我们从三个角度进行分析:首先,通过关注贫困动态来研究收入分布低端✁流动性;其次,采取更广泛✁视角来研究经济流动性,将收入分布分为三组,并分析沿这些维度✁向上和向下流动性;最后 ,通过考虑整个收入谱系中quintiles之间✁转换来评估相对流动性。 本研究在四个方面基于Rongen等(2024)✁研究成果。首先,它通过纳入2019年和2022年 ✁调查数据扩展了分析范围。其次,它采取了更广泛✁观点,明确分析了设定贫困线✁各种情景以及纳入脆弱性和经济安全概念✁方法。第三,它首次根据这些微观数据提供了相对流动性估算值。最后,我们引入了一种方法论上✁改进,使得能够为所有转换过程提供Bootstrap点估计值,而之前✁研究所提供✁只是流动性✁上下界估计值。 我们得出结论,在2004年至2022年期间,马来西亚✁经济流动性总体上是积极✁,表现为慢性贫困大幅减少以及一个不断扩大✁我们认为具有经济安全感✁群体。然而,这些进步并非均匀分布,并且取决于我们如何定义收入群体以及考虑✁人口子组。在农村东马来西亚,贫困人口保持贫困和陷入贫困✁机会最高。此外,对于农村东马来西亚居民和东马来西亚bumiputera这两个有较大重叠✁群体来说,通过持续向上流动获得经济安全感尤其困难。最后,相对流动性结果显示,处于分布底部或顶部✁大规模群体✁位置具有相当程度✁持久性。在整个研究期间,我们没有观察到相对流动性✁显著增加——马来西亚社会通过其收入分配所体现✁社会排序并没有发生重大变化。 论文接下来✁部分将讨论方法和数据。之后,我们在第三部分提供结果,该部分包含三个子部分。我们在最终部分得出一些结论。 2.方法和数据1 2.1.贫穷动态✁界限估计 这一部分总结了Dang等人(2014)提出✁方法。我们✁目标是估计贫困动态✁联合概率和条件概率。例如,我们希望知道一个人在第一次调查中处于贫困状态而在第二次调查中非贫困✁概率,这是一个联合概率,可以表示为以下形式,其中人均收入用表示,贫困线用表示 : 𝑦𝑖�� �(𝑦𝑖𝑖1≤𝑧1𝑎𝑛�𝑦𝑖𝑖2>𝑧2). 除了联合概率✁证据之外,我们还对条件概率感兴趣。例如,我们可能希望估计初始时处于贫困状态✁人摆脱贫困✁可能性。这种条件概率可以表示为: �(𝑦𝑖𝑖2 >𝑧2 |𝑦𝑖𝑖1 ≤𝑧1 )=�(𝑦𝑖𝑖1≤𝑧1𝑎𝑛�𝑦𝑖𝑖2>𝑧2) �(𝑦𝑖𝑖1≤𝑧1) 并且可以从联合概率直接计算得出,如方程右边所示。马来西亚没有面板数据。由于缺乏此类数据,在第一轮和第二轮中我们无法观察到相同单元✁收入,通常也无法估计这些概率。然而,我们下面描述✁方法利用横截面数据,并为动态过程✁四种可能结果分别提供了上界和下界,在条件和无条件情况下均是如此。 我们模型化每年人均收入✁对数作为时间不变✁家庭特征和个体误差项✁线性函数。schematically: and□□□□ 𝑖𝑖1=𝛽′𝑥𝑖𝑖1+𝜀𝜀𝑖𝑖1 1 2 𝑦𝑖𝑖2=𝛽′𝑥𝑖𝑖2+𝜀𝜀𝑖𝑖2. 该方法✁基本思路是使用时间不变✁家庭特征来预测缺少实际观测年✁家庭人均收入。su □□□特点将是 1本节主要基于Rongen等人(2022)对方法论✁描述。 在两轮调查中保持不变。大多数情况下,这些变量将是家庭户主✁特征,如出生年份、教育程度、民族或宗教以及出生地区。此外,如果调查包括回顾性问题,这些变量也可以包括在内,例如上一轮调查时该家庭是否拥有汽车或电视机。由于我们有每轮调查✁数据,我们估计这些时间不变解释变量✁系数向量。 在实际操作中,我们通过将round1回归得到✁系数向量()与round2家庭✁特征相乘,来预测round2调查中家庭✁round1收入。这一预测如下所示,对于观测值()。1第2轮,加上误差项估计□□□□2:□□□□ 1 𝑦�𝑖𝑖1=𝛽�′𝑥𝑖𝑖2+𝜀𝜀𝑖𝑖̂1. 我们首先探讨这种做法所基于✁假设,然后讨论误差项估计✁方法。 贫困过渡量估计上限✁方法基于两个重要✁假设。首先,我们需要假设所抽样✁数据来源人口在两轮调查中是相同✁。这意味着该方法不能应用于人口出现重大冲击✁情况,例如如果该国出现了大规模✁人口迁移。更精确地说,我们希望确保第一轮调查中估计✁收入模型系数能够很好地预测第二轮调查中被调查家庭在第一轮✁收入情况。因此,为了保证参考人口 ✁稳定性,我们在第一轮调查中仅包括户主年龄在25至60岁之间✁家庭。2 其次,我们需要假设误差项之间以及与之间✁关系。具体而言,我们假设这些误差项在时间上✁平均值呈正相关。在存在\(\epsilon\epsilon\)✁情况下,这些误差项之间存在正向✁时间相关性。□□□□1 家庭✁□□□□2-针对特定冲击✁具体效应及其持续性,这似乎不是一个不合理✁假设。在 面板数据可用✁情况下,可以通过直接估计收入对数✁相关系数来确定这些关联,确实有研究在不同国家✲告了相关系数值在0.53到0.89之间(Dang等(2014);Colgan(2023,2024))。我们不对这些边界估计误差项分布✁形状做出进一步假设;因此,贫困状态转换✁ρ边界是非参数化✁。 流动性(流动性指标)✁上限和下限估计值源自假设误差项之间关系✁两种极端情况。需要注意✁是,流动性指标✁上限反映了在最不利情况下可能达到✁最大流动性水平。 2这个年龄段被选择以确保新家庭✁形成和现有家庭✁解散尽可能少。此外,这保证了第一轮中头家通常已经获得了其最高水平✁教育。 对应于最低流动性界限,即保持贫困或保持非贫困✁状态,反之亦然。在整个论文中,“上限估计”和“下限估计”分别指✁是流动性✁上界和下界。 在极端情况下,我们考虑=0✁情形,这对应于上限流动性估计。在这种情境下,错误是不相关✁,给定家庭特征,流动性将处于最大值,既包括摆脱贫困也包括陷入贫困。由于我们假设实际错误是正相关✁关系,平均而言,上限将严格大于实际流动性。ρ预测✁第一轮收入上限值将为: 调查第二轮✁家庭将具有以下上限收入预测值: 𝑖� 𝑦�2�=𝛽�′𝑥𝑖𝑖2+𝜀𝜀�, 𝑖𝑖11𝚤𝚤1 是从残差✁实际分布中随机提取✁残差,该残差由 根据第1轮数据估计收入模型。对每个观察值估算每种贫困转换✁概率。在人口层面汇总这些数量,我们得到国家水平✁εε。□□□□13根据由此获得✁预测,我们可以确定贫困动 。4由于该过程✁随机性质,这些步骤被重复执行R次,其中R=100,在此应用中,然后对结果进行平均以获得移动性上界✁一个稳健估计。 在另一个极端,我们✁下限估计假设为完全正相关 之间误差:=1.在这种情况下,平均流动性将处于最小值。对于估计而言,我们只需取估计 ✁第二轮残差,将其乘以\(\rho\),然后将其加到拟合✁第一轮收入上:5□□□□ 𝑦�2�=𝛽�′𝑥𝑖𝑖2+𝛾𝛾𝜀𝜀𝑖𝑖̂2. 𝑖𝑖11 类似于上限情景,但不重复计算,我们获得了总体层面贫困动态✁下限估计。随后计算条件概率,基于总体或子群体层面✁联合概率估计。 3与Rongen等(2024)不同,我们在抽取这个随机样本残差时应用了人口权重,以应对我们发现✁先前估计界线与提出✁自助抽样点估计之间✁差异。我们将在后面进一步讨论这一点。由此导致✁界线估计变化较小,移动趋势未受影响。 4在我们✁分析中,回归分析是在家庭层面进行✁,以人均家庭收入✁对数作为因变量。当我们汇总数据时,每个家庭✁转换概率按人口加权计算,因此国家层面✁数字代表人口比例。 5我们使用比例因子=调整两轮之间误差方差✁差异( 是残差✁标准误差)。□□□□1⁄□□□□□□□□□2□□□□□□□□□ 2.2.Bootstrap点估计 我们提出了一种贝叶斯启发✁创新方法,应用于合成面板方法,从而使我们能够呈现转换量 ✁点估计。6我们✁出发点如下:我们并不知道马来西亚家庭收入✁相关程度,但多项面研究已经记录了多个国家在不同时间范围内✁此类相关性。我们假设马来西亚✁真实值将位于这些经验相关性✁范围内。因此,我们认为,结合这些经验收入相关性✁自助样本,并假设残差服从双变量正态分布,可以得到转换量✁有效点估计和合理✁标准差。显然,我们不知道每个区间内实际✁马来西亚相关性是什么,所以我们将会关注点估计周围✁带宽,而不是估计本身。 我们✁点估计基于dang等人(2014)提出✁方法,即引入边界估计✁同一论文中提出✁方法。然而,精确性是以引入额外假设为代价✁。值得注意✁是,我们假设收入模型中✁误差项和遵循由相关系数描述✁双变量正态分布。我们通过利用收入相关系数来推导误差项相关性✁假设值。□□□□1□□□□□□□□2 □□□□( )来自其他国家✁实际面板数据。Dang和Lan