March2024 亚行经济工作论文系列 NO.717 NinaAshleyDelaCruz,AnnJillianAdona,RheaMolato-Gayares和AlbertPark 学习损失 并从COVID-19泛型中恢复 证据的系统性审查 亚洲发展银行 亚行经济工作论文系列 从COVID-19大流行中学习损失和恢复:证据的系统评价 The亚行经济工作论文系列提出正在进行的研究,以引起对亚洲及太平洋发展问题的评论并鼓励辩论。表达的观点是作者的观点,不一定反映亚行的观点和政策或其理事会或其代表的政府。 NinaAshleyDelaCruz,AnnJillianAdona,RheaMolato-Gayares和AlbertPark 第717号,2024年3月 NinaAshleyDelaCruz(naodelacruz@gmail.com)是兰州大学的博士生。AnnJillianAdona(adona.jill@gmail.com)是旧金ft大学的硕士生。RheaMolato- Gayares(rmolato@adb.org)是副经济官员,AlbertPark (afpark@adb.org)是亚洲开发银行经济研究与发展影响部首席经济学家兼总干事。 亚洲发展银行 知识共享署名3.0IGO许可证(CCBY3.0IGO) ©2024亚洲开发银行 菲律宾马尼拉大都会1550号亚行大道6号电话63286324444;传真 63286362444 保留部分权利。出版于2024年。 ISSN2313-6537(印刷),2313-6545(电子)出版物库存编号WPS240093-2 DOI:http://dx.doi.org/10.22617/WPS240093-2 本出版物中表达的观点是作者的观点,不一定反映亚洲开发银行(ADB)或其理事会或其代表的政府的观点和政策。 亚行不保证本出版物中包含的数据的准确性,也不对其使用的任何后果承担任何责任。提及特定公司或制造商的产品并不意味着它们得到亚行的认可或推荐,而不是其他未提及的类似性质的公司或产品。 通过对特定领土或地理区域进行任何指定或提及,或在本出版物中使用“国家”一词,亚行无意对任何领土或区域的法律或其他地位做出任何判断。 本出版物可通过知识共享署名3.0IGO许可证(CCBY3.0IGO)https://creativecommons.org/licenses/by/3.0/igo/。通过使用本出版物的内容,您同意受本许可证条款的约束。有关归属、翻译、改编和权限,请阅读https://www.adb.org/terms-use。 本CC许可不适用于本出版物中的非亚行版权材料。如果该材料归因于其他来源,请联系该来源的版权所有者或出版商以获得复制许可。亚行对因使用该材料而引起的任何索赔概不负责。 请联系pubsmarketing@adb.org,如果您对内容有疑问或意见,或者如果您希望获得版权许可,您的预期使用不属于这些条款,或使用亚行标志的许可。 亚行出版物的更正可在http://www.adb.org/publications/corrigenda找到。注意:亚行承认“中国”为中华人民共和国。 摘要 这项系统评价涵盖了56项研究,这些研究衡量了在冠状病毒病(COVID-19)大流行期间学校关闭对学习成果的影响,以及20项研究,这些研究评估了减少学习损失的措施的影响。它限制了对可靠对照组的评估的关注 ,并提供了对学习损失的首次荟萃分析,该分析涵盖了比发达国家(15)更多的发展中国家(21)。我们发现,学校关闭一年与学习损失有关,相当于1.1年的学习价值,而学校重新开放可将这些损失减少到0.5年。关于减少学习损失的措施,我们发现,亲自或通过手机提供的辅导对减轻学习损失具有积极的统计学意义。 关键字:学习损失,COVID-19,教育,系统评价,荟萃分析 JEL代码:I20,I21,I24,I28 作者感谢MinhajMahmud,DavidAnthonyRaitzer,LennartReiners和DanielSuryadarma的意见和建议,以及 2023年10月24日ERDI系列研讨会的参与者。 1Introduction 冠状病毒病(COVID-19)大流行导致教育中断,规模空前。全球至少有70%的国家决定在某个时候关闭学校 (亚洲开发银行[ADB]2022)。学校完全关闭,平均20周没有面对面上课,中位数为16周。包括部分关闭 ,当学校因特定年级关闭或每周关闭几天时,关闭的总时间平均为41周,中位数为37周(联合国教育、科学及文化组织[教科文组织]统计研究所2023年)。已经进行了许多研究来衡量这些中断对学习成果的影响,以及替代学习模式如何减轻学习损失。 了解学习损失的程度以及减轻学习损失的计划的影响对于设计更具弹性的教育系统具有重要的政策意义 。在这篇系统综述中,我们根据利用考试成绩直接衡量学习成果的实证研究,对这些问题的证据进行了荟萃分析 。我们包括研究不同知识领域的学习,包括数学,阅读理解,语言和批判性思维。 除了评估学习损失的平均程度外,我们还评估了不同研究的估计学习损失的差异在多大程度上可以用特定国家的因素来解释。这有助于更深入地理解在大流行期间塑造学生教育经历的动态。 我们的审查还总结了有关旨在限制大流行期间学习损失或恢复因学校关闭而造成的学习损失的特定干预措施的影响的证据。通过检查各种干预措施的有效性,例如技术辅助学习和辅导计划,我们确定了基于证据的做法,可以为教育政策和干预措施提供信息。这次审查的结果将有助于正在进行的工作。 关于在后大流行时代使教育系统更具弹性的论述,并有望为教育领域未来的研究、政策和实践提供信息。 我们的系统综述建立并扩展了以前关于学习损失的综述文章(Betthäser,Bach-Mortese和Egzell2023;Moscoviz和Evas2022;Patrios,Vegas,Carter-Ra2022;Patrios2023;Sabarwal等人。2023年)。它在几个方面区别于以前的研究。首先,与以前的研究相比,它对发展中国家的覆盖率更高(表 1)。这一点很重要,因为发展中国家关闭学校的持续时间通常更长,发展中国家关闭学校的脆弱性预计会更大 ,例如,由于互联网接入更少,家庭资源更少,发展中国家的学校质量可能会更低(世界银行2022)。其次,它是为数不多的采用透明纳入标准的审查之一,要求研究具有可靠的识别策略,对照组不受流行病的影响。我们的搜索涵盖了截至2023年7月发布的研究,该研究比以前的评论晚,还包括学校重新开放的时期,使我们能够测试重新开放如何影响学习成果。 Review 涵盖的国家数量 发展中的数量涵盖的国家 Betthauseretal.2023 15 4 莫斯科维兹和埃文斯2022 25 8 Sabarwal,etal.2023 22 9 Patrinos2023 41 19 Patrinos,拉斯维加斯,Carter-Rau2022 20 4 这篇论文 36 21 表1:关于COVID-19大流行对学习成果影响的系统审查的国家覆盖率 COVID-19=冠状病毒病。来源:作者。 1采用严格质量标准的其他研究包括Betthäuser,Bach-Mortensen和Engzell(2023)和Sabarwal等人(2023)。 我们的审查包括56项衡量关闭学校影响的研究和20项评估减轻这些损失的干预措施效果的研究。我们发现,在COVID-19大流行期间关闭一个教学年的学校导致相当于1.1年的学习损失。当学校重新开放时,这种学习损失会得到缓解。 通过手机进行的教程在许多国家进行了测试,并证明了在限制学习损失方面的有效性。亲自辅导在恢复学习损失方面特别有效。在线学习和数字/EdTech干预措施也在几个国家进行了测试,但结果喜忧参半。 2Methods 2.1纳入标准 这项审查包括2020年9月至2023年7月之间进行的研究,这些研究衡量了中小学教育的学习成果。搜索仅限于使用定量评估工具来衡量学习成果的研究,包括标准化测试,成绩测试,诊断测试和特定主题评估(i。Procedres.、数学、阅读、语言)。我们只包括量化“治疗”学生和可比“对照”组之间表现差异的研究。为了估计学习损失,符合我们质量标准的研究设计可以分为三种类型: (i)队列差异,其中比较大流行前后n年级学生的考试成绩;(ii)比较大流行前后n年级学生考试成绩变化的队列差异;(iii)类似于 (ii)但使用个体面板数据。对于量化干预影响的研究,可接受的影响评价研究设计包括随机对照试验(RCT)、回归不连续设计(RDD)、倾向得分匹配(PSM)、工具变量和差异差异(DID)。定性分析方法,如文献综述、关键 线人访谈,焦点小组讨论,描述性分析,案例研究,观点文章,简报和社论不符合本评论的条件。 审查包括符合上述标准的同行评审文章和灰色文献(如报告、工作文件、简报)。它不限于任何特定的地理区域。它只包括英语文章。 2.2搜索和审查策略 我们开发了以下布尔搜索字符串,定义了我们的人口,暴露和感兴趣的结果:“(影响或影响)和(COVID*或冠状病毒)和学校*和(clos*或关闭)以及学生和(教育结果或评估*或分数*或测试*或成就或学习或入学或参与)或(补救*或缓解*)。” 我们使用此字符串来搜索以下搜索引擎,电子图书馆和影响评估注册表:EcoLit,教育资源信息中心 (ERIC),国际社会科学参考书目(IBSS),WebofSciece:社会科学引文索引(SSCI),GoogleScholar,PbMed,3ie系统审查数据库,EPPI-Cetre证据图书馆,坎贝尔图书馆,科克伦图书馆,美国经济协会(AEA)RCT注册中心,大英发展研究图书馆(BLDS),世界银行和国际货币基金组织联合图书馆(JOLIS),3ie影响评估注册中心(IDRIE)国际发展影响评估中心。 Snowball抽样是通过检查研究的参考列表来确定符合本综述的其他主要研究。此外,还包括通过专业网络和推荐引起作者注意的研究。 Thescreeningprocessinvolvedseveralstages.Afterthecomprehensivesearch,duplicateswereremovedandtheremainingstudiesweredividedbetweentwoofthecoauthersfortitleandabstractscreeningwerethen 根据纳入标准进行全文筛选。通过让两个审阅者独立筛选10项常见研究的全文并验证解释和方法的一致性,来测试和建立审阅者间的可靠性。在确认了审稿人之间的可靠性之后,其余的研究在两位审稿人之间进行了全文筛选。通过两位审稿人和第三位审稿人(也是合著者)的审议,解决了可疑的问题。 符合纳入标准的研究基于与国际发展坎贝尔协调小组(IDCG)偏差风险(ROB)工具一致的简单 ,修改的工具进行了质量评估。这个改进的工具使用两个类别来评估偏倚的风险,对于每个类别,研究被分类为 “高”,“中”或“低”质量。在至少一个类别中得分“低”的研究被排除在评论之外。表2总结了类别和质量标准 。 表2:质量评价标准 类别 高品质 中等质量 低质量 研究设计:是否考虑了潜在的混杂因素 RCT,RDD,ITT,工具变量,队列DID,个体DID 队列差异,其他回归设计 其他小型研究设计 对成果措施进行了明确和充分的描述,最好有验证理由 明确和充分描述了成果衡量标准 结果的简要说明 已命名但未明确描述的结果 DID=差异差异,ITT=意向治疗,RCT=随机对照试验,RDD=回归不连续设计。来源:作者。 图1总结了搜索和审查过程。最初的文章搜索总共产生了20,114条记录。删除重复项后,对18,953项研究进行了标题和摘要