无法获得季度GDP的国家 /地区的面板Nowcasting OmerFarukAkbal,SeungMoChoi,FutoshiNarita,andJiaxiongYao WP/23/158 货币基金组织工作文件描述了作者正在进行的研究,并发表了这些论文,以引起评论并鼓励辩论。 基金组织工作文件中表达的观点是作者的观点,不一定代表基金组织、其执行董事会或基金组织管理层的观点。 2023 AUG ©2023国际货币基金组织WP/23/158 IMF工作文件 研究部 OmerFarukAkbal、SeungMoChoi、FutoshiNarita和JiaxiongYao准备的季度GDP不可用的国家 由ChrisPapageorgiou授权发行2023年8月 货币基金组织工作文件描述了作者正在进行的研究,并发表了这些论文,以引起评论并鼓励辩论。基金组织工作文件中表达的观点是作者的观点,不一定代表基金组织、其执行董事会或基金组织管理层的观点。 摘要:季度国内生产总值统计数据有助于及时进行经济评估,但60多个发展中经济体的此类数据有限,其中包括撒哈拉以南非洲的约20个国家以及三分之二以上的脆弱和受冲突影响的国家。为了解决这种有限的数据可用性,本文提出了一种小组方法,该方法利用从有数据的国家估计的统计关系,通过利用许多国家现成的指标来估计未发布此类统计数据的国家的季度GDP统计数据。该框架显示出潜力,特别是在应用于类似国家集团时,并可以在经验证据的支持下提供对经济状况的宝贵实时见解。 推荐引用:Akbal,OmerFaruk,SeungMoChoi,FutoshiNarita,andJiaxiongYao.2023.“Panelnowcastingforcountrieswhosequarterygdpsareunavailable.”IMFWorkingPaper,23/158. JEL分类号: E37、O11、O55 关键字: 发展中经济体;脆弱和受冲突影响的国家;国内生产总值;低收入国家;临近预报;撒哈拉以南非洲 作者的电子邮件地址: Oakbal@imf.org;SCoi@imf.org;Fnarita@imf.org;JYao@imf.org 工作文件 无法获得季度GDP的国家/地区的面板 Nowcasting OmerFarukAkbal,SeungMoChoi,FutoshiNarita,andjiaxiongYao1 1致谢。我们感谢HayAbdel-Latif,MarijA.Bolhis,LcEyrad,JessFeradez-Villaverde,MicheleForio,MachioNarita,PapaMBagicN'Diaye,ChrisPapageorgio,M.HashemPesara,AdrewJohTiffi以及国际货币基金组织的其他同事 ,特别是AFRNowcast团队的成员以及国际货币基金组织非洲部的国家团队。本文是美国支持的“低收入国家宏观经济政策”研究项目的一部分。K.的外交,联邦和发展办公室(FCDO)以及韩国政府支持的“亚洲气候变化和新兴风险的宏观经济研究”。所表达的观点是作者的观点,不一定代表货币基金组织、执行董事会、货币基金组织管理层或支持伙伴的观点。我们对剩余的错误负责。在本文中,术语“国家”和“经济”互换使用,并非在所有情况下都是指国际法和惯例所理解的国家的领土实体。 Contents 1. 2. 3. 4. 图3.季度增长预报和实际增长:乌干达和塞拉利昂12 图4.年度增长预报和实际增长:乌干达和塞拉利昂13 图5.乌干达和塞拉利昂2022Q3的增长预报分解14 5. I.A. I.B. I.C. I.D. I.E. ...............................................................................................................................................................28 词汇表 CPI消费价格指数 EMDE新兴市场和发展中经济体 FCS脆弱和受冲突影响的国家 GDP国内生产总值 LGB光梯度增强回归 LIDC低收入发展中国家 NO2二氧化氮 OECD经济合作与发展组织 OLS普通最小二乘 PPP购买力平价 RMSE均方根误差 SSA撒哈拉以南非洲 1.Introduction 监测发展中经济体经济活动的一个显著障碍是季度GDP统计数据的可用性有限。Silgwe,Bear和Gerreiro(2022)最近对国民账户统计数据的评估表明,有60多个国家没有发布官方季度GDP统计数据。其中包括撒哈拉以南非洲(SSA)的约20个国家,一半以上的低收入发展中国家(LIDC)以及三分之二以上的脆弱和受冲突影响的国家(FCS)。事实上,对于大约20个国家来说,这个时间滞后超过了四分之一。及时提供的季度GDP统计数据有限,给决策者带来了重大挑战,特别是在迅速应对经济状况的突然变化时,例如最近的多次全球冲击。 为了应对这一挑战,本文提出了一种小组方法来即时预测季度GDP,特别是针对不公布季度GDP统计数据的国家。但是,它利用了拥有可用数据的国家的见解来研究数据可用性有限的国家的经济活动。特别是,该方法的特点是使用非传统数据源,这些数据源在许多国家/地区相对更可用。给定一个国家的面板数据集,一种估计方法(e。Procedre,普通最小二乘法,OLS)可以使用给定国家的输入变量,生成一个owcast作为季度GDP的拟合值。为了减轻某些国家,特别是在最近的时期,仍然存在输入变量缺少值的障碍,本文建议使用一系列的owcast。 拟议的方法补充了现有的努力,以加强对存在数据差距的国家的及时经济评估,例如国际货币基金组织非洲部的工作流程( Barhoumi等,2022年)。 构建经济活动的高频指标也是基金组织统计部门一直关注的领域,包括其能力发展议程。这项研究还与越来越多的关于使用非传统数据源进行经济分析的文献有关,包括夜间灯光等遥感数据(例如Procedre,Debbich2019;H和Yao2022;Beyer,H和Yao2022),Google趋势(NaritaadYi2018)和GooglePlacesAPI(Asti等,2021)。 Therestofthepaperisorganizedasfollows.Section2providesanoverviewoftheproposedpanelnowcastingframework,whiledetailsarepresentedinAnnexI.Section3evaluatestheperformanceofpanelnowcasts. 第4节展示了SSA中选定国家的结果。第5节总结了关键的警告和改进的空间。 1这是根据国际货币基金组织的FCS战略(IMF2022a),根据世界银行截至2023年3月的FCS分类。 2Nowcasting是使用观察到的高频指标来估计未观察变量的当前或最近的过去值。这是通过合并高频可用数据来产生与经济活动水平相关的综合指标的更一般方法的一部分。 3Google趋势数据已广泛用于临近预报和预测目的。例如,参见《成田》和《尹》(2018)中引用的论文。最近,Woloszo(2020)为46个OECD和G20国家建立了一个名为OECDWeelyTracer的GDP增长快播框架,使用 Google趋势搜索数据和神经网络模型(多层感知器回归)。Cevi(2022)使用与旅行相关的在线搜索查询来预测来自美国的游客人数S到巴哈马。 2.面板预测季度GDP增长 Theproposedframeworkassumesacommonstatisticalrelationshipacrossalleconomiesinthesample.Let ����表示季度GDP增长,以对数差计算,与一年前的同一季度(即同比增长)相比��和时间�同样,所有其他输入变量,用X���,从一年前的同一季度转变为季度增长。从概念上讲,我们的目标是构建一个����通过估计条件期望E[<unk>���|X���],这是一个任意函数X���,这可能在一般情况下取决于国家��和周期�。我们的小组方法依赖于一个强有力的假设,即这一功能在各个国家和时期都很常见,用<unk><unk>(X���),无索引��或期间�,这样: 𝑦𝑖𝑖𝑡=<unk><unk>(X𝑖𝑖𝑡)𝑖𝑖,𝑖𝑖𝑡<unk><unk><unk>(X𝑖𝑖𝑡) where𝜀𝑖𝑖�是一个即时广播错误,并且𝑖𝑖�是去年同期季度实际GDP增长的nowcast。自𝑦𝑖𝑖�对于没有公布季度GDP数据的国家来说 ,函数关系是不可观察的,𝑓,是使用具有可用数据的panel-country组进行估计的。要估计函数<unk><unk>(X𝑖𝑖𝑡),我们 使用机器学习技术称为“光梯度增强回归”(LGB5)以及OLS。对于LGB,我们使用默认的超参数。有关详细信息,请参见附件I.B,有关我们如何基于季度增长的nowcast来构建年度增长的nowcast。 面板估计的一个关键挑战是收集一组输入数据序列X���通常可用于样本中的一组国家/地区。自2008年第一季度以来,我们收集了多达200个经济体的117个与经济活动相关的季度指标,其中76个指标来自非传统数据来源(见附件一。A详情)6。即使在利用非传统数据源之后,覆盖所有国家/地区时期的利益对仍然具有挑战性,尤其是在最近时期。在我们的数据集中,所有样本期的所有经济体可用的变量是六个全球商品价格,两个全球金融指数(U.S.2年。 债券收益率,美国股市波动率指数),以及14个全球搜索量指数(在我们的样本中有28个)。严格地说,我们可以只使用这22个变量(连同季度和国家组dummies),但这些可能太少了,无法捕捉增长动态。 为了尽可能多地反映所有可用输入变量的信息,我们通过根据每个时期每个国家/地区的可用数据对所有规格取平均值,来考虑一组owercast。这种平均集合确保了为所有国家和时期生成的owcast,至少使用如上所述的22个输入变量的最小集合。然后,如果在一个时期内观察到一个国家的更多变量,则owcast会反映更多信息。为了进行比较,我们还考虑了最“通用”的规范(i。Procedres. ,其输入变量的数量最大的规范,取决于国家/地区对)和最少的一个(i。Procedres.,其输入变量数量最小的规范-具有上述 22个变量的模型)。相应地,生成了三个集合owcast,分别称为“平均”,“最大”和“最小”模型,其中“平均”集合是基线(图 1)。见附件一D关于处理缺失观察的更多讨论。 4许多国家实施链接量措施,从而总体GDP增长率可能与从组成部分汇总得出的增长率不同。本文没有将GDP组成部分的任何结构汇总强加给总体GDP增长,而是旨在将从细粒度数据收集的信息用于单一的总体增长。光梯度增强是一种基于决策树的学习算法,它的效率、低内存使用和处理大规模数据的能力使其成为该工具包的一个有利的机器学习算法。 6本研究考虑的未来工作是扩大IMF高频数据中心的数据覆盖范围。 我们还考虑了不同的估计子样本,以利用国家组内的相似性。为了减轻在不同性质的国家之间假设共同的统计结构的警告,也可以根据地区通过子样本估算owcast(例如Procedre,SSA)和导出类型(例如Procedre,燃料出口商)。为子样本中的那些经济体生成子样本即时预测。为了最大限度地提高覆盖率,我们的基线仍然使用完整样本(标记为“全球”),尽管具有相似性质的二次抽样经济可能会改善临近预报表现。 图1.依赖于数据可用性的集合nowercasts 来源。作者。 Notes.这是一个概念图,用于解释如何基于数据