确定短期预测模型的最优指标和滞后项 经谢WP2345 国际货币基金组织工作描报述告在的研究作者(们)的进步,并已发表至 引发评论并鼓励辩论。 所表达的观点均来自国际货币基金组织(IMF)的工作论文。作者(们)的,不一定反映 代表国际货币基金组织(IMF)、其执行董事会的观点或国际货币基金组织管理。 2023 MAR 2023国际货币基金组织 WP2345 国际货币基金组织工作论文能力发展研究所 识别短期预测模型的最佳指标和滞后期 由谢静编写 经保罗卡申授权分发,2023年3月 国际货币基金组织工作报告描述作者(们)正在进行的研究,并公开发表以征求评论和鼓励辩论。国际货币基金组织工作论文中表达的观点是作者的观点,并不一定代表国际货币基金组织、其执行董事会或国际货币基金组织管理的观点。 摘要:许多央行和政府机构使用现在评估技术来获取与商业周期相关的政策信息。然而,现有的现在评估方法在此目的上存在两个关键的缺陷。首先,与机器学习模型相比,它们在从(通常是)更大的变量集合中选择最佳解释变量(包括高频和低频指标)方面,几乎没有或没有指导。其次,除了解释变量的选择外,用于基准现在评估回归的自回归和移动平均项的顺序通常被任意设定。本文提出了一种简单程序,该程序同时选择了基准现在评估回归的最佳指标和ARIMApq项。所提出的ASARIMAX(带有外生变量的调整逐步自回归移动平均方法)方法显著降低了包括印度、阿根廷、澳大利亚、南非、英国和美国在内的六个国家关于实际GDP现在评估的样本外均方根误差。 JEL分类编号: C32C53E37E52011 关键词: 现在预测;混合频率;预测;商业周期 作者电子邮件地址: jxie2imforg 致谢: 我非常感谢SamOuliaris先生在整个研究过程中提供的宝贵指导,并对PaulCashin先生、FeiHan先生、IvySabuga女士、AlexanderBorodin先生以及能力发展研究所的同事们提供的有益评论表示感激。同时,我也要感谢ElisaManarinjara女士在出版过程中给予的支持。 工作论文 识别短期预测模型的最佳指标和滞后期 由谢静编写 目录 第1节引言3 第二章自动ARIMA选择程序4 第三部分:调整逐步ARIMAX变量选择程序及一个简单示例6 第四章基准模型10 第五章:现在预测方法11 第六节预测印度实际国内生产总值12 第七节实证结果14 第八节其他国家案例19 第九节结论19 附件IASARIMAX程序图表20 附件II候选指标和三大主要属性22 附件III其他国家实例24 参考文献34 图示 图1现实预测评估:三种基准模型17图2现实预测评估:桥梁和U MIDAS模型18 表格 表1:用于预测印度真实国内生产总值预先选定数据7 表2:自动ARIMA逐步变量选择步骤1和2结果8 表3:自动ARIMA逐步变量选择步骤3结果8 表4:自动ARIMA逐步变量选择选定基准模型9 表5:自动ARIMA逐步变量选择调整后基准模型9 表6:选定基准模型14 表7:检验序列相关性的Q统计量15 表8:检验正态性的JarqueBera检验15 表9:检验异方差性BreuschPaganGodfrey检验15 表10:预测评价比较:均方误差(RMSE)16 表11:预测评价比较:TheilU216 表12:其他国家预测评价比较:均方根误差(RMSE) 19 第一部分引言 当发生重大经济冲击,如COVID19大流行或全球金融危机时,政府通常会采用逆周期政策来减轻对实际国内生产总值(GDP)的负面冲击的严重性。这种基于证据的逆周期政策需要及时了解经济相对于趋势的状态。遗憾的是,由于以下原因,所需数据往往不可用:(a)所谓的“参差不齐边缘”问题,源于发布滞后或更普遍的缺失数据点,尤其是在实际GDP的情况下(Wallis,1986)以及(b)关键经济指标可用的混合不兼容的频率(Armesto,Engemann,Owyan,2010)。 许多中央银行和政府机构现在使用nowcasting技术(例如,Bridge,混合数据采样和动态因子模型)来应对这些问题。例如,欧洲央行(Babura等人,2013年),马耳他央行(Ellul和Ruisi,2022年),以及亚特兰大联邦储备银行(Higgins,2014年)。Nowcasting预测“此时此地”允许使用更及时且频率相似或更高的指标对低频变量(如实际GDP和通胀)进行实时预测。标准nowcasting模型通常涉及两个步骤:(a)在首选的基线nowcasting回归中预测高频指标,以消除参差不齐的边缘问题;(b)将高频指标转换为基线回归的目标频率 。这种转换的方式确定了所使用的特定nowcasting程序(见第5节)。 现有的现在预测方法的一个关键不足是,它们不提供足够的指导来选择包括在基线回归中的正确变量(通常为外生变量)。此外,在基线回归中使用的自回归(AR)和移动平均项(MA)的适当顺序很少被讨论,并且经常是任意设定的。实际上,据我们所知,现在预测练习很少使用带有外生变量的ARIMA模型(即ARIMAX模型 )。有趣的是,医学研究人员已经在一段时间内成功地使用ARIMAX模型来预测流感暴发。谷歌流感趋势作为外生变量,与仅使用先前流感水平作为解释变量(PreisMoat2014)的更标准的基线模型相比,报告了平均绝对误差(MAE)的显著降低。 本文研究了ARIMAX模型在预测关键经济变量(如实际GDP)方面的有效性。我们提出了一种简单的方法,从更大的经济变量集合中选择具有经济意义(即其估计系数与经济先验一致)、具有统计学显著性和在提高预测准确性方面有效的指标。 对于印度的实际GDP的例子,我们表明,应用一个允许在最优选择解释变量之外加入ARIMApq项的简单变量选择程序,可以显著提高桥和UMIDAS估计器的即期预测性能,相对于未使用所提变量选择程序的基准模型而言。 论文的其余部分组织如下:第2节回顾了EViews中可用的自动ARIMA估计程序。第3节提出了一种“调整的逐步ARIMAX变量选择程序(以下简称ASARIMAX)”以确定“最优”的ARIMA阶数和外生变量。 现在预测1该方法采用EViews自动ARIMA选择程序和自定义代码进行实施。第4章和第5章定义了我们在实证研究中使用三个基准和两个近期预测模型。第6章和第7章将ASARIMAX方法应用于印度实际GDP,与基准近期预测模型相比,获得了显著预测收益。第8章将ASARIMAX方法应用于预测五个额外国家实际GDP,进一步证明该方法效率和适用性。第9章得出结论。 第二章自动ARIMA选择程序 尽管EViews为用户提供了综合工具,使用传统(非自动化)BoxJenkins方法确定ARIMA模型阶数工具,但此过程可能耗时,且存在因数据自协方差函数与特定ARIMA模型难以匹配而产生误识别风险。为了提高效率和模型识别,EViews还提供了一种自动ARIMA模型选择程序,以帮助用户自动确定合适ARIMA设定。此过程包括以下步骤(EViews用户指南I,第538540页): 第一步:选择依赖变量适当变换 EViews运行以下两个回归以确定适当转换方法: 2111 2222 每个这些回归都是一个检验异方差性简单测试,具有较低绝对值。t统计量在假设中,同方差性比异方差性更明显。EViews如果绝对值表明需要,将使用对数变换。t关于统计量小于统计量。对数转换适用于具有指数增长率序列 21 thattypicallysufferfromheteroskedasticitysincethechangeisnonconstantGiventhatthelogtransformlinearizestherelationshipathatislowerthansuggestsregression2exhibitsrelativelymore 21 同方差性。因此,对数变换更为适当。 第二步:选择因变量差分级别。 在确定适当变换方法之后,必须决定在因变量上使用适当差分级别。EViews通过连续KPSS单位根测试 (以平稳性为零假设)来确定正确差分级别。基于Hyndman和Khandakar(2008)研究,EViews按以下步骤进行连续单位根测试:首先对非变换数据进行KPSS测试。如果测试拒绝平稳性,那么使用差分数据进行KPSS测试。这样程序会持续进行,直到EViews无法再拒绝平稳性零假设。 第三步:选择外生回归变量 1作者已经开发了EViews代码以实现ASARIMAX过程,并乐意将此代码提供给感兴趣各方。请联系谢晶()jx。ie2imforg此类请求回复:() EViews允许用户指定要包含在ARIMA选择过程中外生回归变量。默认情况下,包括一个常数项。我们将在第3节中定义我们提出外生回归变量输入方法。 第4步:选择ARIMA项顺序 在用户指定外生变量条件下,EViews使用标准模型选择准则来确定最适合一组数据ARIMAX模型。EViews提供了标准信息准则(赤池信息准则(AIC)、施瓦茨(SIC或BIC)和汉南奎因(HQ)准则),以及均方误差(MSE)作为模型选择准则。以下是这两种类型模型选择准则基本公式。 信息准则每个这三个标准都是基于拟合模型估计对数似然、模型中参数数量和观测值。具有最小信息准则模型更受青睐。 2 1 2 2 2 2 在公式中,表示似然函数对数值,表示使用T个观测值估计参数数量。 均方误差(MSE)评估这被称为样本内预测评估,其中每个模型都使用子样本(即前8090数据)进行估计,并在剩余数据(即1020)上进行预测。然后根据以下公式计算均方误差(MSE): 1 2 在哪里是预测子样本中时期数,是实际数据,是预测值。 时间t,且表示样本中观测数量。选择具有最小均方误差(MSE)模型。 EViews自动ARIMA选择程序取决于用户预先指定外生变量。也就是说,该程序仅确定自回归和移动平均阶数 ,而不允许自动外生变量选择。在下一节中,我们介绍了一种调整逐步ARIMAX(ASARIMAX)程序,该程序为任意组外生变量提供定制逐步选择程序。 第三部分:调整逐步ARIMAX变量选择程序及其简单示例 逐步模型选择程序,这些程序根据候选变量统计显著性来从回归中添加或删除变量,已被广泛用于找到首选 基线预测现在预测模型。这个过程从最一般模型反向消除或从最小可能模型前向包含开始。在前向选择中,根据显著性水平,候选变量按顺序添加到模型中。该程序检查所有变量是否具有统计显著性,并删除不具有显著性变量。在后向选择中,最初将所有候选变量添加到模型中,然后删除不显著个体变量。请注意,如果随后确定某个“被删除”变量具有统计显著性,该程序将重新引入该变量(ChowdhuryTurin,2020)。 尽管近年来逐步模型选择程序受到广泛流行,但批评依然持续。Smith(2018)认为,逐步回归基本问题在于它可能跳过了对因变量有因果效应解释变量,同时包含了偶然统计上显著但却是干扰性(虚假)变量 。这种结果通常会导致样本内预测拟合良好,但样本外预测较差。 为了应对这些问题,我们提出了一种改进逐步逐步程序,该程序将重点从统计显著性转移至可以归因于特定外生变量(指标)总体预测改进。我们从模型中仅包含常数项,没有外生变量开始,分别测试每个变量,如果其估计系数与经济先验相一致,并且产生优越模型预测性能,我们就将其添加到基准模型中 。 具体来说,我们根据三个标准来判断一个变量()是否是合适候选人。 条件1与模型相比,减小了赤池信息准则(AIC)值。 无需。 条件2系数符号与经济先验相符。 条件3在5置信水平上,具有统计学意义。 调整逐步ARIMAX(ASARIMAX)变量选择程序涉及四个步骤见附录1对于详细流程图(): 第一步我们将在自动ARIMA模型中添加第一个候选指