国际清算银行工作底稿 1040号 量化的作用利率,美元和Covid油价 由伊曼纽尔Kohlscheen 货币和经济部门 2022年9月 凝胶的分类:C40,+30,Q40Q41Q47。 关键词:美元,预测,机器学习,石油,风险。 国际清算银行的工作文件是由货币与经济委员会的成员撰写的。国际清算银行部,并不时地由其他机构提供。 报道称,这些论文是由经济学家撰写的,并由银行出版。这些论文的主题是:"我们的生活"。这些文章具有技术性和趣味性。其中所表达的观点是他们自己的观点。 作者和不一定BIS的观点。 该出版物可在BIS网站(www.bis.org)查阅。 ©国际清算银行2022年。保留所有权利。简要摘录可能是只要说明来源,就可以复制或翻译。 ISSN1020-0959(印刷)ISSN1682-7678(在线) 量化利率的作用, 美元和Covid油价 伊曼纽尔Kohlscheen12 摘要 本研究通过不可知的随机森林的视角来分析石油价格的变化。模型,它是基于1000个回归树的。它表明,这种高度规范的。灵活的计算模型减少了样本内均方根误差(RMSEs) 相对于使用同一组11个变量的标准线性最小二乘法模型而言,该模型提高了65%。解释因素。在预测工作中,RMSE的减少幅度在51%之间。 和68%,突出了石油市场中非线性的相关性。结果强调了将金融因素纳入石油模型的重要性。美国利率、美元和VIX共占模型RMSE的39%。 在2010年后的样本中减少,在2020年后的样本中上升到48%。如果Covid-19也被认为是一个风险因素,这些份额变得更大。 凝胶的分类:C40;+30;Q40;Q41;Q47。 关键词:美元;预测;机器学习;石油;风险。 1国际清算银行高级经济学家,Centralbahnplatz2,4002Basel,Switzerland。 电子邮件地址:emanuel.kohlscheen@bis.org。 2我感谢ChristianeBaumeister和DenizIgan的有益评论,感谢EmeseKuruc。 为出色的研究协助。本文所表达的观点是作者的观点,并不代表作者的观点。这不一定反映国际清算银行的观点。 1.介绍 布伦特和WTI石油价格最终是资产价格。他们的报价有很大的对现代经济的反响,特别是对涉及"一带一路"的演变。 导致整体通货膨胀。此外,它们可能会导致资本流入的巨大波动和生产国的国民财富,因为它们最终会导致生产国的价值重估。 仍在地下的资产存量。随着资产价格的变化,油价往往会做出反应迅速了解相关的传入新闻。最近,世卫组织宣布了OMCron 作为关注的Covid-19变体,在2021年11月26日,再次强调了这一点。当天布伦特石油从每桶81美元跌至71½美元,影响减少了12%。3 资产价格的角度表明,纳入金融因素可能是对理解油价走势很重要,因为这些因素是不同的。 不断可能会对石油市场产生影响。有鉴于此,本文件 通过研究2010年以来的石油价格变化,对文献做出了贡献。特别是美元价值的变化、市场利率的影响。 整体市场波动性和Covid-19。该分析基于一个灵活的随机 森林模型(在这种情况下是1000棵回归树的集合)。这种方法具有的关键优势是,它可以揭开并轻松容纳最终的非线性 关系和变量之间的相互作用。 所介绍的基准随机森林模型很容易复制,并且提供了一个明显优越的关系描述。样本内均方根 发现月度价格变化的RMSE(RMSE)要比"月度价格变化"的RMSE小65%。 AR(1)和OLS模型使用相同的11个(每日频率)解释变量。 因素。事实上,即使是样本外的RMSEs也比样本内的RMSEs小得多。计量经济学模型的RMSE。在适当的1至3个月的提前预测中, "1000个回归树模型"带来的RMSE降低幅度在51%至 68%,突出了石油市场非线性的相关性。 除了比较因子的相关性和预测性能,本文还 其创新之处在于,它激发了个别变量对石油价格的部分影响。讨论他们的经济解释。总的来说,这些发现强调了 将金融因素纳入石油模型的重要性。美国的利率、美元和VIX指数共占模型RMSE减少的39%。 2010年后的样本,在2020年后的样本中上升到48%。如果Covid-19也被作为一个风险因素,这些份额甚至变得更大。 与文学。 目前的文章建立在石油市场文献的许多见解之上。审查这些广泛的贡献超出了本研究的范围。 相反,我强调了与此更直接相关的有限的一些文章。研究。 当前的全球活动水平与石油价格有很强的关联性(此处为 由24个国家的PMI活动调查所代表的数据),非常符合中国的情况。 3美元指数在这一天变化很小。 旨在确定全球需求的替代代用指标的文献(如Kilian (2009),Kilian和Zhou(2018)和Baumeister等人(2020)等)。的。本文明确区分了来自发达经济体的需求和非发达经济体的需求。 新兴经济体。事实上,新兴经济体的活动效应是相对 强势也与Aastveit等人(2015)的早期研究结果很一致。这可能是由于这不仅是因为发展中市场在全球经济中的份额不断增加,而且也是因为作为石油的边际买家。 美国的国际价值之间明显的反比关系的突出性 美元和石油价格的变化与Akram(2009)中的早期结果一致,也与德克萨斯大学的研究结果一致。 Schryder和Peersman(2015),石油与非燃料的正相关也是如此。 商品价格(Akram(2009)和Avalos(2014))。此外,该分析发现与市场风险成反比关系,当市场风险增加时,这种反比关系更加突出。锐利。这场大流行对石油市场的影响是显而易见的。更具体地说,全球发现Covid-19的死亡对石油价格有高度不对称的影响。有关新闻 伤亡人数的增加推动了油价的下跌,而关于进一步削减油价的消息则使油价下跌。这些计数产生小的边际效应。 Baumeister和Kilian(2014)评估了用于预测石油的计量经济学模型。并得出结论认为,使用月度数据比使用其他数据能带来更准确的预测。基于季度数据的模型。本文试图更进一步,依靠的是 在每天的数据上,可以很容易地持续更新,以产生更好的结果。 预测,也适用于1-3个月的范围。尽管如此,正如Baumeister(2016)所言把它”…油价的可预测性仅次于其价格。(观察)决定因素,…” (p。154)。4 最后,机器学习技术在经济学中的理论和使用是 在Varian(2014)、Kleinberg等人(2015)和Mullainathan中详细讨论过。和Spiess(2017)。随机森林是由Breiman(2001)提出的,并有 已被证明在经济预测中表现特别好(例如见 Fernandez-Delgado等人(2014)的综合分析,或应用于通货膨胀预测Medeirosetal(2021))。56 大纲。文章的进展如下。第2节报告了关键性的信息来源 兴趣变量(即现货原油价格的变化),以及潜在的每日清单。经济和金融的解释变量。然后,它开始介绍机器 支持分析的学习模型,以及预测的明显减少。 它所能提供的错误。第3节显示了每个因素对以下方面的贡献程度这种RMSE的减少,并得出了解释变量对石油的部分影响 价格。第四节分析了关键驱动因素的相对重要性如何变化 自该大流行病开始以来。第5节记录了自大流行开始以来的强大相对随机森林模型的性能延伸到了纯粹的石油预测工作中。 4观察补充道。 5Fernandez-Delgado等人(2014)比较了121个分类器模型的性能。 数据集,并发现(相对简单的)随机森林是表现最好的。 6在资产定价文献中,Gu等人(2020)报告了使用机器的投资者的巨大收益。 学习。他们将预测性收益归功于"允许非线性预测器的相互作用被忽略。其他方法。” 领先1、2、3个月的价格变化。第6节介绍了稳健性测试和第七节总结道。 2.方法 2.1数据 本文的重点是测试不同的经济和金融因素如何 对石油价格的影响。更具体地说,它揭开了22天(月)对数的布伦特油价的变化与下列潜在的解释因素有关 变量:前一个月的价格变化(即日间的对数变化)。t-44和t-22作为一个"滞后的因变量");美国的国际价值的变化 美元;美国的利率;市场的波动性(CBOEVIX);全球的Covid 19个死亡率;美国消费者价格水平(核心PCE);非燃料的价格指数大宗商品,在全球经济活动。 美国的利率是2年期国债收益率,它的优势在于捕捉到并受到常规和非常规货币政策的影响。 在此期间(2010年1月在分析2022年1月)。全球经济 活动是由花旗银行先进的经济惊喜指数和先进的经济惊喜指数来代表的。新兴市场经济体,以及Markit计算的平均PMI指数。 对这两组国家来说。虽然经济意外指数的更新 每天,根据当天传入的数据是否优于或低于测得的数据来决定。 在对企业进行全面调查的基础上,采购经理人指数对企业的预期进行了衡量。每个国家当前的经济活动。所用变量的完整清单 和他们可以在附录中找到来源。 所有变量都是自然对数,然后转换为22天的变化。的。利率和经济惊喜指数(不在对数内)是例外。 总的来说,样本包含了上述变量的3,144个每日观测值。请注意尽管本文的重点是每月的变化,而不是非常高的变化。 频率,下面描述的方法允许使用所有的每日观察。7 2.2“1000回归树模型” 为了适当捕捉可能在石油市场上启动的非线性效应特别是对于关心的风险因素分析是基于一个方法 7这是因为随机森林模型对每个观测值进行单独分类,而不参考 在时间序列模型中,对紧随其后的观察结果进行分析。这就是说,22天的滞后变化潜在的解释变量中包括目标变量,这样模型就可以捕捉到 价格动量。 能很好地适应这些。更具体地说,该基准模型是基于布雷曼(2001)首次提出了随机森林的概念(建立在 在Breiman等人(1984)中首次提出的回归树。)这些是非参数化,但高度规范的模型,有助于发现非线性的问题。 复杂的变量之间的相互关系的方式,这在很大程度上是可以理解的。不可知论者。 随机森林依靠的是回归树的集合。简单地说,回归 树的目的是为了最好地预测输出变量(在这种情况下是22天的对数变化)。布伦特价格)。在计算密集型算法的基础上生长出一棵树,该算法 遵循以下顺序:i)随机分离1/3的观测值,用于后验。 性能测试(测试样本);ii)从一个单一节点开始,包含所有的3,144个样本中的其余2/3的观察值("训练样本");iii)对于所有解释变量(特征)的所有可能的二元拆分,计算出 分割后将产生的均方预测误差;iv)分割数据集 基于变量和阈值水平,提供最低的MSEs总和;v)对于 每个产生的节点,返回到步骤i)。这个过程一直持续到一个停止的标准是满足。8 当前应用的一个估计回归树的例子所示在附录中,停止准则p=1000,p表示最低 每个分割节点的观察数(浅层的停止标准)。 树)。从本质上讲,结果预测被当作一个分类问题来处理。一旦树完全长大,算法会评估在哪个终端节点上有新的观察结果。会下降。然后,它预测结果将等于目标的平均值 该节点中的"训练集"观测值的变量。因此,该方法是基于一个纯粹的数据驱动的方法。 稳健性的实现是通过将结果预测不是基于一个,而是基于一个非常大的大量的回归树。也就是说,预测是基于平均的 的预测N回归树,基于增长N不同的随机 次级样本数据集。9图1显示了每月的平均平方误差是怎样的。 布伦特价格随着随机森林中使用的树的数量的减少而迅速下降。月石油价格变化的增长。1011 8关于更详细的解释,请参见科斯玛-沙利奇的统计说明,网址是:。 www.stat.cmu.edu/~cshalizi/350-2006/lecture-10.pdf,这个解释是基于此的。 9请注意,这里的预测值和计量经济