美国联邦储备系统理事会国际金融讨论文件 ISSN1073-2500(印刷)ISSN2767-4509(在线) 1374号 2023年3月 使用机器学习对文本数据识别金融危机 玛丽·陈、马修·德黑文、伊莎贝尔·基谢尔特、李昇贞和马丁·西西里安 请引用这篇文章: 陈、玛丽、马修·德黑文、伊莎贝尔·基舍尔特、李昇贞和马丁·西西里安(2023)。“使用文本数据的机器学习识别金融危机”,国际金融讨论文件1374。华盛顿:联邦储备系统理事会,https://doi.org/10.17016/IFDP.2023.1374。 注:国际金融讨论文件(IFDPs)是分发的初步材料,旨在激发后期讨论和批评性评论。所阐述的分析和结论是作者的分析和结论,并不表示研究人员或理事会的其他成员同意。出版物中对国际金融讨论文件系列的引用(致谢除外)应与作者澄清,以保护这些文件的暂定性质。最近的IFDP可在www.federalreserve.gov/pubs/ifdp/的网上查阅。本文可从www.ssrn.com的社会科学研究网络电子图书馆免费下载。 使用机器学习对文本数据识别金融危机 ∗ 玛丽陈,马修DeHaven伊莎贝尔Kitschelt,Seung荣格李,马丁j.西西里‖2023年3月9日 摘要 我们在文本数据上使用机器学习技术来识别金融危机。危机的爆发及其持续时间对实体经济活动有影响,因此可以成为宏观审慎、货币和财政政策的宝贵投入。学术文献和政策领域主要依靠专家判断来确定危机,通常具有滞后性。因此,危机持续时间和脆弱性的积累阶段通常只能通过事后诸觉来确定。尽管我们可以使用传统的计量经济学技术和现成的市场数据在不同程度上识别和预测全球危机的一部分,但我们发现文本数据有助于减少此类模型的样本外测试中的假阳性和假阴性,特别是当危机被认为更严重时。建立一个跨国家实时一致的框架可以使世界各地的政策制定者受益,尤其是在需要跨不同政府政策进行国际协调的情况下。 凝胶的分类:C53;C55;G01 关键字:金融危机;机器学习;自然语言处理 ∗我们感谢三位匿名推荐人的反馈。我们特别感谢ArthurTurrell指导我们完成研究的初始阶段,感谢LeoSaenger提供出色的研究帮助。我们感谢XiangLi和RobinLumsdaine对论文的精彩讨论,感谢RicardoCorrea对论文的有益评论。我们还要感谢研讨会参与者联邦储备委员会、里士满联邦储备银行和欧洲央行/ESRB,以及SEM会议、IBEFA会议、先进研究方法和分析国际会议、RiskLab/芬兰银行/ESRB系统性风险分析会议、SFA会议、FMA会议、NFA会议、EEA大会、AEA会议、FRB-IMF关于宏观金融新技术和数据联合研讨会的与会者,经济与金融研究会议的文本分析,加拿大银行中央银行会议第三届预测会议和墨西哥银行第三届金融稳定会议,为我们的分析提供了宝贵的反馈。本文所述观点是作者的观点,不一定是联邦储备委员会或波士顿联邦储备银行的观点。所有错误都是作者的,而不是其他人的。该论文最近被接受并发表在风险和财务管理杂志》上. †波士顿联邦储备银行。电子邮件:mary.chen@bos.frb.org。 ‡布朗大学。电子邮件:马修·德哈夫en@icloud.com。 §美国联邦储备委员会。电子邮件:isabel.kitschelt@frb.gov。 ¶相应的作者,美国联邦储备委员会。电子邮件:seung.j.lee@frb.gov。 ‖斯坦福大学法学院。电子邮件:martinsicilian@gmail.com。 我相信生物大脑所能实现的目标与计算机可以实现的目标之间没有深刻的区别。因此,从理论上讲,计算机可以模仿人类智能,并超越人类智能。 ——斯蒂芬·霍金 1介绍 在本文中,我们使用文本数据的机器学习技术来识别和预测金融危机。学术文献和政策领域主要依靠专家判断来决定金融危机。1因此,危机时期和脆弱性积累阶段的确定通常由专家事后确定。这意味着关于金融和银行危机的各种数据更新缓慢;在许多情况下,更新仅在多年后发生(莱因哈特和罗格夫(2009);莱文和瓦伦西亚(2013))或根本没有(罗默和罗默(2017),男爵等人(2020)) 。 在我们的分析中,我们建立了一个指标,实时发出特定国家处于危机中的整个时期的信号。由于适用于许多国家的定量变量的局限性,我们对以下文本数据使用机器学习技术:来自官方国际组织(经济合作与发展组织(OECD)和国际货币基金组织(IMF))的报告和来自媒体的文章(Refinitiv,机器可读新闻(MRN),路透社每日新闻提要(RDNF))。这些数据来源帮助我们制定一个指标,该指标在整个危机期间迅速增加并保持高位。尽管某些类型的金融危机时期的相当一部分可以用传统的计量经济学技术利用现成的市场数据来识别,但我们发现,文本数据在此类模型的样本外测试中显着有助于减少假阳性和假阴性,特别是当危机被认为更严重时。此外,我们的模型甚至可以检测非传统形式的金融危机;例如,它能够确定最近的COVID-19大流行是美国的金融危机。 实时识别金融危机对于决策者实施宏观审慎政策和危机管理以及货币政策和财政政策非常重要。在宏观审慎政策的背景下,较高的读数可以为何时以及何时释放反周期资本缓冲(CCyB)以及何时释放的决策提供有价值的输入 1某些类型的危机是由基于市场数据的阈值决定的。例如,与货币贬值相关的阈值可用于定义货币危机,如Laeven和 Valencia(2013),与银行股票价格下跌相关的阈值可用于定义银行危机,如Baron等人(2020)。然而,这些门槛有时有些武断,一般来说,金融危机通常是以叙事方式确定的。 例如,再次开始增加它。CCyB是对银行征收的额外资本要求,以应对金融体系的顺周期性。在许多国家,当金融体系脆弱性高时,CCyB就会被激活;因此,银行必须在经济繁荣时期积累资本。当风险成为现实或危机发生时,可以释放缓冲,就像一些国家在COVID-19大流行高峰期的情况一样 。这样,银行将有动力在经济繁荣时期更加谨慎地放贷,而银行在经济不景气时期维持信贷流动的能力则可以实现宏观经济利益。在货币和财政政策的背景下,政策制定者最不想做的就是在金融危机尚未结束时对货币政策更加鹰派或对财政政策更加严格。过早的货币紧缩或紧缩政策可能导致实际活动明显低于其他政策,并可能延长危机。如有必要,建立一个适用于世界上许多国家的框架可能有助于各种政策的国际协调。换言之,在这种情况下,以一致的方式查明各国之间的危机,对于以国际协调的方式处理危机至关重要。 我们提出了许多技术来揭示我们开发的机器学习模型的黑盒性质,这有助于我们了解已识别的金融危机的性质。在这种情况下,模型的主要输入(即单词)提供了对驱动结果的见解。例如,我们可以清楚地看到,全球金融危机更像是一场银行危机,而不是COVID-19大流行,后者与更普遍的财务困难有关。 最后,我们使用类似的模型预测金融危机时期,并讨论使用不同类型的文本作为输入时如何解释获得的不同结果。例如,使用媒体文章的模型比使用官方机构报告的模型更擅长预测金融危机;然而,在实时识别危机方面,官方报告占上风。这可能意味着,拥有更多读者群的媒体可能具有更多的煽动性,而不是与官方机构相关的文本的纯粹描述性特征。这与席勒(2017)中描述的叙事观点一致,该观点强调流行故事可以影响个人和集体的经济行为。 在第2节的文献综述开始之后,我们分别在第3节和第4节中描述了数据和模型。第5节和第6节分别描述了我们的机器学习模型,并展示了我们在临近预报和预测金融危机方面的结果,重点是样本外性能指标和可解释的人工智能。我们还讨论了为什么不同类型的文本分别可用于识别和预测金融危机 。在第7节中,我们提供了我们的结论。 2文学 我们的研究有助于预测和检测金融危机的文献,更广泛地说,有助于使用机器学习和文本数据来预测宏观经济和金融状况。 至于预测和识别危机,DrehmannandJuselius(2014)、Aikmanetal.(2017)、Leeetal.(2020)和Cesa-Bianchietal.(2019)为理解导致金融危机的金融脆弱性提供了一个框架。BraveandButters(2012)提供了一种理解金融状况如何预测金融危机的方法。文献指出,许多不同类型的脆弱性在金融危机之前增加,特别是当它们最终成为系统性时。至于使用机器学习对定量数据直接最大化预测能力,Alessi和Detken(2018)、Bluwstein等人(2020)和Fouliard等人(2022)提供了分析,以展示机器学习如何在预测金融危机方面非常强大。这些论文的背景主要与理解导致金融危机的因素有关,而不是识别不同类型的危机。 所有这些论文都把金融危机的开始日期作为主要的因变量,而忽略了相当长的一段时间内持续的“危机”状态。事实上,这些模型中的相关定量指标的行为方式是,指数要么在危机开始时(或其他接近危机的市场中断时期)飙升,要么在危机开始时逐渐上升,然后在危机开始时达到峰值 ,然后急剧下降。图1说明了根据Romer和Romer(2017)的数据,这些类型的指标在美国与金融危机时期并列的表现,具有一定程度的严重性。Leeetal.(2020)的LPS金融脆弱性指标在危机前变得升高,并在危机之后急剧下降,因为它是金融体系中脆弱性积累的指标。同样,当查看基于已实现波动率的危机预测模型(类似于许多金融压力指数中使用的指标)时,急剧增加比金融危机更频繁地发生,这意味着该指标在检测金融危机时倾向于提供误报。 至于其他识别危机的研究,Duprey等人(2017)提供了一种使用马尔可夫转换和基于阈值的向量自回归模型的方法,该模型使用金融压力指数和工业生产数据来识别欧盟国家的金融危机。与此同时,Laeven和Valencia(2013)使用叙述和定量阈值方法的组合来识别金融危机;但是,这些需要大量时间来更新。Baron等人(2020)提供了一种使用银行股票价格数据实时识别银行危机的方法,尽管这可能无法检测到与银行无关的金融危机。另一方面,Romer和Romer(2017)通过阅读每个国家的经合组织经济展望,定义了1967年至2012年24个经合组织国家财务困境的严重程度。这种叙事确定 图1:不同的金融稳定指标 注意:该图显示了美国的Lee-Posenau-Stebunovs(LPS)脆弱性指数(来自Lee等人(2020))以及根据美国股市计算的实际波动率模型的预测(类似于Duprey等人(2017)和Danielsson等人(2018)中使用的指标)。阴影区域表示根据Romer和Romer (2017)的危机严重性为5或更高的时期。这两个指标说明了当前的金融稳定性定量指标如何无法提供有关危机状态的开始或危机持续时间的一致信息。 危机与之后的产出下降有关,下降的变化是由金融困境本身的严重程度和持久性驱动的。我们的研究结合了Romer和Romer(2017)中使用的方法,然后将机器学习应用于经合组织经济展望和其他基于Romer和Romer(2017)构建的(危机)训练样本的文本数据,以开发金融危机的实时指标 。 事实上,近年来,使用文本分析来预测和识别各种宏观经济和金融总量变得越来越流行。例如,Angelico等人(2022)使用Twitter提要来了解通胀预期,而Kalamara等人(2022)使用英国报纸文章来预测非常广泛的总体宏观金融变量,例如GDP增长、通货膨胀和金融脆弱性指标。这些新文献指出了一组扩展的信息,可用于帮助理解各种宏观金融总量。此外,Cerchiello等人(2017)等研究使用文本数据在单个银行层面预测财务困境。与我们的工作一样,所有这些论文都通过文本提供了对宏观金融变量确定的进一步见解。 3数据 本节概述了我们用于因变量的危机数据。我们描述了用于危机识别和预测的自变量,包括文本数据、市场数据和信用数据。 3.1危机的数据 虽然我