了解和预测系统 企业困境:A 机器学习方法 BurcuHacibedel和RitongQuWP/22/153 基金组织工作文件描述研究进展中由作者(S)和出版以引起评论并鼓励辩论。 基金组织工作文件中表达的观点是作者(S),并不一定代表 基金组织、其执董会或基金组织的观点管理。 2022 七月 ©2022国际货币基金组织WP/22/153 基金组织工作文件战略、政策和审查部 由BurcuHacibedel和RitongQu编写* 理解和预测系统性企业困境:一种机器学习方法 MartinCihak和DariaZakharova授权分发 2022年7月 基金组织工作论文描述作者正在进行的研究,并公开发表以引出评论并鼓励辩论。基金组织工作文件中表达的观点是 作者并不一定代表基金组织、其执董会或基金组织管理层的观点。 抽象的: 在本文中,我们使用公司层面的违约概率研究系统性非金融公司部门困境(PD),涵盖55个经济体,跨越过去30年。系统性企业困境由一个经济体中大部分公司的PD升高。基于机器学习的预警 系统的构建是为了预测一年内遇险的发作。我们的结果表明,信贷扩张,货币政策收紧、股价高估和与债务相关的资产负债表弱点预示着 企业困境。我们还发现,系统性企业困境事件与 发达和新兴市场的GDP和信贷增长在不同程度上比金融危机温和。 JEL分类号: C40、E44、G01、G17、G21、G33 关键词: 非金融部门;违约概率;预警系统; 粗心大意的政策 作者的E-邮件地址: bhacibedel@imf.org,rqu@imf.org *本文所表达的观点是作者的观点,并不一定代表作者的观点 基金组织、其执董会或基金组织管理层。我们要感谢BrunoAlbuquerque,JorgeAntonio Chan-Lau、SophiaChen、SalihFendoglu、MarcoGross、WeiningXing和国际货币基金组织的研讨会参与者有用的评论;ChuqiaoBi、RuofeiHu、RoshanIyer和JoseMarzluf提供了出色的研究协助。 特别感谢BrunoAlbuquerque帮助我们了解Compustatdata。所有的错误都是我们自己的。 内容 1介绍3 2数据5 2.1建设经济层面PD指数.................6 2.2预测器的系统性的公司的遇险...............7 3识别公司的部门遇险8 3.1一个马尔可夫切换模型为了PD指数...............9 3.2模型估计和时期的高的公司的部门遇险10 4一个预先警告系统为了公司的遇险11 4.1 模型组合............................ 12 4.2 H块交叉验证......................... 13 4.3 模型表现............................ 14 4.4 口译模型预测和沙普利价值观16 4.4.1一个应用:公司的遇险风险指数为了新兴 市场18 5宏观经济影响的系统性的公司的遇险:最初的 发现19 6结论21 表和数字25 附录一个MCMC算法至确认公司的遇险 39 附录乙建设预测器从计算机统计全球的 40 附录C机器学习楷模和超参数选择41 C.1物流回归和正则化41C.2随机的森林.............................. 41 C.3 支持向量机器......................... 42 C.4 线性判别式分析...................... 43 C.5 极端坡度提升树44 1介绍 这冠状病毒病危机和结果漏洞带来这公司的部门至这前面-正面的政策辩论。许多政府支持的公司通过货币, 财政和财务政策这样的作为低的兴趣费率,赠款,和债务暂停。公司是未来出去的这大流行和更高债务,降低盈利能力, 较弱平衡床单和降低现金缓冲区(国际货币基金组织,2021在这后covid时期,这退出的支持措施可以增加这风险的公司的苦恼,宝- 潜在地领导至系统性的危机。在这个语境,这能力至预测公司的苦恼和理解它的宏观经济结果是钥匙。及时检测的 这来源的公司的脆弱性超过一般的负债启用一个更多的有针对性政策选择。 这个纸目标至提供一个早期的警告系统至预报公司的苦恼 事件至通知及时政策制造。我们首先确认这些事件使用一个小说措施和定义基于上企业级概率的默认(PD)覆盖这 最后的三几十年1995:2021.我们的新的措施允许我们至拿一个更深看在如何这公司的部门和经济的指标表现前公司的苦恼。 我们建造一个合奏的机器学习楷模绘画上一个放的宏观经济和资产负债表变量至预测这发作的系统性的公司的苦恼超过 一个四季度地平线。相当比选择这最好的模型在一个马种族,我们 拿一个不可知论者看法那没有任何的每个个人模型是这真的模型,和尝试至近似这真的模型使用这组合的个人楷模(格维克 和天野,2011我们的模型不是只要预测这接近苦恼,但还优惠提示关于这来源的公司的脆弱性。我们的结果节目那虚弱的平衡床单和全球的财务条件玩一个大的角色在预测公司的苦恼。这些暗示至这重要性的及时利用的货币和宏观审慎政策。 那里是一些挑战至经验学习的公司的苦恼。现存的 文学缺乏一个持续的定义的公司的危机或者苦恼。尽管这些二条款是可互换,我们将要利用这学期“公司的苦恼”在这余 的这个纸。这缺少的越野和纵数据上公司的苦恼 还使它难的至分析原因和后果的系统性的非财务公司的 部门苦恼。现存的学习是大多单一国家或者单一危机插曲 专注这样的作为日本在这1990年代(卡巴列罗等等,2008欧洲在这2010年代 (斯基瓦尔第等等,2022阿查里亚等等,2020我们(吉赛克等等,2014和这问题的公司的危机有不是到过研究过在一个长跑越野环境所以远的。 和我们的新的定义,我们是有能力的至克服这个路障。其他重大的挑战是这交织在一起自然的公司的苦恼和其他经济的危机。 它是难的至找到一个公司的苦恼例子那是不是先于或者做不是重叠 和危机的其他自然这样的作为银行业,主权的债务,和货币危机。在我们的纸,我们还建议方法至克服这个困难,和执行稳健性 测试因此。一警告的我们的数据是那它盖子列出企业只要。公司的苦恼有到过大多链接的至信用繁荣和增加杠杆- 年龄(若尔达`等等,2020穆勒和维纳,2021连和嘛,2021)与显着宏观经济和微观经济影响。尽管那里是一些共识上 这相对地良性影响的信用苦恼上这经济比较的至财务 危机(吉赛克等等,2014这类型的信用很重要。信用繁荣驱动的经过公司的和经过家庭影响这经济不同。家庭信用驱动的 繁荣有到过显示至有更多的显着和长持久影响上国内生产总值生长(若尔阿等等,2013勉等等,2017这潜在的信用和信用dy-动力学事情为了这宏影响。学习聚焦上这微观经济动力学 和影响重点上这债务悬垂和僵尸化那跟随信用繁荣 领导至降低投资经过企业(安德鲁斯和彼得罗拉基斯,2019古林查斯等等,2020阿尔伯克基,2021 至措施公司的苦恼,现存的学习利用定义基于上企业 速度信用生长(若尔阿等等,2020实际的默认值(吉赛克等等,2014和到破产的距离(阿特克森等等,2017)与最多在单一国家设置。至 我们的知识,我们是这首先纸至利用一个默认可能性基于措施。这基于模型PD用途资产负债表变量,宏因素和违约距离 (默顿,1974作为预测器。因此,这PD是一个综合的和及时措施的一个公司的困难在手术,流动性,和投资者的洞察力的它的潜在的风险。我们的PD数据集未来从公司的研究倡议的国家的大学- 地点的新加坡盖子更多的比60,000公开的列出企业从88经济体。我们构造经济层面PD指数经过资本加权平均的企业级 PD。时期的系统性的公司的部门苦恼是表征经过坚持不懈 高架PD指数和确定经过一个马尔科夫体制转换模型(汉密尔顿, 1989我们找到那经济体有经验的公司的苦恼18百分的这时间 上平均超过1995:2021.许多,但不是全部公司的苦恼事件,重叠和 记录在案金融,主权的债务和货币危机。尤其,我们观察一个海浪的公司的苦恼在许多经济体期间这早期的2000年代那重合和这互联网气泡,哪个不能是归因于至其他类型的危机。 我们的纸贡献至这现存的文学在一些领域。第一的,我们提出一个新的定义为了公司的苦恼和提供一个小说数据库的公司的苦恼事件覆盖这最后的三几十年和55先进的和新兴市场。 经济体有经验的公司的苦恼18百分的这时间上平均超过1995:2021.然而,不是全部公司的苦恼事件带领至系统性的财务危机。第二,我们找到那系统性的公司的苦恼有影响为了国内生产总值和信用 生长。我们的结果节目那大约公司的苦恼,国内生产总值生长减慢下 在两个都不良事件和新兴市场尽管信用生长减慢下显着地只要在新兴市场。第三,我们构造一个机器学习基于模型至预报系统性的公司的 苦恼和一个预报地平线的4宿舍。这个允许我们至确认指标那信号增加风险的危机。在添加至过热在信用市场,这 模型归因分析节目那资金费用,平衡床单漏洞和市场高估是还内容丰富关于未来公司的危机。 这休息的这纸是结构化的作为如下:部分2礼物这数据和德-脚本的统计数据。部分3定义和标识公司的苦恼事件。部分4 解释这机器学习基于早期的警告模型和检查这前体 的系统性的公司的苦恼。部分5分析这当代的宏观经济影响的公司的苦恼。部分6重点上这政策影响和CON-包括。 2数据 我们构造我们的数据聚焦上二团体:经济层面PD指数和一个放的变量那能够预测系统性的公司的苦恼。PD数据帮助我们构造一个小说危机系列至克服这缺少的一个基础广泛的定义的系统性的企业速度苦恼。然后,我们选择预测器变量至代理人为了四团体的指标密切链接的至公司的苦恼:企业级平衡床单变量,国际的 宏变量,国内的宏变量和财务市场估值变量。 尽管我们开始和一个较大放的变量,我们排除一个数字的这些尽管 建造向上我们的模型如果不是意义重大。一次我们有这危机/困境日期,我们是有能力的至查看为了这信令力量的这预测器变量。 2.1建设经济层面PD指数 这季刊PD数据是获得从这信用研究倡议数据库的 这国家的大学的新加坡(新加坡国立大学-CRIPD,今后)1.这可能性的一个公司违约上它的债务封装这公司的困难在手术,它的 流动性和投资者的洞察力的它的潜在的风险。因此,这可能性的 默认(PD)是一个易于代理人为了公司的苦恼。PD是衍生的从一个减少形式模型(段等等,2012那画上两个都以市场为基础,这样的作为距离-违约(默顿,1974和以会计为基础企业特定的属性作为出色地作为 宏观金融因素包含这股票返回,现金对资产比率,当前的资产-电流负债比率,净收入对总资产比率,相对的市场帽和 相对的市场对账面比率。模型施行出色地尤其在更短视野, 达到一个准确性比率的80%在12月预测。这数据放盖子这日常的可能性的默认的企业级公司的债券和到期日向上至5年。我们重点上这默认可能性的12个月公司的债券(不包括这财务部门), 我们构造季刊经济层面PD指数使用资本加权平均值 的企业级PD在这结尾的每个四分之一。在这开始的每个年,这公司-等级首都是计算出来的作为这产品的股票价格和常见的分享杰出- ing从计算机统计全球的。这新加坡国立大学研究院PD是匹配的和计算机统计全球的使用伊辛。之中这2,749,611公司季度观察,2,367,880是匹配的 和这公司首都数据。失踪首都价值观是推算和这中位数的 其他公司”首都价值观在这相同的部门,四分之一和从这相同的经济。后这归责,这失踪首都价值观是更远推算和这中位数 的其他公司”首都价值观在这相同的四分之一和从这相同的经济。至 制作当然这指数是不是有偏见的经过任何有限的覆盖范围的企业,我们强加一个最低限度的20企业为了每个经济季观察。桌子1节目这和- 玛丽统计数据的PD指数为了每个经济。后丢弃经济季观察和不足公司覆盖范围,这结果经济层面平均PD 指数盖子61,960企业从88经济体