您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[美联储]:有限状态马尔可夫链逼近:一种隐马尔可夫方法(英) - 发现报告
当前位置:首页/其他报告/报告详情/

有限状态马尔可夫链逼近:一种隐马尔可夫方法(英)

2023-06-15-美联储℡***
有限状态马尔可夫链逼近:一种隐马尔可夫方法(英)

财经系列讨论 联邦储备委员会,华盛顿特区,ISSN1936-2854(打印) ISSN2767-3898(在线) 有限状态马尔可夫链逼近:一种隐马尔可夫方法 Janssens,EvaF.和McCrary,Sean 2023-040 请引用本文为: Janssens,EvaF.和McCrary,Sean(2023)。“有限状态马尔可夫链逼近:隐马尔可夫方法”,《金融与经济讨论》2023-040。华盛顿:联邦储备系统理事会,https://doi.org/10.17016/FEDS.2023.040。 注意:金融和经济讨论系列(FEDS)中的员工工作文件是为激发讨论和评论而分发的初步材料。提出的分析和结论是作者的分析和结论,并不表示其他研究人员或理事会成员的同意。在出版物中引用的金融和经济讨论系列(除了承认)应清除与作者(S),以保护这些论文的暂定性质。 有限状态马尔可夫链逼近:一种隐马尔可夫方法 EvaF.Janssens†SeanMcCrary‡2023年5 月19日 Abstract 本文提出了一种新的具有连续支持的马尔可夫过程的有限状态马尔可夫链逼近方法,提供了最优网格和转移概率矩阵。该方法可用于多变量过程以及非平稳过程,例如具有生命周期组件的过程。该方法基于最小化隐马尔可夫模型和真实数据生成过程之间的信息损失。我们提供了足够的条件,如果使用足够的网格点,则可以使信息损失任意小。我们通过资产定价模型和生命周期消费储蓄模型将我们的方法与现有方法进行了比较。我们发现我们的方法会导致更简约的离散化和更准确的解决方案,并且离散化对于风险的福利成本,边际消费倾向以及生命周期模型可以产生的财富不平等程度很重要。 关键词:数值方法,Kullback-Leibler发散,错误指定模型,收益过程 JEL分类代码:C63、C68、D15、E21 *免责声明:本文所表达的观点完全是作者的责任,不应被解释为反映了联邦储备系统理事会的观点。 *致谢:两位作者都感谢José-VíctorRíos-Rll,FraKleiberge,ChristiaStolteberg,RobiLmsdaie以及苏黎世大学的研讨会和会议参与者的宝贵评论,阿姆斯特丹大学,密歇根大学,休斯敦大学,牛津大学,联邦储备委员会,EEA/ESEM2022,CEF2022,CFE2022和NBERSI2022,尤其是JesúsFerádez-Villaverde,FraSchorfheide,BoraäaAroba,MielPlagborg-Mller,MichaelWolf,DamiaKozrBishJasses感谢荷兰研究委员会的NWO研究人才资助,项目编号406.18.514和ErasmsTrstfods的2018年布鲁因斯教授奖,为撰写本文的宾夕法尼亚大学的研究访问以及FraSchorfheide主持这次访问。我们感谢计算经济学学会颁发CEF2022学生奖。任何错误都是我们自己的。 联系方式: †EvaF.Janssens:联邦储备系统理事会经济学家,电子邮件:eva.f.janssens@frb.gov ‡SeanMcCrary:宾夕法尼亚大学博士生,电子邮件:smccrary@sas.upen.edu 1Introduction 求解非线性动态随机模型的数值方法通常依赖于连续随机过程的有限状态马尔可夫链逼近。随机过程是这些模型的重要输入,因此其有限状态马尔可夫链逼近应尽可能接近连续过程。本文提出了一种新颖的全信息方法,可用于连续马尔可夫过程的离散化。我们表明,我们的方法可以为资产定价模型提供更准确的解决方案,并且可以更好地表征具有非线性非高斯收益过程的生命周期消费储蓄模型中的收益风险。 通过离散的马尔可夫过程逼近连续的随机过程,其特征在于支持点网格和转移概率矩阵,本质上归结为选择错误的近似模型。因此,我们借鉴了错误指定的模型文献,提出了一种有限状态马尔可夫链逼近方法,该方法可以最大程度地减少错误指定过程和真实连续过程之间的信息损失。我们假设错误指定的过程是隐马尔可夫模型(HMM),即每个实现都等于状态相关级别(网格点)和误差项的总和。该状态是不可观察的,并且不可观察状态的演化由离散的一阶马尔可夫过程(具有转移概率矩阵)支配。这通过连续测量误差有效地将离散马尔可夫链嵌入到连续支持过程中。这使我们可以使用两个过程之间的标准Kllbac-Leibler(KL)差异作为信息损失的度量。 因此,我们方法的实际实现很简单,因为在这种情况下,最小化KL发散本质上是准最大似然估计,从而在连续支持过程中模拟的数据上拟合HMM。1我们的方法有吸引力的是,它可以产生最优网格和转移概率矩阵,并且可以应用于多变量过程,在这种情况下,最优网格通过考虑变量之间的依赖关系来帮助限制张量网格提出的维度曲线问题。 我们的理论贡献是证明,在一些假设下,随着未观察到的状态(从而网格点)的数量变大,信息损失之间的 1如Mevel和Finesso(2004)以及后来的Douc和Moulines(2012)所示,错误指定的HMM的最大似然估计是一致的 ,从某种意义上说,它最小化了模型与真实过程之间的KL差异。 错误指定的HMM和真正的连续随机过程变得任意小。这将我们的论文与关于通用逼近器的文献联系起来 ,其中我们建立在Zeevi和Meir(1997)关于(高斯)混合物的结果上,并将其扩展到非i.i.d。HMM的设置。2我们的证明提供了对过程的哪些属性决定了需要多少网格点来获得特定信息损失的见解。例如,更持久的过程需要更多的网格点,这就是为什么高度持久过程的有限状态马尔可夫链近似往往不太准确的原因。3 我们评估了我们的方法在两个经济应用中的性能:资产定价模型和生命周期消耗节约模型。首先,在我们的资产定价模型中,我们离散化股息增长,假设股息增长遵循具有随机波动率的自回归(AR(1))过程,如Basal和Yaro(2004)中的参数化。如DeGroot(2015)所示,该模型具有封闭形式的解决方案。我们使用此解决方案作为基准,将我们的方法的性能与文献中的标准进行比较,发现我们的离散化更好地捕获了真实连续过程的高阶矩,更简约,并导致更准确的模型解决方案。例如,我们分析了这些离散化方法对确定性等效消费水平(CE)的估计的准确性,发现我们的方法与DeGroot(2015)的封闭形式解的偏差为0.8-1.9%,而比较方法的偏差范围为4%至12%。这些结果突出了全信息方法的强度 ,因为对于诸如CE之类的非线性对象,随机过程的所有信息都很重要。 其次,我们通过生命周期消耗节约模型的镜头来分析我们方法的性能。在此应用程序中,我们专注于具有生命周期依赖性的两个过程;Gvee,Karaha,Oza和Sog(2021)中提出的过程,具有非就业冲击和正偏度的创新 ,以及Arellao,Bldell和Bohomme(2017)中的非参数过程。这些过程被认为是收益动态文献的前沿(Altoji,Hysjö和Vidagos,2022)。我们的离散化更好地捕获了Gvee等人的过度偏度和峰度。(2021)和Arellao等人。(2017)过程比常用的基于分箱的离散化方法。4具体而言,对于Guvenen等人(2021)的过程,分级方法未能捕捉到非就业的长期动态。 2通用逼近器属性也已被证明适用于神经网络,但就我们所知,也仅适用于i.i.d.设置,例如,参见Hornik,Stinchcombe和White(1989)的开创性工作。 3如Flodén(2008),Kopecky和Suen(2010)以及Galindev和Lkhagvasuren(2010)中所述。 4这些分级方法改编自Adda和Cooper(2003)的教科书处理。 在生命周期模型中,我们发现离散化方法对各种经济利益量都很重要,包括风险的福利成本,财富不平等度量和边际消费倾向(MPC)。Byfailtofllycaptretheextrartosisadsewessoftheprocessesoverthelife-cycle,biig-basedmethodsderstadtheway-farecostofrisadtheamotofpredictioarysavigitheecoomy.对于Gvee等人。(2021)过程中,基于分级的方法相对于我们的方法将风险的福利成本低估了23个百分点,对于Arellao等人。(2017)过程中,差异为3个百分点。离散度也关系到生命周期模型可以产生的财富不平等程度。虽然已知生命周期模型难以匹配数据中的财富分布(DeNardi和Fella,2017) ,但我们表明,更准确的收益过程离散化可以产生更多的财富不平等。我们对Arellao等人的离散化。(2017)过程产生的财富基尼系数为0.76,接近美国(0.77-0.78),而分级结果的值低0.06。同样,我们的离散化导致前1%的财富份额接近数据,而基于分账的估计低估了这一时刻。 我们关于生命周期模型解决方案的离散化方法的重要性的结果扩展到更简单的过程。对于高斯AR(1)和混合AR(1),我们表明离散化方法之间的生命周期模型解决方案存在显着差异,尽管当使用足够多的网格点时,差异确实会变小。这是一个重要的见解,因为文献倾向于用于这些过程的网格点数量很少。另一方面,我们的解决方案在添加更多网格点时几乎没有变化,因为我们的方法比其他离散化方法更简单 ,并且捕获了更多真实过程的信息。对于这些过程,生命周期中边际消费倾向的敏感性突出。当使用少量网格点时,其他离散化方法可能会低估年轻年龄组的MPC多达20个百分点。 最后,我们比较了不同随机过程的生命周期含义。据我们所知,这篇论文是第一篇离散化Gvee等人的论文。(2021)在不完全市场模型中处理并评估其含义。此外,代表Arellao等人。(2017)和Gvee等人。(2021)作为离散马尔可夫链的过程允许两个过程之间的一致比较。我们在Gvee等人中找到了最大的风险来源。(2021)过程来自非就业的可能性,这是一个高度持续的状态,在整个生命周期中持续不断。相比之下,Arellao等人的风险最大。(2017)过程来自最高收益状态,其特征是下期收益损失的可能性很大,特别是在年轻年龄,创造了强大的预防性储蓄。 模型中高收入者的动机。收益过程之间的这些差异导致我们的生命周期模型中的不同动态。Gvee等人的非就业风险。(2021)过程为MPC生成了一个比Arellao等人更平坦的生命周期曲线。(2017)过程,并且在更高的福利风险成本(0.69而不是Arellao等人的模型中的0.19。(2017))。Arellao等人。(2017)过程具有更多的收入不平等,因此比Gvee等人更适合财富分配。(2021年)过程。 本文的内容如下。下一小节讨论相关文献。第二节讨论了我们的离散化方法和理论贡献。第三部分介绍了具有随机波动率的资产定价模型。第4节讨论生命周期模型的应用。第五节结束。附录A提供了我们的主要定理的证明。附录B提供了HMM估计的详细信息。附录C提供了向量自回归过程离散化的附加应用。 相关文献已经提出了几种方法来离散随机过程。其中大多数,例如Tache(1986),Rowehorst(1995 ),Tache和Hssey(1991),Da和Simoato(2001),Terry和KoteII(2011)以及Gospodiov和Lhagvasre(2014),是为特定的(线性)过程而设计的,例如AR(1)或VAR过程。Fella,Gallipoli和Pa(2019)将Rowehorst(1995),Tache和Hssey(1991)以及Adda和Cooper(2003)的方法应用于具有生命周期组成部分的过程,并分析其在创新是从法线混合中提取的设置下的表现 。Galidev和Lhagvasre(2010)使Rowehorst(1995)适应具有高度持续相关AR(1)冲击的环境。Cival