金融与经济学讨论系列 美国联邦储备委员会,华盛顿特区,ISSN19362854(印刷版)ISSN2767389 8(在线版) 光谱回溯测试,无界限和折叠 迈克尔B戈迪和亚历山大J麦克尼尔 2024060 请引用此论文为:GordyMichaelB和AlexanderJMcNeil2024“Spectralbacktestsunboundedandfolded”FinanceandEconomicsDiscussionSeries2024060华盛顿:美联储理事会,httpsdoiorg1017016FEDS2024060 注意:金融与经济讨论系列(FEDS)中的员工工作论文是初步材料,旨在促进讨论和批评性评论。所提出的分析和结论是作者的观点,并不代表研究团队成员或联邦储备委员会其他成员的同意。出版物中对金融与经济讨论系列(除致谢外)的引用应征得作者(们)同意,以保护这些论文的试探性特征。 光谱回溯测试,无界限和折叠 迈克尔B戈迪 联邦储备委员会,华盛顿特区 亚历山大J麦克尼尔商学院与社会学院,约克大学 2024年7月15日 摘要 在Gordy和McNeil(2020)的频谱回测框架中,使用单位区间上的概率测度来加权验证预测模型时最感兴趣的分位数,使用概率积分变换(PIT)数据进行。我们扩展了这一框架,允许使用具有无界分布函数的广义LebesgueStieltjes核测度,这为频谱类别引入了基于截断位置尺度族的新测试。此外,通过考虑PIT值的均匀分布保持变换,测试框架被推广,允许针对预测分布的尾部进行测试。 JEL代码:C52;G21;G32 关键词回测;波动性;风险管理 此处所表达的意见均属个人观点,不代表董事会或其员工之见解。请将回复寄至亚历山大J麦尼尔,约克大学,alexandermcneilyorkacuk。 1引言 Gordy和McNeil(2020)研究了用于预测分布的回测类,其中测试统计量依赖于分位数超过指示函数的频谱变换。频谱变换使用核度量表征分位数超过事件,该核度量由验证者选择以反映验证者对模型性能的优先级。本文在两个方向上扩展了原始处理。首先,Gordy和McNeil(2020)将核度量限制在概率测度类中,而在本文中,我们允许核度量无界,但需满足可积性条件。我们表明,无界核比Gordy和McNeil(2020)研究的基于有界核的测试更有力。其次,我们引入了一种通过折叠变换对数据进行预处理的方法,这种方法不会改变回测的规模,但增加了其对实践中极其常见的预测波动性误设的抵抗力。 我们的对光谱回溯测试框架的扩展与任何验证练习都密切相关,在这些练习中,对预测分布中一个或两个尾部性能的特殊关注。我们的研究动机来自于大型银行交易操作资本监管的近期发展。根据当前的巴塞尔III规则(巴塞尔银行监管委员会,2019年),银行交易账簿的最低资本要求由银行自行报告的每日预期损失(ES)决定。 1 975置信水平。ES(预期损失)的采用与早期与风险价值(VaR)相关的巴塞尔法规相背离。以99的置信水平。在巴塞尔III中,监管者在通过回溯测试验证银行模型方面的作用保持不变。为此,美国各银行在每交易日向监管机构报告前一天预测分布中与实现收益和损失(PL)相关的概率,即与实现PL相关的概率积分变换(PIT) 。观察PIT值等同于观察VaR超出值在每一个级别01除了Gordy和McNeil202 0的研究外,Lynch等人(2023)也对银行报告的PIT数据进行了研究。 andIercosanetal2023 在基于VaR的监管机制下,监管者会对在置信水平附近一定范围内的模型性能进行测试特别感兴趣。因此,Gordy和McNeil(2020)通过在窗口中放置质量来展示他们的方法核。与01、例如,09850995在这样的环境下,只有有限 1212 度量产生有限的检验统计量,由于我们的检验统计量对窗口的度量不变,为了不失一般性,我们可以将注意力限制在概率度量上。因为ES是超过某个阈值水平的VaR的积分,在新的制度下考虑在每一个点加权的连续核是自然的。在某个阈值以上,例如,0975 1 在巴塞尔背景下。在此环境下,即使是未受限制的测量方法也可以保证产生有效的检验统计量。此外,由于银行模型倾向于在极端市场事件下崩溃,而未受限制的测量方法对这类尾部事件的影响最为显著,我们预计未受限制的测量方法将提供更有效的检验。我们在模拟实验中证实了这一直觉,并进一步表明,这种功效并不会以规模扭曲为代价。 关于回测预期损失的议题引发了一场关于预期损失(ES)是否适合回测的激烈辩论(Gneiting2011;Acerbi和Szkely2014;Fissler等,2016;Acerbi和Szkely2023)。越来越多的文献,包括Patton等(2019)和Barendse等(2023),采用可诱发理论来开发VaR和ES的联合回测。对于监管用途,这种方法通常要求银行提交VaR和ES估计的时间序列,尽管Bayer和Dimitriadis(2022)最近的一篇论文提出了一种仅获取ES估计测试的解决方案,但这可能以某些模型误设为代价。 与我们框架相关的问题是,我们避免了关于ES(期望shortfall)等风险度量估计的后测试问题,因为我们测试的是预测分布从其中估计风险度量,而不是估计本身。可以指出,最近的一些论文提出了基于PIT的方法来对预期损失进行回溯测试,特别是利用了累计违规过程OfDuandEscanciano2017whichcanbeviewedasa 特定的光谱变换选择。这包括Du等人(2023),他们提出了一种改进的条件ES回溯测试,Hoga和Demetrescu(2023),他们提出了ES预测的实时监控程序,以及Hu等人 (2024),他们使用正交多项式联合检验累积违反过程的矩条件和VaR超过之间的持续时间过程。 即使监管者只对PIT分布的上尾部感兴趣,通常情况下,在上尾部被错误指定的模型也可能在底部尾部被类似地错误指定。例如,在一个风险管理环境中,未能捕捉到金融回报分布中的随机波动性,会导致对极端收益和极端损失的估计不足。Berkowitz等人(2011年)以及O’Brien和Szerszen(2017年)通过显示,简单GARCH模型在拟合银行损益时通常优于银行内部模型,提供了在银行环境中被忽视的随机波动的证据。用观察到的PIT值来表示,这样的错误指定会导致中等PIT值过少,而低和高PIT值过多。因此,即使监管者只关心大规模损失,一个对PIT分布下尾部不分配权重的核函数未能捕捉到可能与检测上尾部错误指定相关的数据。我们展示了监管者如何通过我们描述的操作预处理PIT值 。 折叠因此,原始PIT分布的左、右尾值被映射到预处理分布的上尾,而不会改变在零假设下的检验统计量的分布。 一个合适的预处理器的一个简单例子将应用V型映射。Tu 12您提供的内容为“u”,这并不包含可翻译的文本信息。因此,我无法进行翻译,将保持原文内容:至于PIT值。在此映射下,如果一个预处理过的PIT值位于上尾端的事件,T(PIT)v,1,等价于PIT位于两个尾部区间的并集中。PIT01负号()和字母“v”21v21它很容易看出,如果PIT实际上均匀分布 (如根据回测的零假设),那么转换后的PIT也将均匀分布。线性对称映射 Tu12您提供的内容为“u”,这并不包含可翻译的文本信息。因此,我无法进行翻译,将保持原文内容:这仅是保持均匀分布的非常广泛类别中的一个单一示例。 udp转型。经验文献的一个普遍发现是,市场收益率的分布是非对称的,即大损失的尾部比大收益的尾部更厚,这一现象导致了对称GARCHtype模型的产生,该模型包含杠杆效应和非对称的创新分布,包括AGARCH(Engle1990)、EGARCH(Nelson1991)和GJRGARCH(Glosten等人,1993)。我们证明了udp类中的不对称成员可以被选择用来突出模型的偏度以及峰度。 在第二章中,我们将Gordy和McNeil(2020)的回测框架扩展到允许无界核和udp折叠变换。一个关键结果证明了折叠不是多余的,即预处理可以产生无法通过其他方式获得的回测。在第三章中,我们引入了两类新型的无界核。蒙特卡洛模拟表明,这些核提供的回测大小适中且对未建模的峰度高度敏感。第四章中,我们介绍了一组节省但灵活的V形预处理器。蒙特卡洛模拟展示了预处理如何进一步突出未建模的峰度。预处理器在存在未建模偏度的条件下也能有效。然而,在没有显著的过剩峰度的情况下,一个选择不当的预处理器可能会掩盖而不是增强模型误指定的特征。第五章提供了在实际环境中实施指导。 2扩展光谱回测 21回测设置 我们假设预测者对投资组合损失建立模型(L在滤波概率空间上) t ,F,F)其中F代表预报者在时间点可用的信息t ttPt N0 0对于任何时间损失表示非零自然数。t N1 01NLtN这是N利润表(PL)的负值,因此与大损失相关的通常是分布的右侧尾部。 LisanF可测的随机变量,其条件分布函数(df)由以下给出 tt FxLxF tPt t1 至()中的序列依赖L以及随着时间推移投资组合构成的变动。 t在时t预报员建立了一个模型FBofF基于信息FPIT ttt1 值是随机变量(P通过设定获得(PFbL如果模型Fb形成 ttttt 序列的理想概率预测,在Gneiting等人(2007年)的意义上,即与条件规律相符。F的L对于每个t然后罗森布拉特(1952)的研究结果暗示 tt 该过程(P是独立同分布标准均匀变量序列。PIT值包含 t 关于任何水平上分位数估计超出情况的信息u如果VaRdF bu utt 表示对hatepsilon的估计u分位数F使用广义逆矩阵计算Fbat tt 概率水平u,然后PuLVaR(ValueatRisk) td t我们采取外部模型验证者的立场,例如监管机构,该机构使用PIT值(P作出关于预 测ut方法质量的决定。对于 t 本文的目的是,我们假设验证者只能访问这些PIT值,尽管这种限制可以大大放宽。关键在于验证者并未观察到整个分布。Fb,这反映了大多数监管现状的现实 t 各国政府。此外,为了简洁起见,我们仅考虑无条件的覆盖检验。无界测量和折叠预处理器的应用将无需困难地适用于Gordy和McNeil(2020)所描述的条件覆盖检验。 22光谱回溯测试 模型验证器采用形式为PIT值的光谱变换。 Z W1d无效字符。u tTPu t 我 1 其中(i)无效字符。这是一种称为勒贝格斯蒂尔吉斯测度的测度内核测度并且(ii )T我I 这是一个均匀分布保持(udp)变换如果UU01是一个标准均匀随机变量 。T一个UDP转型,然后TUU01在整个期间 论文中,I表示单位区间01。 在Gordy和McNeil(2020)的研究中,该衡量指标无效字符。被限制为一种概率测度 ,并进行了转换T它仅仅是身份转型Tvv这种设置适合关注预测分布的右侧尾部。通过观察PIT超过水平的超限值u并且使用概率测度无效字符。选择并权衡感兴趣级别的权重。u在单元区间的上限处,推导出了一组对预报模型规格在右侧量级范围内敏感的测试统计量。 任何勒贝格斯蒂尔吉斯测度无效字符。在域上我存在一个与之相关的增函数,该函数是右连续的。G被称为分布函数(df),即无效字符。0u 无效字符。 Gu它容易看出1等同于封闭形式的表达式 无效字符。 W0TPGTPttt 2 这表明W正在增加在TP请注意,我们在广义上使用df。 tt 自G这是一个概率dfonlyiflimGu1为简化演示,我们将 无效字符。u1无效字符。 因此,对以下温和的规范性条件进行实施:无效字符。 假设1。G具有最多有限个间断点,否则绝对 无效字符。 持续。 单变量转换自然扩展到多变量情况,其中一组不同的核测度应用于PIT值以获得向量值 1m 变量WW在哪里 1n WWWW无效字符。0,TPGTP ,j1,,,m tt1