金融工程 专题报告 基于特征显著性隐马尔可夫模型的动态资产配置 ——“学海拾珠”系列之二百零二 报告日期:2024-08-28 主要观点: 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 分析师:吴正宇 执业证书号:S0010522090001邮箱:wuzy@hazq.com 本文使用隐马尔可夫模型(HiddenMarkovModels,简称HMMs)构建了一个动态资产配置模型。作者测试了该模型在多种smartbeta策略组合下的表现,结果表明,所得投资组合的风险调整后 收益有所改善。此外,作者还提出了一种基于特征显著性隐马尔可夫模 型(FeatureSaliencyHMM,简称FSHMM)算法的新型smartbeta分配策略,该系统在进行隐马尔可夫模型训练的同时进行特征选择,以提高状态识别的准确性。回到A股市场,HMM大多用于宏观经济周期 的识别,本文的做法值得参考。 基于HMM动态资产配置模型所得投资组合的风险调整后的收益有所改善 相关报告 1.《上市公司的财报电话会议对股价的影响——“学海拾珠”系列之二百零一》 2.《数据挖掘的修正与基金的业绩表现——“学海拾珠”系列之二百》 3.《宏观趋势与因子择时——“学海拾珠”系列之一百九十九》 4.《另类情绪指标与股票市场收益之间的关系——“学海拾珠”系列之一百九十八》 5.《基金在风格层面的情绪择时——“学海拾珠”系列之一百九十七》 6.《宏观环境对价值溢价的影响——“学海拾珠”系列之一百九十六》 7.《盈余公告后的机构共识:信息还是拥挤?——“学海拾珠”系列之一百九十�》 作者证明,通过采用一种基于隐马尔可夫模型的投资组合构建策略,该模型包含两个潜在状态并特定地训练于将要进行配置的资产之上,相较于传统单一状态方法构建的组合而言,能够显著提升投资组合的绩效。进一步的,作者通过计算不同类型的投资组合对此进行了测试。对于收益导向型和平衡型投资组合,这种改进更为显著;而在更注重风险的投资组合中,这种改进则不太明显。 基于FSHMM构建的新型smartbeta配置策略表现更佳 作者使用隐马尔可夫模型算法从一组因子指数中选择相关特征,并将其与使用全部资产训练的HMM进行了比较。两个模型在状态识别上均表现出一致性,而仅使用相关特征训练的模型对经济困境时期的敏感度更高。 作者通过MSCI美国增强因子指数,使用真实、可投资的资产对两个模型进行了测试。与使用全部特征训练的HMM相比,使用经过相关特征训练的FSHMM的信息构建的投资组合表现更佳。 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 正文目录 1引言4 2相关文献5 3理论背景6 3.1隐马尔可夫模型(HMMS)6 3.2FSHMM7 3.3SMARTBETA投资8 4数据9 5动态资产配置系统11 5.1DAA系统11 5.1.1模型选择12 5.1.2系统校准14 5.2具有特征显著性的DAA系统:FS-DAA15 6结果及分析16 6.1交易策略和基准16 6.2DAA系统与基线策略的比较17 6.3基于因子隐马尔可夫模型(FSHMM)的动态资产配置(DAA)系统19 6.4基于MSCI指数的动态资产配置-特征选择系统21 7结论和未来展望23 风险提示:24 图表目录 图表1文章框架4 图表2隐马尔可夫模型7 图表3特征显著性隐马尔可夫模型8 图表4用于构建机制转换框架的代表性因子指数10 图表5数据集描述10 图表6MSCI美国增强因子的累计超额收益11 图表7动态资产配置系统示图12 图表8数据方案12 图表9不同状态数量下的BIC分数的箱线图13 图表10SMARTBETA投资策略中动态资产配置系统校准14 图表111260个投资组合中的一个子集15 图表12嵌入特征选择的DAA系统在SMARTBETA投资中的校准和使用完整示意图16 图表13索提诺比率(SORTINORATIO)箱线图。17 图表14年化收益率与年化波动率关系图和索提诺比率分布图18 图表15使用隐马尔可夫模型(HMMS)构建的投资组合及其基准的平均表现19 图表16针对不同的K值选择的特征图20 图表17相关特征训练的模型的预测状态和状态概率图20 图表18使用具有特征显著性的隐马尔可夫模型的信息构建的投资组合图22 图表19使用因子隐马尔可夫模型(FSHMM)构建的投资组合的绩效指标图23 1引言 图表1文章框架 资料来源:华安证券研究所整理 “Smartbeta”是一个相对较新的术语,近几年来在资产管理领域变得无处不在。Smartbeta背后的金融理论被称为因子投资,自20世纪60年代便已存在,当时人们首次发现因子是股票回报的驱动因素(Agather和Gunthorp,2017)。这些因子回报可能是风险的来源,也可能是提高回报的途径,因此,了解任何额外风险是否能够通过更高的回报得到充分补偿非常重要(Ang,2014)。 主动管理型基金经理通过根据股票的因子暴露来选择股票,可以构建具有特定因子暴露的投资组合,从而利用因子投资来提高投资组合回报或降低风险,具体取决于他们的特定目标。Smartbeta旨在通过采用透明、系统化、基于规则的方法,以较低的成本实现这些目标,与主动管理相比,这种方法能够显著降低成本(Asness,2016)。 尽管长期来看,smartbeta策略表现强劲,但它们往往会在周期波动中经历严重的短期回撤(峰值至谷底的下跌)(Arnott等人,2016)。这些波动可能源于极端宏观经济状况、波动率上升、多个市场之间的相关性增强,以及货币和财政政策响应的不确定性。在本文中,作者通过构建使用隐马尔可夫模型(HiddenMarkovModels,HMMs)的区制转换模型来解决这一问题。隐马尔可夫模型已成为时间序列数据建模的主流技术之一(Baum等人,1970;Rabiner,1989),并广泛应用于语音识别、文本分类和医疗应用等多个领域。作者首先研究如何使用区制转换框架来检测各因子之间的区制,以及这样做是否能为smartbeta策略提供增量。在资产配置的区制转换框架中,普遍的做法是预先指定一个依赖于预测状态的静态决策规 则(Nystrup等人,2017a)。另一种方法是利用推断出的区制参数信息动态优化投资组合。作者遵循第二种方法,利用区制信息构建不同类型的投资组合(更注重收益和更注重风险)。第一步,作者建立一个动态资产配置(DynamicAssetAllocation,DAA)系统,通过区制转换模型构建投资组合,并使用与投资组合分配相同的因子训练HMM,从而对数百种因子组合进行系统分析。作者的研究表明,使用HMM的区制信息比单一区制分配的表现更好,作者发现更注重收益的投资组合的风险调整后收益优于其基准,而更注重风险的投资组合的表现也有所改善。最后,金融领域大多数关于区制转换模型的研究的共同点是,它们要么考虑单个资产,要么考虑一小组资产来构建模型,而资产的选择标准通常来自经验。这是因为HMM的无监督特征选择非常有限,包装方法计算成本高,或者针对HMM的方法很少(Adams&Beling,2017)。在大多数HMM应用中,特征要么是基于专门知识预先选择的,要么完全省略了特征选择。Adams等人(2016)提出的特征显著性隐马尔可夫模型(FeatureSaliencyHiddenMarkovModel,FSHMM)是为HMM开发的少数特征选择算法之一,其中特征选择过程嵌入到HMM的训练中。作者将这种FSHMM纳入作者的动态资产配置系统,带来了两个好处:(1)通过在训练过程中选择特征,作者期望通过选择状态依赖的特征并拒绝状态独立的特征来改善区制识别;(2)它允许在模型中加入许多特征,并让算法决定哪些特征有助于区制识别,从而避免在构建金融周期时需要专门知识。 本文的主要贡献如下: 1.作者利用隐马尔可夫模型(HMM)构建了一个用于区制检测的动态资产配置 (DAA)系统,并使用多种资产组合进行了系统研究,将其表现与单一区制投资组合的同类进行了比较。作者证明,DAA系统的表现始终优于基准; 2.作者通过将特征显著性隐马尔可夫模型(FeatureSaliencyHMM)纳入DAA 系统,扩展了该系统,从而改进了区制识别; 作者使用摩根士丹利资本国际(MSCI)指数对嵌入特征选择的DAA系统进行了实际可投资指数的测试,并证明与使用未进行特征选择的DAA系统构建的策略相比,使用带有特征显著性隐马尔可夫模型(FSHMM)的DAA系统构建的策略在风险调整后收益方面有所改善。 本文的组织结构如下:第2节概述了隐马尔可夫模型在金融领域的先前研究; 第3节介绍了隐马尔可夫模型和特征显著性隐马尔可夫模型;第4节描述了数据和 指数构建;第5节介绍了动态分配系统、特征显著性算法及其在动态资产配置系统中的应用;第6节展示了DAA系统的回测结果以及嵌入特征选择的应用。最后,作者使用可投资资产对带有特征选择的DAA系统进行了测试;第7节为结论和后续展望。 2相关文献 在金融领域,自Hamilton(1989)提出使用区制转换模型通过国民生产总值 (GNP)系列来识别经济周期以来,隐马尔可夫模型(HMMs)已被广泛用于建立基于区制的模型。正如Ang和Timmermann(2012)所指出的,HMMs可以同时捕捉金融收益序列的多个特征,如时变相关性、偏度和峰度,即使在底层模型未知的过程中也能提供良好的近似(Ang和Bekaert,2003;Bulla等人,2011;Bulla和Bulla,2006;Nystrup等人,2015,2017b)。此外,HMMs的结果具有良好的可解释性,因为从区制的角度思考是金融领域的自然方法。动态资产配置的例子包括Reus和 Mulvey(2016),他们使用HMM构建了一个使用货币期货的动态投资组合,以及Bae等人(2014),他们使用HMM来识别不同资产类别的市场区制,区制信息有助于投资组合在左尾事件中避免风险。 Guidolin(2012)对马尔可夫转换模型在实证金融中的应用进行了广泛回顾,涵盖了股票收益、无违约利率的期限结构、汇率以及股票和债券收益的联合过程。在资产配置之外,HMMs还被用于捕捉能源价格动态(Dias和Ramos,2014),构建信用风险系统,例如Petropoulos等人(2016)使用学生t分布的HMM构建了一个信用评级系统,解决了当前系统的两个问题:其重尾的实际分布和其时间序列性质;Elliott等人(2014)使用双重隐马尔可夫模型构建了一个模型,以提取关于公司真实信用质量的信息。Dabrowski等人(2016)研究了HMMs和其他贝叶斯网络,以构建检测系统性银行危机的预警系统,并发现贝叶斯方法在预警方面的性能优于传统的信号提取逻辑模型;Zhou和Mamon(2012)研究了三种流行的短期利率模型,并将其扩展为使用有限状态马尔可夫链来捕捉经济区制的转换。 到目前为止,关于区制转换模型对因子投资的影响的研究还很少。其中,Guidolin和Timmermann(2008)发现了规模和价值因子中存在四个经济区制的证据,这些区制捕捉了平均收益、波动率和收益相关性的时变特征。Liu等人(2011)和Ma等人(2011)使用六因子模型来研究时变风险溢价,以解释行业交易所交易基金(ETF)的收益。在他们的研究中,测试时间较短(9个月),并且没有考虑交易成本。 3理论背景 3.1隐马尔可夫模型(HMMS) 隐马尔可夫模型(HiddenMarkovModels,HMMs)是一种序列模型,它假设存在一个潜在的隐藏过程,这个过程可以通过马尔可夫链来建模。同时,它还假设有一系列观察到的数据,这些数据是这个潜在过程的一种有噪声的表现(Murphy,2012)。简单来说,HMMs就是通过观察到的数据序列来推断出隐藏的马尔可夫过程的一种模型。 给定观测数据序列σ=[y1,...,yt],其中每个x