您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[西南证券]:策略专题:今夕是何年?基于马氏距离定量测算历史对比法对市场的指引效果 - 发现报告
当前位置:首页/宏观策略/报告详情/

策略专题:今夕是何年?基于马氏距离定量测算历史对比法对市场的指引效果

2023-06-19西南证券北***
策略专题:今夕是何年?基于马氏距离定量测算历史对比法对市场的指引效果

摘要 历史不会重复,但往往压着相同的韵脚:市场研究方法论众多,但最基础的其中一个就是历史复盘与比较。无论是宏观环境,还是产业周期趋势,亦或是公司自身的发展,市场参与者总是会不自觉地把目光转向过去,试图从历史样本中找到预判未来的抓手。 但我们很难找到和当前完全相似的历史时刻,因此在面对数个较为“类似”的历史时刻中,究竟更像哪个,需要我们人为赋权,而赋权的过程较为主观;其二则是每个人在具体比对历史时选取的角度是不同的,每个人都可以基于自己的实际感受出发、选取不同的指标来进行比对,最后的结果当然是千人千面、众说纷纭。 马氏距离的底层指标和距离计算:借助马氏距离这种定量化工具,我们试图分别从宏观经济面和市场面两个角度来定量测算当下和历史时刻之间的关系。宏观经济面上,我们选取的底层指标有利率、剩余流动性、股票风险溢价和PMI指数;市场面上,我们选取宽基指数的估值分位数和换手率,以及成分股内部的平均相关系数、宽度和离散度。 识别结果显示,和当下最相似历史宏观场景对应2021年12月,皆对应短期经济环比下滑区间;最相似的市场场景对应2019年,两段时间皆是主题性行情显著。尽管根据马氏距离对宽基指数进行多空并不能获得超额收益,但从宏观经济面识别历史时刻的投资策略能在熊市避免回撤并大幅跑赢市场。 从宏观经济面和市场面马氏距离出发的行业轮动策略:在对行业轮动的指引上,综合宏观经济面和市场面的多头组合在2016年以来跑赢基准,年化超额收益大概在5%左右;但在产业投资兴起的2021年时表现一般,超额收益回吐较多。在2022年下半年开始,随着市场定价因子从产业再度回归宏观,组合超额收益开始企稳并略微回升。 后续随着样本量的提升,模型表现或许会更加趋于稳定,我们也将持续跟踪该模型并对底层指标选择上做出优化。 风险提示:回归模型失效的风险、指标选取不够合理的风险。 1从马氏距离角度探询历史的韵脚 “历史不会重复,但往往压着相同的韵脚”,市场研究方法论众多,但最基础的其中一个就是历史复盘与比较。无论是宏观环境,还是产业周期趋势,亦或是公司自身的发展,市场参与者总是会不自觉地把目光转向过去,试图从历史样本中找到预判未来的抓手。 就拿今年的宏观和市场研究而言,23H1的弱复苏使得大家不由自主得联想到2013年,再配合相似的产业政策出台,传媒时隔十年再度成为流畅的大行情主线,开启猛烈的上涨攻势;而当传媒把过去三年估值填坑完毕后,也同样触发了行情的短暂回调。类似的例子也存在于海外:先前市场普遍认为今年将看到本轮加息周期中的‘Last Hike’,因此基于“历次最后一次加息后的美债走势”的规律分析,做多美债成为广泛化的共识。 图1: 基金经理在今年对弱复苏形成一致预期,和2013年相类似 图2:当传媒行业估值填坑完毕后,均触发短暂回调 而我们发现,尽管市场上的投资者将“类比历史”这一学习效应发挥得淋漓尽致,但在实际操作过程中却存在着两个明显的问题。一是人不可能踏进同一条河流两次,我们很难找到和当前完全相似的历史时刻,因此在面对数个较为“类似”的历史时刻中,究竟更像哪个,需要我们人为赋权,而赋权的过程较为主观;其二则是每个人在具体比对历史时选取的角度是不同的,每个人都可以基于自己的实际感受出发、选取不同的指标来进行比对,最后的结果当然是千人千面、众说纷纭的。 为了更好地解决这一问题,我们尝试着借用数量工具。在多元统计中,“马氏距离”经常被用来描述变量之间的相似性,其原理和欧式距离类似,是一种距离的度量。先从欧式距离说起,假设在一个二维空间中存在两个点( 𝑥1 ,𝑦)和( 𝑥2 ,𝑦),那么可以定义一个𝜌: 𝜌 = √(𝑥− 𝑥)+ (𝑦− 𝑦) 此时ρ就是两点之间的欧式距离,距离越小说明两点越相近。假设我们将 𝑥1 和𝑦、 𝑥2 和𝑦是同一类样本,但实际上如果参照样本分布规律,只有点2才能被归类到样本中去,点1更像是一个离群点。 图3:样本内的分布规律可能使得欧式距离判断失误 所以我们需要考虑到样本点自身特征的分布规律并做标准化。平日里最常见的标准化方法为数值减去其过去自身的均值并除以标准差,得到的新序列即为标准化后的数值。那么经过标准化处理后再计算出来的欧式距离,即为马氏距离(MahalDistance),我们可以定义其为: −𝟏 𝑀𝑎ℎ𝑎𝑙 𝐷𝑖𝑠𝑡𝑎𝑛𝑐𝑒 =(𝑥 − 𝜇) ∑ (𝑥 − 𝜇)′ 实际应用中,马氏距离诞生于自然科学研究——即如何通过某一个颅骨样本的各项尺寸来反推其生前种姓。假设度量颅骨的各个尺寸,那么就可以把多个尺寸数据组合成一个向量,再去计算该向量和不同种姓均值之间的距离,选取距离最短的种姓作为该颅骨主人种姓推测。 −𝟏 其中,x为某一个颅骨的尺寸向量,μ为某一特定种姓的颅骨尺寸均值,骨尺寸协方差矩阵的逆。 ∑ 为特定种姓颅 我们可以将这一工具用到经济与市场分析中来。其思路在于将多个维度的经济信息看成一个向量,那么每一时刻自然就存在着一个向量,我们只要计算当前时刻向量和历史样本之间的距离,就能得到现在和历史的相似程度。举个例子,2023年5月份经济数据已经陆续出炉,如果我们主要从经济景气度和货币信用维度来进行历史比对,那么就存在着一个当前向量和众多历史向量([PMI,社融,M1,DR007]),通过计算马氏距离我们可以得到当前时刻距离历史样本均值的距离,此时只要和历次的马氏距离进行比对,就可以找到和当下较为相似的历史样本,自然也就回答了“今夕是何年”的问题。 2马氏距离的底层指标和距离计算 尽管借助了马氏距离这一数量化工具来评判“今夕是何年”这一问题,但不得不承认主观性这一问题依旧存在。例如我们该纳入哪些方面的信息来计算马氏距离?具体确立后向量中又该包含多少个经济指标?除了宏观经济面外,权益市场能否参照类似的思路,至少能够从内生的结构性特征来类比当前和历史? 事实乃是,底层指标的选取花样百出,千人千面下我们主要围绕西南策略团队在过去一年以来对宏观和市场特征的研究成果中进行指标选取,这个过程并不唯一,仅仅代表我们自身的思路。考虑到国内宏观经济数据大部分从2006年开始,且途中宏观经济面和市场面并非紧密契合,我们试图分别从宏观经济和市场特征两个角度出发,即从宏观经济面和市场面来计算各自的马氏距离,从两个方向来回答“今夕是何年”的问题。 2.1宏观经济面马氏距离的底层指标选取以及距离计算 我们主要参考西南策略团队往期研究成果(前期报告《论A股市场周期》,20220718)的思路,选取利率、剩余流动性、股票风险溢价和PMI指数来作为宏观经济面马氏距离计算时的基础指标。选取上述四个指标的原因在于它们对上证指数的解释力较强,因此基于其所评判出来的“今夕是何年”或许对股市投资更具现实意义。 其中,利率为国内十年期国债到期收益率,剩余流动性为前置9个月的“M2同比-社融同比”,股票风险溢价为前置11个月的上证指数相对国债风险溢价,PMI指数则由原值经过环比转同比处理后得到。 图4:计算宏观经济面马氏距离的4个底层指标 考虑到选取的宏观指标皆为月频,我们选择每个月计算一次马氏距离;更新时间上,4个指标中更新时间最晚的是PMI(每个月最后一天更新),因此我们将在每个月最后一天得到当月最新的马氏距离数值。 宏观指标的选取时间段为2006年1月至2023年5月。为了能够预留一部分样本作为均值,我们选择从2011年1月开始计算马氏距离;在计算时采用扩展窗口法(Expanding Window),把该月之前的所有数据当成历史数据重新进行计算,从而尽量规避使用未来数据的风险。 下图展示了从宏观经济面计算出来的马氏距离结果,最新数值为2023年5月的3.62; 历史上和该数值前五相似的时间点分别是2021年12月、2018年8月、2012年3月、2016年8月,从直观印象上看皆属于经济复苏初期或相对疲软的环境。 图5:根据宏观指标计算的每个月当期马氏距离 基于篇幅原因,我们在这里只展示2020年以来的马氏距离识别结果(完整版从2016年1月开始)。2020年1月识别出来宏观环境最相似时刻是2016年5月,均对应经济从底部开始向上缓慢复苏的状态(从底层指标观察的话,两个时刻均是利率和PMI经过前期下行后低位反弹,剩余流动性和股票风险溢价则反过来见顶回落)。随后疫情冲击逐步反映到经济数据上,因此2020年2月识别出来的最相似时刻变成2018年7月,对应经济进入短周期下行;2020年3月更是识别为2013年7月,两者皆为经济相对疲软。后续疫情达峰,叠加海外生产供给恢复不畅,国内经济快速向上修复,2020年10月开始马氏距离指示当时经济和2017年相似度较高,对应经济进入景气高位。 表1:从宏观经济指标出发,和当月马氏距离前四相近的时刻 2023年5月份识别出来的最相似历史宏观场景对应2021年12月,从底层指标来看主要是利率和PMI相似度较高:2021年12月处在经济下行周期的中继,2023年5月则是疫后需求集中回补释放后自然地进入一个环比下滑的区间,因此两段时间利率和PMI均在一个“山腰”的位置,匹配度较高。至于底层指标中的剩余流动性和股票风险溢价,两段时间的数值则匹配不上,而这就引出了马氏距离的一个问题:计算结果对底层指标的细微变动极为敏感,鲁棒性较差。因此,这就需要我们检验根据马氏距离筛选历史对应场景这一策略是否有效。 图6:2023年5月份识别出来最相近的宏观环境为2021年12月,但底层指标并不一一完全对应 我们尝试构建一个回测策略: 1)站在当月T,计算出当月的马氏距离; 2)检视T时点之前的过往月份自身的马氏距离,找到和当月马氏距离最为相近的4个数值,对应4个月份; 3)计算4个月份未来一个季度的万得全A涨跌幅,取其中位数,如果中位数为正,则在T+1月做多,如果中位数为负,则在T+1月做空; 4)特别的,如果识别出来的历史时刻和当月间隔不超过3个月,为了避免使用到未来数据,则忽略该历史时刻的未来涨跌幅信息; 5)回测区间为2016年1月至2023年5月。 图7:基于马氏距离角度构建的宽基指数多空策略回测流程图 最终策略收益表现较差,净值0.88远低于万得全A在该区间的涨幅,说明单纯依据宏观信息参照历史区间并做出投资决策的并不能获得明显的超额收益。整体收益的弱势或许归因到2016年以来国内结构性政策频出——16~17的供给侧改革、20~21的新兴产业发展,权益市场亦开始同步反映经济结构的变化,此时再单纯类比历史很难押对方向。 但过去两轮经济下行周期(2018年和2022年)中依据马氏距离进行多空策略收益则较为亮眼(2018年31.6%,万得全A-29.5%;2022年16%,万得全A-10%),原因或许在于熊市中宏观因素定价权重更高而赛道投资式微,此时回看历史能获得阶段性收益。 图8:根据马氏距离探究出来的历史时刻并不能完全指导投资,但熊市时有奇效 该如何评价从宏观经济面计算马氏距离去寻找历史相似时刻的做法?不得不承认最终回测下来策略表现不佳,除了刚刚所谈的近几年来经济结构变化所致,更多也在于底层指标数据自身的选择和处理方法上。但毕竟这给了一个我们数量化的工具能够直观地找到当前和历史的联系,在回顾历史时能够更加方便快捷去定位当下,这是可取之处。下面我们将依照同样的方式去计算市场特征方向下的马氏距离。 2.2市场面马氏距离的底层指标选取以及距离计算 在计算市场面马氏距离时,我们的底层指标主要有5个,均是参考了此前自身已经有的一些指标成果:上证和深证指数的平均估值分位数、上证和深证指数的平均换手率;我们还想囊括一些市场交易结构特征的信息,例如个股间的平均相关系数、宽度和离散度等,但考虑到计算量,我们采用中证800指数内部成分股来进行计算。以上指标涵盖了估值、市场热度以及交易结构等信息。 图9:计算市场面马氏距离的5个底层指标(1) 图10:计算市场面马氏距离的5个底层指标(2)