您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[西南证券]:因子选股系列之四:基于历史相似走势的因子选股研究 - 发现报告
当前位置:首页/其他报告/报告详情/

因子选股系列之四:基于历史相似走势的因子选股研究

2024-09-05郑琳琳、王天业西南证券艳***
因子选股系列之四:基于历史相似走势的因子选股研究

摘要 股票的历史收益始终是股票未来收益的重要参考。在前期报告《基于相似股票历史收益的选股因子研究》,我们发现同一时间基本面相似的股票的历史收益率中蕴含着极为有效的定价信息,基于基本面的相似性与股票的历史收益率构建的相似预期差因子在因子选股与行业轮动中均具备较强的有效性。 本次我们将转换视角,从同一时间截面基本面相似过渡至同一股票时序历史股票价格走势相似,探索历史相似走势的收益率信息能否为当下股票收益率预测提供有效信息。 选用皮尔逊相关(Pearson Correlation)系数刻画股票当前走势与历史走势的相似性,在此基础上,我们分别构建了相似反转因子与相似低波因子。 相似反转因子:相似反转因子即为多次相似走势后在既定持仓时间内股票累计超额收益的平均值。样本期2013年12月27日至2024年8月23日,周度换仓,因子的IC均值为0.05,IC标准差为0.10,IC胜率为73.33%,ICIR为0.50,多空组合年化收益率为45.90%,收益波动比为2.88,有效性显著强于传统反转因子。 相似低波因子:相似低波因子即历史出现相似走势后既定持仓时间内股票累计超额收益率标准差的倒数。样本期内,周度换仓,因子的IC均值为0.08,IC标准差为0.10,IC胜率为78.52%,ICIR为0.79,多空组合年化收益率为46.91%,收益波动比为3.31,有效性显著强于传统低波因子。 Barra风格因子相关性分析:相似反转因子同所有Barra风格因子相关性均较低,可以提供Barra风格因子之外的低相关有效信息;相似低波因子同Barra风格中的LIQUIDTY与RESVOL因子相关性较强,表明相似低波因子在流动性与残差波动率风格上有所暴露。 一级行业分域有效性测试:在申万一级31个行业中,除钢铁、银行与煤炭三个行业,相似反转因子均较为有效。除银行与煤炭,相似低波因子均较为有效。 行业中性化处理后,相似反转因子的有效性与稳定性均有所提升,相似低波因子有效性有所下降,稳定性有所提升。 主流宽基分域有效性测试:相似反转因子在沪深300指数、中证500指数、中证1000指数域中均为有效的选股因子,有效性依次递增,空头组合表现相对出色。相似低波因子在沪深300指数、中证500指数、中证1000指数域中均为优秀的选股因子,有效性依次递增,因子分组单调性较强,多头组合与空头组合均可贡献可观收益。 风险提示:本报告结论完全基于公开的历史数据,若未来市场环境发生变化,因子的实际表现可能与本文的结论有所差异,同时可能存在第三方数据提供不准确的风险。因子的历史收益率不代表未来收益率,投资者需充分认知自身风险偏好以及风险承受能力。市场有风险,投资需谨慎。 引言 股票的历史收益始终是股票未来收益的重要参考。在前期报告《基于相似股票历史收益的选股因子研究》(2022-05-12)中,我们发现同一时间基本面相似的股票的历史收益率中蕴含着极为有效的定价信息,基于基本面的相似性与股票的历史收益率构建的相似预期差因子在因子选股与行业轮动中均具备较强的有效性。 本次我们将转换视角,从同一时间截面基本面相似过渡至同一股票时序历史走势相似,探索历史相似走势的收益率信息能否为当下股票收益率预测提供有效信息。 1因子构建 1.1历史走势相似性刻画 选用皮尔逊相关(Pearson Correlation)系数刻画股票当前走势与历史走势的相似性。 假定同一只股票长度相同的两段股价的时间序列分别为X和Y,序列X与Y的皮尔逊相关系数如下所示。 皮尔逊相关系数 负相关;皮尔逊相关系数 ,序列X与Y正相关;皮尔逊相关系数 的绝对值越大,序列X与Y的相似性越强。 ,序列X与Y 假设当前时刻为t,股票i的序列长度为RW,那么t时刻的股票收盘价序列即为: 设定股票i的收盘价历史序列长度为HW,为了防止历史序列与当前序列重合,我们将t时刻股票i的历史收盘价序列设定为: 对于历史收盘序列中的任意时刻T,包含时刻T在内的等长收盘价序列为: 进而我们可以计算T时刻历史时间序列同当前时间序列的皮尔逊相关系数为: 通过逐一滚动计算皮尔逊相关系数,得到历史收盘序列中任意时刻T起连续的RW日序列同当前股票收盘价序列的相似程度。 1.2相似反转因子与传统反转因子 1.2.1相似反转因子 我们发现,我们总能在同一只股票的历史收盘价序列中找到多个同股票当前走势相似的时刻,并且历史中出现相似走势后股票一段时间内的平均超额收益率越高,未来持有同样时间的超额收益率就越低。为了精确刻画这一相似反转现象,在历史走势相似性刻画的基础上,我们进一步构建了相似反转因子。 为了提取相似程度较高的历史走势收益信息,设定皮尔逊相关系数的阈值为Threshold筛选出走势相似度符合条件的时刻: 并且为了充分利用股票价格的历史序列信息,在有限的时间序列中找到更多可供参考的相似时刻,我们会将股票走势高度正相关与高度负相关的两种情况同步纳入,为此需要通过计算皮尔逊相关系数的绝对值来筛选相似时刻;相应的,在相关系数为负的相似时刻,后续超额收益率的计算也会将符号同步修正。 在此基础上,假设持仓时间为HoldingTime,相似走势序列长度为RW,由此可以得到出现相似走势后在既定的持仓时间内股票i的累计超额收益率,特别说明,为了防止股票收益率信息出现数据偷窥,持仓时间HoldingTime应小于相似走势序列长度RW, 相似反转因子即为多次相似走势后在既定持仓时间内股票累计超额收益的平均值。 考虑到在实际投资过程中,投资者相对更重视最近一段时间内的股票表现,近期股票量价信息相较于历史量价信息往往具备更强的有效性,因此采用指数衰减法,通过计算多次相似走势之后在既定持仓时间内股票的累计超额收益的加权平均值构造相似反转因子。 由于在历史股票收盘价序列中,同股票当前走势相似的时间序列会多次不定期出现,根据时间间隔进行指数衰减法加权会降低截面上股票之间数据的可比性。例如,对于股票i与股票j,两只股票最近一次出现的相似走势分别发生在与时刻,如果两只股票最近一次的相似走势未同时发生,那么两只股票最近一次相似走势后的超额收益率将使用截然不同权重进行加权,从而降低了截面上数据的可比性。 为了解决这一问题,我们将根据每只股票历史相似走势发生的次序进行指数衰减加权。 假设在当前时刻t,股票i在历史序列 中一共出现n次相似走势,设定半衰期为H, 得到第k次相似走势后既定持仓时间内股票累计超额收益率的加权权重为: 其中,衰减系数的计算方式为: 最终,通过指数衰减法,计算历史出现相似走势后既定持仓时间内股票累计超额收益率的加权平均值得到相似反转因子: 1.2.2传统反转因子 选用传统反转因子作为相似反转因子的对照。传统反转因子通过计算股票过去一段时间的累计超额收益率构建,设定回望窗口为RW,传统反转因子计算方式如下所示。 1.3相似低波因子与传统低波因子 1.3.1相似低波因子 在相似反转现象的基础上我们发现了相似低波现象。同一只股票的历史收盘价序列中往往会出现多个走势相似的时刻,每次出现相似走势后,可以计算得到出现相似走势后股票一段时间内的累计超额收益率。我们发现多次相似走势后得到的累计超额收益率样本的波动率越低,未来继续持有该股票获得的超额收益率的期望越高。 为此,在相似反转因子的基础上,更进一步我们构造了相似低波因子,相似低波因子即历史出现相似走势后既定持仓时间内股票累计超额收益率标准差的倒数: 特别说明,有别于上文,此时益率序列。 指代历次相似走势后既定持仓时间内股票的累计超额收 1.3.2传统低波因子 类似的,选用传统低波因子作为相似低波因子的对照。传统低波因子往往会采用收益率或成交额的标准差的倒数构造,但是由于成交额受股票规模及流动性干扰,致使成交额低波因子在规模和流动性因子上有所暴露,为此,选用股票过去一段时间内收益率标准差的倒数构建传统低波因子。设定回望窗口为RW,传统低波因子计算方式如下: 特别说明,此时 指代股票i时刻t回望窗口为RW的收益率序列。 2因子有效性检验 2.1因子回溯测试框架 回测区间:2013年12月27日至2024年8月23日 回测样本范围:沪深A股 因子分组测试:单因子测试分为10组,组内等权配置,分组测试暂不考虑交易费率 换仓频率:周度换仓,股票池基于每周五的因子信息进行分组 特别处理: 1.剔除ST股 2.剔除上市不满一年股票 3.如果股票在换仓日涨停,涨停标的本期无法买入 4.如果股票在换仓日出现停牌,停牌标的本期无法买入 2.2相似反转与传统反转因子回溯测试 由于采用周度换仓策略,设置相似走势序列长度RW为6,收盘价历史序列长度HW为120,半衰期H为6,皮尔逊相关系数阈值Threshold为0.40,计算相似反转因子。相似走势样本相关系数与样本规模分布分别如下所示。 表1:相似反转因子相似走势样本平均相关系数与样本平均规模分布 图1:相似反转因子相似走势样本平均相关系数分布直方图 图2:相似反转因子相似走势样本平均规模分布直方图 相似反转因子相似走势样本的平均相关系数的最小值为49.67%,平均值为69.77%,中位数为71.44%,最大值为85.50%;相似走势样本平均规模的平均值为74.74,中位数为81,最大值为101,因子历史平均覆盖率高达97.44%,可见相关参数设置较为合适,相似走势样本质量较高。 2.2.1相似反转与传统反转因子信息系数分析 为了验证相似反转因子的有效性,我们对相似反转与传统反转因子进行信息系数分析。 信息系数(Information Coefficient, IC)指当期因子值与下期股票收益率之间的秩相关系数,IC越大,因子对股票未来收益率的预测能力也就越强。相似反转与传统反转因子的信息系数分析结果见下表。 表2:相似反转与传统反转因子信息系数分析 在回测区间内,相似反转因子的IC均值为0.05,IC标准差为0.13,IC胜率为66.30%,ICIR为0.39;传统反转因子IC均值为0.04,IC标准差为0.15,IC胜率为63.18%,ICIR为0.26。相较于传统反转因子,相似反转因子的有效性及稳定性显著占优,相似反转因子是更有效的反转因子。 图3:相似反转与传统反转因子信息系数与累计信息系数变化示意图 2.2.2相似反转与传统反转因子分组检验 为了进一步验证相似反转因子的有效性,对相似反转因子与传统反转因子分别进行了分组检验,分组检验的结果依次如下。 表3:相似反转因子分组检验结果 图4:相似反转因子分组净值变化示意图 样本期内,相似反转因子空头年化收益率为-23.17%,多头年化收益率10.39%,因子空头收益贡献能力较强,多头单调性有所衰减。多空组合年化收益率为42.83%,年化波动率为0.19,多空组合收益波动比为2.24,最大回撤率为12.54%,多空组合收益稳定性突出。 表4:传统反转因子分组检验结果 图5:传统反转因子分组净值变化示意图 样本期内,传统反转因子空头年化收益率为-11.10%,多头年化收益率-0.30%,因子空头收益贡献能力较强,多头年化收益率严重衰减。多空组合年化收益率为11.39%,年化波动率为0.22,多空组合收益波动比0.51,多空组合收益表现较为平庸。 对比相似反转因子与传统反转因子分组检验的结果 ,相似反转因子空头年化收益率-23.17%,传统反转因子空头年化收益率-11.10%;相似反转因子多头年化收益率10.39%,传统反转因子多头年化收益率-0.30%;相似反转因子多空组合收益波动比为2.24,传统反转因子多空组合收益波动比为0.51。 相较于传统反转因子,相似反转因子在多头、空头、多空组合收益表现均大幅占优,同时多头年化收益率衰减幅度相对较低,相似反转因子有效性大幅优于传统反转因子。 2.3相似低波与传统低波因子回溯测试 采用周度换仓策略,设置相似走势序列长度RW为5,