您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[西南证券]:因子选股系列:基于相似股票历史收益的选股因子研究 - 发现报告
当前位置:首页/其他报告/报告详情/

因子选股系列:基于相似股票历史收益的选股因子研究

2022-05-12邓璎函西南证券看***
因子选股系列:基于相似股票历史收益的选股因子研究

摘要 在美股市场中叱咤风云的各种动量因子在我国A股市场中往往收效甚微,是什么导致了同一个因子在不同的市场中经常表现出截然不同的实证结果?近年来,伴随着行为金融学的高速发展,行为金融学从多个角度解释了动量效应背后的成因。本文从投资者的投资心理和投资行为出发,探讨相似股票的历史收益是否可以为因子选股提供新的信息。 我们从股票价格、规模、风险、盈利能力、投资水平五个维度定义了股票距离,用来衡量股票与股票之间的相似程度,进而构建了相似股票动量因子,在我国A股市场对其进行了有效性检验。相似动量因子同股票的下期收益正相关,相似股票动量因子IC均值为0.0305,IR为0.2689。多空组合平均月收益率为1.01%,组合年化收益率为12.89%,最大回撤仅为8.39%。 在此基础上,本文对该因子进行了相关系数分析与Fama-Macbeth回归分析,结果表明,在排除了异质波动、流动性、动量与规模等影响因素的情况下,相似股票动量因子依旧显著有效,可以为选股提供新的信息。 我们还对相似动量因子的参数进行了敏感性分析。结果表明,采用股票过去一个月的平均收益率衡量股票历史收益,选择距离最近的80只股票或选择股票距离小于等于1的股票构建相似股票样本可以保证相似动量因子稳定有效。 最后,我们对相似股票动量因子进行了改进。我们结合股票的历史收益,构建了相似预期差因子。相似预期差因子选股卓有成效,控制股票历史超额收益后,信息系数IC均值高达0.0910,多空组合平均月收益率为1.44%,组合年化收益率为18.72%,最大回撤仅为8.60%。样本期内,使用相似预期差因子构建多头组合收益率远超市场组合,年复合增长率高达25.23%。 风险提示:本研究基于2016-2021年中国A股市场历史数据,因子的历史收益率不代表未来收益率。若未来市场环境发生较大变化,因子的实际表现可能与本文的结论有所差异。 股票的历史收益是股票未来收益的重要参考,相似股票的历史数据也是选股的重要依据。那么相似股票与历史收益的双管齐下能否相得益彰?本文将从月度低频数据出发,研究相似股票的历史收益对选股的指导意义。 1因子构建 1.1股票距离与相似股票 为了衡量股票与股票之间的相似性,借鉴He,Wang和Yu(2021)的思路与方法,本文将从股票价格、规模、风险、盈利能力、投资水平五个维度来刻画股票间的相似程度。 我们将股与股在时刻的距离资产增长率之间的欧氏距离: 定义为二者在股价、市值、账面市值比、净资产收益率、 其中,值,益率, 为股在月末的收盘价, 为股去年十二月底或今年六月底总市值的自然对数为股去年十二月底的净资产收 为股去年十二月底资产净值与总市值之比,为股去年十二月底的资产增长率。 为了降低各个指标不同的数量级和量纲对股票距离测算产生的偏误,计算距离之前,以上指标均需要在截面上进行标准化处理。并且,为了避免动量因子对实证结果产生干扰,我们在构建股票距离指标时并没有引入股票的历史收益率。 两只股票的距离越小,两只股票的相似程度就越高,当两只股票距离比较小时,我们就可以称这两只股票为相似股票。基于以上对股票距离与相似股票的定义,接下来我们可以构建相似股票动量因子。 1.2相似股票动量因子构建 某只股票相似股票的历史收益是否会影响该股票未来的收益呢?Tversky和Kahneman (1974)研究发现,当人们试图对某件事物进行判断或分类时,往往会采用代表性启发法(representativene ss heuri stic)。当投资者判断某只股票的未来收益时,往往会采用与其相似的某只股票的历史收益来推断其未来表现。倘若某只股票的相似股票历史收益率较高,那么投资者对这只股票的收益预期往往也比较高。 不仅如此,根据行为金融学中的后悔理论(Bell,1982),如果一只股票过去产生了较高收益,但投资者偏偏与这支股票擦肩而过,投资者会因此痛苦、自责后悔不已。为此,投资者往往会寻找相似但还未上涨的股票进行投资。这也就意味着,和历史表现优秀的股票相类似的股票的投资需求会增加。 更进一步,如果投资者在对某只股票的投资中收获颇丰,他的投资思维容易产生路径依赖,之后的投资依然会偏爱相似的股票,这就是投资者预期偏差中的锚定效应(Tversky and Kahneman,1974)。 为了检验某只股票相似股票的历史收益对该股未来收益的影响,基于上文对股票距离与相似股票的定义,给定“半径”参数,我们将相似股票动量因子定义为同股票在时刻距离最近的只股票过去一个月历史收益率的市值加权平均值: 其中, 动量因子 代表股以市值加权的权重, 代表股 月的收益率。股票的相似股票 取值越小 ,意味着股票的相似股票历史表现较差;相似股票动量因子 取值越大,意味着相似股票历史收益率越高。 2因子有效性检验 因子有效性检验的样本期为2016年12月到2021年12月,为了保证找到每只股票最相似只股票,我们对上市交易的全部A股进行回测。为了防止股票自身的动量因子对回溯测试的结果产生干扰,我们在测算股票距离时将每只股票同自身的距离设定为。 2.1分组检验 为了检验相似股票动量因子的有效性,给定参数 ,对相似股票动量因子进行分 组检验。后续我们也将就因子参数的敏感性进行实证分析。 首先,根据股票距离的定义,我们计算每只股票同A股市场中的其他股票的距离从而确定此刻同该股最相似的80只股票构成相似股票样本;随后,本文用相似股票过去一个月的历史收益数据计算因子值;最后按照当期因子值大小将股票平均分为5组,计算下一个月组内平均收益率。为了避免市值对组合收益的测算产生偏误,我们选用算数平均计算组合收益,在计算每一期的因子值和下一期收益率时,为了减少误差,剔除相关数据缺失的股票。 表1对应相似动量因子分组检验结果。在分组检验的基础上,我们计算了多空组合的 表1:相似股票动量因子分组检验结果 根据表1数据,自组1到组5,伴随着相似股票动量因子值的逐步增大,各组平均月收益率单调递增。基于相似动量因子的分组结果分别构建投资组合在样本期进行回测,每月的最后一个交易日进行调仓,相似股票动量因子值较大的组合不仅在年化收益率、Sharp比率、最大回撤率、月胜率等方面显著优于因子值较小的组合,而且各指标均显示出显著的单调性。多空组合“组5-组1”平均月收益率为1.01%,在99%的置信水平下显著非零,其年化收益率为12.89%,组合的最大回撤率仅为8.39%,表现稳定。 图1:相似股票动量因子分组净值图 根据回溯测试的结果,我们在图1中绘制了样本期内相似股票动量因子的分组累计净值图。如图可见,在整个样本期内,不论是在2018年的熊市,还是在2019年的牛市,各组合的历史净值存在显著差异且具备非常显著的单调性。因此,我们判定相似股票动量因子有效,且当期相似动量因子值同股票下期收益正相关。 在分组净值分析的基础上,为了进一步考察因子在样本期内的实际市场表现,我们在 图2中分别绘制了多空组合“组5–组1”与“(4+5)-(1+2)”的历史净值变化情况。由图所示,在样本期内,无论是在2018年的熊市还是在2019年后的牛市,相似股票动量因子多空组合净值始终保持稳步增长,并且从未出现过大幅回撤,表现优良。 图2:多空组合累计净值变化图 2.2信息系数分析 为了进一步验证相似股票动量因子的有效性,我们对相似动量因子的信息系数IC进行了实证分析。信息系数是指当期因子值与下期股票收益率之间的秩相关系数,IC越大,相似动量因子对股票下期收益率的预测作用也就越强。因子信息系数分析的结果见下表。 表2:相似股票动量因子信息系数分析结果 根据表2数据,在样本期内,相似股票动量因子的IC均值为0.0305,在置信水平95%上强烈拒绝IC均值为0的原假设,IC与均值同向的比例高达61.67%,IR比率(IC均值除以标准差)为0.2689。相似股票动量因子具备较强的有效性和稳定性。为了进一步考察相似股票动量因子的有效性,我们在图3中绘制了在样本期内相似动量因子的累计信息系数变化情况。 图3:相似股票动量因子累计信息系数变化示意图 如图所示,从因子的累计信息系数来看,尽管存在一定的波动,相似股票动量因子的累计IC在总体上以一个相对固定的速率保持平稳上升,表明因子在样本期内的表现比较稳定,相似股票动量因子同股票下期收益呈现显著的正相关关系。 综上所述,通过分组检验和信息系数分析,可以得出以下结论:在样本期内,相似股票动量因子有效且与股票的下期收益正相关。 2.3相关分析与回归分析 上文我们分别通过分组检验及信息系数分析论证了相似股票动量因子的有效性,但是,该因子能否在选股中发挥作用取决于它是否可以提供目前尚未被市场定价的新信息。倘若相似动量因子提供的信息已经被市场定价或与其它已知因子提供的信息高度重合,那么即便该因子显著有效也难堪大用。因此,在论证因子有效性的基础上,接下来我们将通过相关性分析与回归分析来证明相似动量因子揭示了有关股价变化的新信息。 我们选用异质波动率(Ang et al.,2006)、Amihud非流动性指标(Amihud,2002)、股票前一月的历史收益率、公司的流通市值来分别刻画股票在异质波动、流动性、动量、规模四个维度的信息,以此为基础,证明相似股票动量因子为选股提供了新的信息。以上指标均选用月度数据,其中我们选用Fama-French五因子模型(Fama & French,2015)作为测算异质波动率的基础定价模型。 为了考察相似股票动量因子同其它因子的内在联系,我们首先计算了相似动量因子与其它因子的次序相关系数。 表3:因子相关系数矩阵 根据相关系数矩阵,相似股票动量因子同异质波动率、流通市值的相关性较弱,信息重合度较低,而与非流动性、动量相关性较强,可能存在较大的信息重合。为了进一步验证相似股票动量因子能否为选股提供新信息,我们采用Fama-Macbeth方法(Fama &Macbeth,1973)对以上因子和股票收益率进行回归分析。 首先,我们分别对以上因子进行单因子回归,检验每个因子与股票下期收益的显著性,回归方程为: 其中, 代表股票的下一期的收益率,代表因子收益率, 为股票在期的因子载 荷,单因子回归结果如下表所示。 表4:单因子回归结果 根据单因子的回归结果,动量和流通市值的因子收益率并不显著,而其它因子均在99%的置信水平下显著,表明相似动量、异质波动率、非流动性均对股票的下期收益率具有明显的预测作用。 因子之间可能会存在信息重叠,为了检验相似动量因子是否可以提供其它因子中未包含的信息,我们将其它因子作为控制变量,进行多因子回归分析,回归方程设定如下:其中, 代表因子的因子收益率 ,Macbeth回归结果如表5所示。 为股票在期的因子敞口。 多因子的Fama- 表5:多因子Fama-Macbeth回归结果 在回归方程Ⅰ至Ⅳ中,我们分别将异质波动率、非流动性、动量及流通市值作为控制变量,检验在控制了异质波动、流动性、动量及规模信息后,相似股票动量因子是否依旧可以提供股价变化的信息。 回归方程Ⅰ中,相似动量因子与异质波动率一同作为解释变量,因子收益率在99%的置信水平下均显著非零,表明相似动量因子同异质波动率的信息重合度较低,两者均对股票的下期收益率具备明显的预测作用。 在回归方程Ⅱ中,在引入非流动性作为控制变量后,相似动量因子的显著性并没有发生改变,而非流动性因子的因子收益率变得不显著,这意味着相似股票动量因子与非流动性因子之间存在信息重叠,但在控制流动性信息后,相似动量因子依旧可以为选股提供新的信息。 在回归方程Ⅲ与Ⅳ中,在引入动量和流通市值作为控制变量后,相似动量因子的因子收益率在1%的显著性水平下保持不变,说明在控制了动量与规模信息后,相似动量因子依旧有效。 回归方程Ⅴ纳入了所有的解释变量,相似动量因子与异质波动率的因子收益率在99%的置信水平下显著,证明相似动量因子与异质波动率对股票的下