金融工程专题 2023年06月18日 金融工程研究团队 股东户数因子的深挖和改进 ——开源量化评论(76) 魏建榕(分析师)苏俊豪(分析师) 魏建榕(首席分析师) weijianrong@kysec.cn 证书编号:S0790519120001 sujunhao@kysec.cn 证书编号:S0790522020001 证书编号:S0790519120001 张翔(分析师) 证书编号:S0790520110001 傅开波(分析师) 证书编号:S0790520090003 高鹏(分析师) 证书编号:S0790520090002 苏俊豪(分析师) 证书编号:S0790522020001 胡亮勇(分析师) 证书编号:S0790522030001 王志豪(分析师) 证书编号:S0790522070003 盛少成(分析师) 证书编号:S0790523060003 苏良(分析师) 证书编号:S0790523060004 何申昊(研究员) 证书编号:S0790122080094 股东户数因子回归股本与股价后效果显著 我们使用向后填充,按月抽样的方法,得到月度的股东户数因子 (HolderNumber,以下简称HN),原始的HN因子RankIC为-1.97%,这表明股东户数越多,股票未来预期收益越低,但HN因子的表现十分不稳定。 股东户数与股票流通市值存在较高的正相关性,两者的截面秩相关系数均值高达0.55,市值行业中性化后,HN因子的RankIC下降至-1.48%,RankICIR为-0.54,稳定性依然欠佳。 股票的流通市值=流通股本×股价(未复权),如上所述,股东户数与流通市值强正相关,但流通股本和股价与股东户数的关系却截然相反:流通股本与股东户数的秩相关系数均值高达0.76,比流通市值更显著,而股价与股东户数的相关性却显著为负,秩相关系数均值为-0.50。 和市值行业中性化相比,对股本、股价分别或合并作回归剔除,得到的残差因子在显著性与稳定性上都要更优。 区间股价振幅越高,股东户数变化率因子效果越好 我们构造最近两期财报间股东户数的季度变化率因子HNpct,HNpct因子RankIC为-2.02%,RankICIR为-1.28,RankIC胜率为63%。多空收益方面,五分组下HNpct因子的年化多空收益为5.55%,收益波动比为1.01。HNpct因子的多头端区分效果不明显,空头端的负向收益更为显著。 股东户数的季度变化率的绝对幅度abs(HNpct)(即HNpct因子的绝对值)同样具有一定负向选股能力,abs(HNpct)因子RankIC为-2.15%,RankICIR为-0.98,RankIC胜率为56%。多空收益方面,五分组下abs(HNpct)因子的年化多空收益为4.37%,收益波动比仅为0.53。 我们基于股价区间振幅,对不同振幅下HNpct与abs(HNpct)因子的选股能力进行测试。结果显示,振幅越大,对应的HNpct因子与abs(HNpct)因子的表现越好,其中,最高振幅分组下,HNpct与abs(HNpct)因子的RankIC分别为-2.64%与-2.39%。 基于以上测试结果,我们进一步构造了HNpct与abs(HNpct)的精选与标准化因 相关研究报告 子,和对照基准相比,精选因子的RankIC、多空收益与多头收益变化不大,但 RankICIR、多空收益波动比、多空收益最大回撤均有较好改善;而标准化因子 《因子切割论》-2020.9.17 《高频股东数据的隐含信息量—开源量化评论(13)》-2020.12.31 《扎堆效应的识别:以股东户数变动为例—开源量化评论(66)》-2022.11.22 在RankIC、多空收益与多头收益上有所下降,但因子稳定性与多空收益稳定性提升则更为显著。 风险提示:模型基于历史数据测试,市场未来可能发生重大改变。 金融工程研究 金融工程专题 开源证券 证券研究报 告 目录 1、股东户数因子:回归股本与股价后效果显著3 2、股东户数变化率因子的能力受股价振幅影响5 3、风险提示8 图表目录 图1:股东户数与股票流通市值强正相关3 图2:回归市值前后HN因子表现均不佳3 图3:股本和股价与股东户数的相关性相反4 图4:市值的两个拆分因素对股东户数的影响方向相反4 图5:股东户数在不同中性化条件下的表现:股本、股价、行业中性化时表现最好4 图6:HN_price_ind因子的分组收益单调性较好,年化多空收益为16.1%5 图7:HNpct因子的RankIC显著为负5 图8:HNpct因子的空头端负向收益更为显著5 图9:abs(HNpct)同样具备一定的负向选股能力6 图10:abs(HNpct)的多空收益稳定性欠佳6 图11:振幅越高,HNpct_q因子效果越好7 图12:振幅越高,abs(HNpct_q)因子效果越好7 表1:股东户数在不同中性化条件下的表现:股本、股价、行业中性化时表现最好4 表2:计算基于股价振幅排序的HNpct_q、abs(HNpct_q)因子所需数据的示例6 表3:计算基于股价振幅排序的HNpct_q、abs(HNpct_q)因子的步骤7 表4:基于因子切割论的思想构造精选因子与标准化因子7 表5:因子表现:标准化因子HNpct_diff4、abs_HNpct_diff6稳定性较高8 上市公司的股东户数随财报公布,股东户数可以有效反映投资者尤其是个人投资者对公司的关注程度。在个人投资者行为较为活跃的A股市场中,股东户数的相关信息可以帮助我们挖掘与理解个人投资者的交易行为与习惯,是不可多得的独特alpha来源。 在开源金工2020年发布的报告《高频股东数据的隐含信息量》中,我们发现, 交易所投资者互动平台上披露的高频股东数据是有效的补充信息;而在2022年发布的报告《扎堆效应的识别:以股东户数变化为例》中,我们构造了股东户数变动因子SNC与人均持股占比变动因子PCRC,在中证1000指数中,因子具有优异的增强表现。本文我们将就股东户数这一数据,展开进一步讨论并构造相应的因子。 本文包含两个相对独立的结论: (1)股东户数因子回归股本与股价后效果显著。 (2)区间股价振幅越高,股东户数变化率因子效果越好。 1、股东户数因子:回归股本与股价后效果显著 我们使用向后填充,按月抽样的方法,得到月度的股东户数因子 (HolderNumber,以下简称HN),原始的HN因子RankIC为-1.97%,这表明股东户数越多,股票未来预期收益越低,但HN因子的表现十分不稳定,RankICIR仅为 -0.48。 股东户数与股票流通市值存在较高的正相关性,两者的截面秩相关系数均值高达0.55(图1),市值行业中性化后,HN因子的RankIC下降至-1.48%,RankICIR为-0.54,稳定性依然欠佳(图2)。 图1:股东户数与股票流通市值强正相关图2:回归市值前后HN因子表现均不佳 0.65 0.6 0.55 0.5 0.45 0.4 0.35 20141231 20150630 20151231 20160630 20161230 20170630 20171229 20180629 20181228 20190628 20191231 20200630 20201231 20210630 20211231 20220630 20221230 0.3 秩相关系数 0.5 0 -0.5 -1 -1.5 -2 20141231 20150630 20151231 20160630 20161230 20170630 20171229 20180629 20181228 20190628 20191231 20200630 20201231 20210630 20211231 20220630 20221230 -2.5 累计RankIC序列:HN因子 累计RankIC序列:HN因子(市值行业中性化) 数据来源:Wind、开源证券研究所(数据区间201412~202303)数据来源:Wind、开源证券研究所(数据区间201412~202303) 股票的流通市值=流通股本×股价(未复权),如上所述,股东户数与流通市值强正相关,但流通股本和股价与股东户数的关系却截然相反:如图3所示,流通股本与股东户数的秩相关系数均值高达0.76,比流通市值更显著,而股价与股东户数的相关性却显著为负,秩相关系数均值为-0.50。 流通股本越多,可分配给到的股东数量自然也越多;而未复权股价则可视作该股票的投资门槛,门槛越低,资金量较小的个人投资者投资难度越低,则股东户数 也更多,股本与股价对股东户数的影响如图4所示。 图3:股本和股价与股东户数的相关性相反图4:市值的两个拆分因素对股东户数的影响方向相反 秩相关系数均值 76% 55% 市值 股本 -50% 股价 100% 50% 0% -50% -100% 数据来源:Wind、开源证券研究所资料来源:开源证券研究所 基于以上分析,我们认为应当把股本与股价对股东户数的影响分开看待,作为对照,我们测试了HN因子在不同中性化条件下的表现,如表1、图5所示。在中性化前后,HN因子都表现出较为显著的负向选股能力,这表明,股东户数越多,散户拥挤度越高,股票预期收益越差。 表1:股东户数在不同中性化条件下的表现:股本、股价、行业中性化时表现最好 因子简称 处理方法 RankIC RankICIR HN - -1.97% -0.48 HN_mkv_ind 市值、行业中性化 -1.48% -0.54 HN_share_ind 股本、行业中性化 -3.67% -1.87 HN_price_ind 股价、行业中性化 -3.87% -1.40 HN_share_price_ind 股本、股价、行业中性化 -3.86% -2.12 数据来源:Wind、开源证券研究所(数据区间201412~202303) 图5:股东户数在不同中性化条件下的表现:股本、股价、行业中性化时表现最好 HNHN_mkv_indHN_share_ind HN_price_indHN_share_price_ind 0.5 0 -0.5 -1 -1.5 -2 -2.5 -3 -3.5 -4 -4.5 数据来源:Wind、开源证券研究所(数据区间201412~202303) 和市值行业中性化相比,对股本、股价分别或合并作回归剔除,得到的残差因子在显著性与稳定性上都要更优,不过,HN_share_ind、HN_price_ind、HN_share_price_ind三个因子中,仅HN_price_ind因子的分组收益单调性较好,其多空 收益也更高(图6)。 图6:HN_price_ind因子的分组收益单调性较好,年化多空收益为16.1% 18% 16% 14% 12% 10% 8% 6% 4% 2% 0% 多头组123空头组多空收益 HN_share_indHN_price_indHN_share_price_ind 数据来源:Wind、开源证券研究所(数据区间201412~202303) 2、股东户数变化率因子的能力受股价振幅影响 本节我们将基于开源金工“因子切割论”(详见开源金工报告《因子切割论》)的思想,探究股东户数的变化率因子在不同股价振幅下的表现差异,并据此构造表现更稳健的股东户数变化率因子。 我们构造最近两期财报间股东户数的季度变化率因子HNpct,HNpct因子RankIC为-2.02%,RankICIR为-1.28,RankIC胜率为63%。多空收益方面,五分组下HNpct因子的年化多空收益为5.55%,收益波动比为1.01。HNpct因子的多头端区分效果不明显,空头端的负向收益更为显著(图8)。 图7:HNpct因子的RankIC显著为负图8:HNpct因子的空头端负向收益更为显著 数据来源:Wind、开源证券研究所(数据区间201412~202303