2023年01月03日 证券研究报告•金融工程专题报告 因子选股系列 基于权益基金共同资金流的选股因子研究 摘要 本文借鉴Dou,KoganandWu构建基金共同资金流的思路,构建股票的季度共同资金流敞口因子;并验证该因子在选股中的有效性。 首先,构建股票的共同资金流敞口因子。基于主动权益基金的资金流信息,通过主成分方法(PCA)提取基金资金流量波动的共同成分——共同资金流。资金流敞口因子(flowbeta)为股票收益率在共同资金流上的暴露(回归系数)的绝对值 大小,表示共同资金流对股票收益率的影响程度。 在A股市场因子构建中有以下三点本土化改进:第一,在对基金资金流进行主成分分析之前,对基金资金流数据采用衰退指数加权。第二,采取季度基金资金流的TTM数据。第三,美股市场flowbeta因子为共同资金流变量的回归系数beta,本文对回归系数beta取绝对值来度量敏感程度的绝对大小。 接下来,本文使用上市交易的全部沪深A股2012-2022年的数据检验该因子的有效性。随着共同资金流敞口因子的增大股票组合平均收益率单调递减,因子的IC均值为-0.057,IC为负的比例为73.81%,ICIR为-0.77。多头组合年化收益率 12.78%,相对沪深300年化超额收益率为9.98%,相对万得全A年化超额收益率为6.11%。 其次,为了探讨共同资金流敞口因子是否提供了关于股价的新信息,本文进行了Fama-Macbeth回归分析,结果发现,在控制市场贝塔、市值、账面市值比、动量、异质波动率、换手率因素的影响之后,该因子与股票横截面收益的负相关关系显著性下降但仍然显著存在。证明了该因子和股票收益的关系并未完全包含在这些因子中,能够在选股时提供新的信息。 最后,敏感性分析结果显示,在基金资金流的不同构建方式、不同市场指数、不同滚动窗口期下,资金流敞口因子的IC均值并没有较大变化,因子的有效性并没 有发生改变,说明该因子的有效性对参数并不敏感。 风险提示:本文的研究是基于对历史数据的统计和分析,因子的历史收益率不代表未来收益率。若市场环境发生变化,因子的最终表现可能发生改变。 西南证券研究发展中心 分析师:郑琳琳 执业证号:S1250522110001电话:13127711820 邮箱:zhengll@swsc.com.cn 联系人:盛宝丹 电话:17761229406 邮箱:sbdyf@swsc.com.cn 相关研究 1.金凤展翅,上海国企ETF迎重要投资机遇(2022-12-04) 2.华安沪深300指数增强策略ETF投资价值分析(2022-12-04) 3.博时基金金晟哲:平衡成长与估值,把握周期行业轮动(2022-12-02) 4.华商基金李双全:抵御风险能力强,行业配置灵活(2022-11-27) 5.基于有效选股因子的三维基金经理风格刻画体系——原理与应用 (2022-11-17) 6.基于基金特征与机器学习的选基研究 (2022-11-09) 7.基金业绩归因模型的解析与探讨 (2022-10-29) 8.基于券商金股的行业轮动研究 (2022-09-08) 9.基于相似股票历史收益的选股因子研究(2022-05-20) 10.基于吸收比率规避市场下行风险的资产配置策略(2022-02-09) 请务必阅读正文后的重要声明部分 目录 1共同资金流敞口与因子构建1 2因子有效性检验3 2.1数据处理与说明3 2.2分组检验3 2.3信息系数分析5 3相关性分析与回归分析6 4敏感性分析8 4.1基金资金流的替代指标8 4.2市场指数的选择9 4.3滚动窗口期数的选择10 5多空组合股票分析11 6A股市场与美股市场实践对比12 7总结与展望13 8风险提示13 图目录 图1:第一主成分对样本方差的解释率2 图2:因子分组净值图4 图3:多空组合净值变化图5 图4:多头组合与市场指数净值变化图5 图5:因子IC序列和累计信息系数6 图6:不同基金资金流构建方式下因子分组净值图9 图7:不同市场指数下因子分组净值图10 图8:不同窗口期的IC均值10 图9:分组检验中组合内股票数量11 图10:回归系数beta的分组检验12 表目录 表1:基金资金流的异常值1 表2:基金资金流(TTM)数据1 表3:基金报告披露说明3 表4:因子分组检验风险收益指标4 表5:因子信息系数分析6 表6:因子相关系数7 表7:单因子回归结果7 表8:多因子Fama-Macbeth回归结果8 表9:不同基金资金流构建方式下因子信息系数分析9 表10:不同市场指数下因子信息系数分析9 表11:2022Q2因子值从小到大排序的前20名股票和后20名股票11 1共同资金流敞口与因子构建 共同资金流敞口因子(flowbeta)为股票收益率在基金共同资金流上的暴露(回归系数)的绝对值大小,表示该股票对共同资金流的敏感程度。共同资金流度量基金资金流量的共同成分,通过主成分方法(PCA)对主动权益基金的资金流提取共同成分得到。 首先,基金资金流(fundflow)的定义如下,即当期经实际回报调整后的基金资产净值增长率。 𝐹�,� =TNA𝑖,�−TNA𝑖,𝑡−1∗(1+𝑅𝑖,𝑡)TNA𝑖,𝑡−1∗(1+𝑅𝑖,𝑡) 其中TNA为期末基金净资产;R为基金当期收益率,是单位复权净值收益率。对于基金资金流数据,本文有以下两点处理: 第一,在后续计算中采用基金资金流的TTM数据,即为t期、t-1期、t-2期和t-3期资 金流的平均值,采取TTM数据平滑趋势和消除季节性影响。 第二,基金资金流数据存在异常值,比如:海富通欣荣A基金(519224.OF)在2017 年三季度披露的基金净资产为3.2万元,2017年四季度披露的基金净资产为9996万元,该 基金2017年四季度的资金流为305523.93%。对于异常值本文采取3∂原则,将超过正负3 倍标准差以上的数据取值为临界值。 表1:基金资金流的异常值 期末基金净资产(亿元) 当期基金收益率 基金资金流 2017-09-30 0.0003 2.83% - 2017-12-31 0.9996 2.06% 305523.93% 数据来源:Wind,西南证券整理 通过以上处理我们得到主动权益基金的资金流的面板数据,如下表所示,每一列为一只基金的资金流序列: 表2:基金资金流(TTM)数据 日期 000011.OF 000017.OF 000020.OF 000021.OF … 2015-03 -0.1006 1.1359 -0.0168 -0.1065 … 2015-06 -0.1381 0.8911 0.1037 -0.1711 … 2015-09 -0.1010 -0.1868 0.1651 -0.1701 … 2015-12 -0.0701 -0.2560 0.2886 -0.1355 … 数据来源:Wind,西南证券整理 其次,对于表2所示矩阵,通过主成分分析法得到第一主成分,即为共同资金流𝑓𝑙𝑜𝑤𝑐𝑜�。第一主成分为原始向量的线性组合,是基金资金流变化波动的主导因素,其最大化样本方差。具体步骤如下: 第一步,考虑到事件对市场的影响会随着时间而衰减,我们采用半衰期指数权重对基金资金流数据进行加权。权重因子如式(1)所示,�表示半衰期,取窗口期的一半(T/2),𝑡1时刻数据权重为𝑤𝑑𝑒𝑐𝑎�𝑡1,�−𝑡1表示𝑡1时刻到当前时刻t的期数。 𝑡−𝑡1 𝑤𝑑𝑒𝑐𝑎�𝑡1=0.5�(1) 第二步,标准化数据。在列维度上对数据进行标准化,使得每个维度的均值为0。缺失值填充为0。 第三步,使用主成分分析法(PCA)对样本矩阵进行降维,提取资金流波动的共同主成分。根据中心化的样本矩阵计算协方差矩阵,协方差矩阵的对角线上的元素是各个维度上的方差,其余元素是两两维度间的协方差(相关性)。协方差矩阵表现了各个维度上的方差以及不同维度间的相关性。第二,对协方差矩阵进行对角化得到正交矩阵和特征值矩阵,按照特征值大小排序,最大的特征值所对应的特征向量为第一主成分。这个主成分是原始向量的线性组合,其最大化样本方差,是最能够代表原始数据的投影方法。第三,将原始矩阵通过这个特征向量映射成一维数据,也就是本文的共同资金流𝑓𝑙𝑜𝑤𝑐𝑜�。 下图展示第一主成分所能解释样本方差的比例,2015年共同资金流能解释了所有主动权益基金资金流波动的大部分信息,最高解释率达60%以上。近两年共同资金流的解释力度在30%左右。 图1:第一主成分对样本方差的解释率 70% 60% 50% 40% 30% 20% 10% 0% 2011-122012-122013-122014-122015-122016-122017-122018-122019-122020-122021-12 第一主成分方差占比 数据来源:Wind,西南证券整理 最后,对于每只股票,使用5年(20期)滚动窗口(至少有12期的非缺失观测值可用),将股票季度超额收益对共同资金流回归得到回归系数β。 𝑟�,𝑡−�=𝑎𝑖,�+𝛽𝑖,�∗𝑓𝑙𝑜𝑤�−�+𝜀𝑖,𝑡−�,�=0,1,…,20 𝑓𝑙𝑜𝑤𝑏𝑒𝑡𝑎𝑖,�=|𝛽𝑖,𝑡| 其中,r表示股票相对市场的超额收益率,市场收益率取万得全A指数收益率。对于不同股票而言,自变量共同资金流都是一样的,因此量纲一致,其回归系数的绝对值大小可比,表示自变量对因变量的影响程度。绝对值的大小直接反映自变量对因变量的影响程度,绝对值越大,共同资金流对该股票收益的影响越大。 因此,我们对共同资金流的回归系数β取绝对值得到共同资金流敞口因子,表示共同资金流对股票收益率的影响程度。 2因子有效性检验 2.1数据处理与说明 第一,因为基金净资产数据在季报中披露,因此样本数据、因子值、股票收益率均为季频数据,季度换仓,换仓时间点为基金季报披露截止时间所在的月末。比如一季报在4月份披露,在4月末换仓,持仓时间为5、6、7月份。 表3:基金报告披露说明 基金报告类型 报告期 披露截止时间 下期股票收益率 一季报 01.01-03.31 04.15 5,6,7月 二季报 04.01-06.30 07.15 8,9,10月 三季报 07.01-09.30 10.15 11,12,次年1月 四季报 10.01-12.31 次年01.15 次年2,次年3,次年4月 数据来源:西南证券整理 第二,选取所有主动权益基金计算基金的共同资金流,包括普通股票型、偏股混合型、灵活配置型和平衡混合型基金。管理期间平均股票仓位不低于60%,平均港股仓位不高于10%且各期港股仓位最高不高于20%。计算平均历史仓位时,排除首发基金前2个季度的数据(还在建仓期,仓位不稳定) 第三,使用上市交易的全部沪深A股作为回测对象,排除ST股、排除季度内停牌时间大于1个月的股票;在股票收益率同共同资金流回归当中,将股票上市后前6个月的数据剔除。 第四,回测区间为2012.01-2022.10,加上5年的回望期,样本区间为2007.01-2022.10。 2.2分组检验 为了检验因子的有效性,对共同资金流敞口因子进行分组检验。本文用过去5年基金和 股票的季度数据计算因子值,然后按照当期因子值大小将股票平均分为5组,并且计算下一季度组内等权平均收益率。本文只在基金季报披露截止时间月末调仓。 下表为因子分组检验结果。在分组检验的基础上,计算多空组合的t统计量,判断显著性。同时,根据每一组的选股结果建立投资组合,测算相应风险收益指标。结果列表如下。 表4:因子分组检验风险收益指标 组1 组2 组3 组4 组5 组1−组5 (1+2)−(4+5 因子均值 0.0004 0.0011 0.0020 0.0032 0.0072 - - 平均季度收益率 3.83% 3.43% 3.42% 2.9