摘要 本文核心将基金持仓股票的视角转换为股票同时被几只基金持有(即共同持有数量),探究共同持有数量与股票下一期表现之间的关系,同时提出需要考虑的三因素:1、共同持有数量因素;2、累积收益相关性因素;3、基金业绩因素,提出了三因素共同持有数量概念。为了提升获取完整持仓的频率,更好的探究共同持有数量与股票表现之间的关系,本文构建了核心股票池的二维基金持仓还原法,每季度还原完整持仓。最后,为了进一步增强三因素共同持有数量因子的表现,本文引入低波因子20日正收益方差,构建低波增强三因素共同持有数量因子,经测算效果显著。 持仓还原:基于构建核心股票池的二维持仓还原方法 第一维:真实持仓还原。首先加入基金报告披露的前十大重仓股,其次遍历股票在同报告期披露的前十大流通股东,将前十大重仓股中出现本基金的股票加入持仓还原。最后,依托于同基金经理对不同产品的管理逻辑类似的逻辑,加入同基金经理管理的其他产品的持仓。 第二维:模拟持仓还原。在该时间截面上所有基金均完成了第一维持仓还原的情况下,根据未完全还原完成的行业构建备选股票池,并根据备选股票池筛选出与基金收益率相似度较高的股票从而得到核心股票池。最后利用时间半衰加权最小二乘法确定各个股票的权重,完成最终的持仓还原。 选股因子构建:低波增强三因素共同持有数量因子 基于二维持仓还原方法,有效提升了获取基金完整持仓的频次。但是此时获取基金完整持仓仍然是一季度一次,为了基于基金持仓构建出更高频次的选股因子,本文基于基金收益与持股收益的相关性,对每个报告期得到的完整持仓进行相应的修正,并进行月度延递。 本文基于三个考虑因素:持有数量因素、收益率相关性因素以及基金业绩因素,构建三因素共同持有数量因子(三因素单因子),并引入低波因子“20日正收益方差因子”进行进一步增强(增强三因素因子)。其中增强因子的构建方法为分别构建三因素共同持有数量因子和20日正收益方差因子,并对两者进行滚动3期RankIC加权进行因子合成。基金业绩取决于持仓股票的表现,而当期被多家业绩优秀基金持有的股票,且这些股票波动较高,则下一期大概率会出现不同程度的下降。 信息系数测试:三因素共同持有数量因子RankIC均值6.31%,IC均值-3.35%,年化收益13.22%,最大回撤16.55%;基于低波增强的三因素共同持有数量因子RankIC达10.43%,IC值达7.28%,年化收益18.57%,最大回撤22.39%。 分组测试:在5分组测试中,三因素单因子与增强三因素因子具备明显的单调性。其中三因素单因子多头组合年化收益9.00%,最大回撤26.55%;增强三因素因子多头组合年化收益达16.15%,最大回撤22.35%,年化波动16.17%,且多头组合相对中证800指数具备明显的超额收益。 多空组合测试:三因素单因子多空组合年化收益20.50%,最大回撤15.35%,年化波动14.93%,而增强三因素因子多空组合年化收益38.14%,最大回撤15.64%,年化波动15.21%,相较于三因素单因子多空组合具备一定程度的提升。可见增强三因素因子对三因素单因子具备明显的增强效应。 组合及组合特征:本文分别于2023年8月和9月,根据增强三因素因子筛选出前20与后20的股票,分析该40只股票的组合特征。其中8月前20只股票9月平均涨跌幅为-0.25%,后20只股票9月平均涨跌幅为-5.71%,当期中证800涨跌幅-1.71%,前20只股票成功实现正超额。 风险提示:此二维持仓还原方法的构建以及选股因子的构建与对应的相关结论完全基于公开的历史数据进行算法构建、统计以及计算,文中部分数据有一定滞后性,同时也存在第三方数据提供不准确或者缺失等风险;对基金持仓还原的研究分析与选股因子效果结论仅针对于回测区间得出,并不预示其未来表现,也不能保证未来的可持续性,亦不构成投资收益的保证或投资建议。 1三因素共同持有数量简述 公募基金的持仓中蕴含了大量值得挖掘与研究的信息,其在当期针对不同股票的持仓往往体现出基金经理在当前时点对这些股票的观点与看法,基金业绩的优秀与否往往取决于其持仓股票的表现。 首先我们站在的视角是,如果一只股票在当期同时被多只主动权益基金持有,代表了当期该只股票被多只基金看好,同时我们也可以转换视角,即通过每只股票同时被几只基金持有,来研究各个股票的特征。综上,我们提出共同持有数量的概念,即股票当期被几只基金持有,进一步思考:当期同时被多家基金持有的股票下一期是否还会保持较好的表现? 基于上述问题,本文罗列了研究共同持有数量需要考虑的3个因素如下: 1)持有数量因素:考虑每只股票在当期同时被几只基金持有; 2)累计收益率相关性因素:考虑到持仓还原的股票中,并非所有的股票都是基金经理在“看好”的前提下配置的股票以及持股权重等因素,某些权重极低的股票其实与基金的相关性较低,因此引入考虑因素:过去一个月基金与持仓股票累积收益的相关性。 3)基金业绩因素:基金持有股票代表基金对该股票的观点与看法,而且基金表现往往取决于持仓股票的表现。但是考虑到并非所有的基金在所有的时间点都有良好的业绩,较差业绩的基金意味着其持仓股票表现也不尽如人意,因此在考虑上述两个因素的基础上引入因素:过去一个月基金业绩排名百分比。 为研究共同持有数量的三个需要考虑的因素,需得到当期所有基金的完整持仓,首先构建了基于构建核心股票池的二维基金持仓还原方法。即本文策略核心是在拥有更高频次获取完整持仓的基础上,进行对共同持有数量的三个因素的研究并构造选股因子。 2基于构建特殊股票池的二维公募基金持仓还原法 2.1预设条件 公募基金目前只有在每年3月末披露的年报和8月末披露的年报和半年报中才会包含完整持仓。为了进一步提升获取全部持仓的频率,本文主要针对季度报告,根据前十大重仓股和证监会行业配比进行对季度持仓的逐步还原。 表1:基金持仓还原时间点示意 基金样本池筛选:对于需要进行持仓还原的基金,我们对每期基金池的构建设置如下筛选条件: 1)混合型基金和股票型基金。 2)各个基金在本期的股票仓位大于等于70%。 3)考虑到新成立基金拥有一定时间的建仓期,因此对基金成立时间设置的筛选条件为:基金成立日不得晚于当期的前两个季度。 4)还原区间设为2019年H1报告发布月末至2023年 H2 报告发布月末,即2019-08-31至2023-08-31。 图1:持仓还原每期基金数 2.2二维持仓还原方法介绍 本文将基金持仓还原方法步骤分为两个维度:真实持仓还原和模拟持仓还原。 维度一“真实持仓还原”:对于基金季报披露的前十大重仓股,遍历当期全部上市公司的前十大流通股东,根据该基金的持股数和报告期该股票的收盘价,计算出基金的持股市值,并折算成该股票在该基金的持仓比例。其次,基于同基金经理对不同产品的管理逻辑类似的假设条件,在满足一定的持仓相似度的情况下,我们加入同基金经理本期管理的其他产品的前十大重仓股持仓,并结合相应的权重计算方法对满足条件的股票计算其在本基金的持仓比例。 维度二“模拟持仓还原”:在时间截面所有基金都完成真实持仓还原的基础上,开始对本基金进行模拟持仓还原。模拟持仓还原的核心思想在于构建特殊备选公共股票池,再基于此构建核心股票池,通过加权最小二乘回归WLS方法确定核心股票池中各个股票的权重。 首先,本文构建持仓相似度计算公式,筛选出与本基金持仓相似度较高的基金,将其真实持仓阶段还原的股票加入股票池;其次,由于本基金相邻两期持仓可能具备一定相似度,我们再将本基金上一期的完整持仓加入股票池;最后,针对备选股票池中没有覆盖且未完全还原完成的行业放入相应的股票,完成特殊备选股票池的构建。基于特殊备选股票池和未还原完成行业的剩余权重,本文构建了特殊的股票数量计算公式并对备选股票池进行筛选,最终得到核心股票池。 图2:二维基金持仓还原流程 本文对还原完成的持仓做出相应的细节刻画。真实持仓还原中,若基金经理在管的其他产品持仓出现在前十大重仓股和上市公司前十大流通股东中,则进行去重操作,同理在构建特殊备选股票池时,需要对真实持仓还原完成的股票做同样的去重操作。此外,真实持仓还原完成后的持仓也会出现行业权重溢出的情况,此时需要对股票权重做相应的缩放以达到满足行业权重配比的要求,值得注意的是,持仓权重缩放的范围不应该包含前十大重仓股和上市公司前十大流通股。为了方便叙述,本段内容将不会在后续介绍中赘述。 对于给定的截面日期𝑑𝑎𝑡𝑒和给定的基金𝐹,具体的持仓还原流程如下: 维度一:真实持仓还原 加入股票:前十大重仓股(基金季报披露); 计算权重:遍历当期全部上市公司披露的前十大流通股东数据,假设基金F是股票S的前十大流通股东,则通过如下公式折算出股票S在基金F中的权重 ⁄ × 𝑃) 𝑁𝑒𝑡 𝜔= (𝑠ℎ𝑎𝑟𝑒ℎ𝑜𝑙𝑑𝑖𝑛𝑔 𝑠 𝐹𝑆 𝑠 𝐹 其中𝑠ℎ𝑎𝑟𝑒ℎ𝑜𝑙𝑑𝑖𝑛𝑔表示基金𝐹对股票S的持股数,𝑃表示股票𝑆在报告期末的收盘价,𝑠ℎ𝑎𝑟𝑒ℎ𝑜𝑙𝑑𝑖𝑛𝑔 𝐹𝑆 𝑠 × 𝑃表示基金𝐹对股票𝑆的持股市值,𝑁𝑒𝑡表示基金𝐹在报告期内的基金净值。 𝐹𝑆 𝑠 𝐹 基金经理管理的其他产品持仓:读取该基金的基金经理,并找到该基金经理在管的其他基金季报披露的前十大重仓股。假设该基金经理除本基金外,在管的其他满足一定持仓相似度条件下的基金个数为N,对于股票𝑆,取N个基金权重的均值,同时还要考虑权重不能超过本基金的第十大重仓股权重,也不能超过各自股票披露的第十大流通股东经折算后在本基金对应的权重。计算股票𝑆在基金𝐹中权重𝜔的数学公式如下: 𝐹,𝑠 ⁄ 𝜔 = min{∑ 𝜔 𝑁, 𝜔 , 𝑤𝑒𝑖𝑔ℎ𝑡 } 𝐹,S 𝑠,𝑛 𝐹,10 𝑠,10 其中𝜔重;𝑤𝑒𝑖𝑔ℎ𝑡 表示股票S在第𝑛个基金中的权重;𝜔 表示本基金F在截面上第十大重仓股权 S ,𝑛 𝐹 ,10 表示股票S的第十大流通股东对应折算在本基金中的权重。 S ,10 维度二:模拟持仓还原(备选股票池的构建) 注 :在时间截面上所有基金均完成真实持仓还原的前提下进行模拟持仓还原。 首先构建备选股票池:对于真实持仓还原阶段未还原完成的行业(𝑖𝑛𝑐𝑜𝑚𝑝𝑙𝑒𝑡𝑒 _𝑖𝑛𝑑𝑢𝑠𝑡𝑟𝑦)构建备选基金池。提取本基金真实持仓还原的持仓𝑝𝑜𝑟𝑡𝑖𝑓𝑜𝑙𝑖𝑜,计算𝑝𝑜𝑟𝑡𝑖𝑓𝑜𝑙𝑖𝑜与其它各个基金的持仓相似度,并选取持仓相似度排名前10%的基金持仓放入备选股票池。此外,将本基金在上一期的持仓也加入到公共股票池。其中持仓相似度的计算如下: 𝐹 𝐹 𝑐𝑜𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑒 = 0.7 × 𝑐𝑜𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑒 + 0.3 × 𝑐𝑜𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑒 𝑖𝑛𝑑 𝑠𝑡𝑜𝑐𝑘 上述公式中,coincidence 表示行业持仓相似度,coincidence 表示个股持仓相似度。 𝑖𝑛𝑑 𝑠𝑡 𝑜𝑐𝑘 我们认为持仓相似可以分解为行业相似度和个股相似度,其中行业相似度和个股相似度的公式分别为: coincidence = ∑ min{𝜔 , 𝜔 } 𝑖𝑛𝑑 𝐴 ,𝑖𝑛𝑑 𝐵,𝑖𝑛𝑑 𝑖 𝑖 coincidence = ∑ min{𝜔 , 𝜔 } 𝑠𝑡𝑜𝑐𝑘 𝐴 ,𝑠𝑡𝑜𝑐𝑘 𝐵 ,𝑠𝑡𝑜𝑐𝑘 𝑗 𝑗 其中𝜔 表示组合A对行业𝑖配置的权重,𝜔 表示组合A对股票𝑗配置的权重,同理 𝐴 ,𝑖𝑛𝑑 𝐴 ,𝑠𝑡𝑜𝑐𝑘 𝑖