金融工程专题 2023年08月10日 选基因子改进:基金持仓的尾部收益视角 金融工程研究团队 ——基金研究系列(21) 魏建榕(首席分析师) 魏建榕(分析师)张翔(分析师)何申昊(联系人) 证书编号:S0790519120001 张翔(分析师) weijianrong@kysec.cn 证书编号:S0790519120001 zhangxiang2@kysec.cn 证书编号:S0790520110001 heshenhao@kysec.cn 证书编号:S0790122080094 证书编号:S0790520110001 傅开波(分析师) 证书编号:S0790520090003 高鹏(分析师) 证书编号:S0790520090002 苏俊豪(分析师) 证书编号:S0790522020001 胡亮勇(分析师) 证书编号:S0790522030001 王志豪(分析师) 证书编号:S0790522070003 盛少成(分析师) 证书编号:S0790523060003 苏良(分析师) 证书编号:S0790523060004 何申昊(研究员) 证书编号:S0790122080094 陈威(研究员) 证书编号:S0790123070027 蒋韬(研究员) 证书编号:S0790123070037 相关研究报告 《主动权益基金的投资策略配置与选基因子增强—基金研究系列(14)》 -2022.12.11 《选基因子探索及FOF组合构建—基金研究系列(12)》-2022.9.24 《打造主动权益基金的投资策略标签体系-基金研究系列(9)》-2022.5.24 持仓alpha因子的参数寻优与下凹缺陷 持仓alpha因子的构造想法很直接,即验证基金持仓组合在未来的超额收益,作为选股能力的代理。我们首先检验基金持仓alpha因子的最优回看期。结果显示,回看期为6个月时在不同的预测期限下获得最高的IC均值及ICIR。但是,即使在最优参数下,持仓alpha因子仍然存在两大问题:下凹效应和衰减过快。 分离持仓alpha因子的下凹效应:个股贡献分布的差异 对于持仓alpha因子,我们将其视作个股贡献分布的期望值。我们发现即使两只基金具有相似的持仓alpha因子值,其背后的个股贡献分布也可能存在巨大差异。我们利用双重排序法严格划分胜率驱动组与赔率驱动组。分域检验的结果显示,胜率组即是凹性的来源,在分离后,赔率组的持仓alpha在多头具有近似线性的预测效应。以季频预测为例,赔率组下持仓alpha因子的IC均值达8.73%,ICIR为1.08,10分组多头的年化超额收益为2.88%,信息比率0.73。同时,赔率组下持仓alpha因子在长期预测中表现依然较好,前述提到的第二个问题也得以缓解。 持仓alpha因子的全域改进:尾部切割 我们尝试进一步实现全域的因子改进。上一部分的结论给了我们一项重要的启示:基金持仓alpha的构成中,尾部收益更重要。测试结果显示,在基金的个股贡献分布中截取信息纯度最高的两侧尾部可改进原始因子,我们选取截取尾部20%的barra_tail_20作为最终的改进因子。叠加分域和尾部切割,赔率组下barra_tail_20因子进一步增强:季频预测下,10分组多头的年化超额收益达3.77%,信息比率0.87。尾部切割能够改进其他代理变量下的持仓alpha因子,其中carhartalpha改进后实用性更强。 实用性讨论 在赔率组下应用barra_tail_20因子的单因子选基效果最出色。如果每期优选30只因子得分最高的基金,形成长尾alpha优选30组合,不论是季度还是半年度调仓均能相对万得偏股型基金指数(885001.WI)获得稳定超额收益:季度调仓的年化超额为5.47%,半年度调仓的年化超额为5.74%。我们给出2023年6月30日的长尾alpha优选30组合的基金名单,并利用瀑布图展示尾部alpha的构成。我们选取改进有效的barra_tail_20及carhart_tail_20因子,等权合成作为持仓尾部alpha因子。纳入持仓尾部alpha因子后,评价类合成因子的表现在各预测期限下均获得明显提升。以季度预测为例,IC由原来的10.29%提升至10.94%,ICIR由1.40提升至1.48;十分组多头年化超额由3.69%提升到4.74%,超额信息比率由0.96提升至1.17。 风险提示:选基因子基于历史信息测算,可能存在失效风险。基金投资策略分类 基于对公开的历史数据的定量测算与统计,基金管理人真实投资理念可能与之存在出入。对基金产品和基金管理人的研究分析结论不能保证未来的可持续性,不构成对该产品的推荐投资建议。 金融工程研究 金融工程专题 开源证券 证券研究报 告 目录 1、持仓alpha因子的参数寻优与下凹缺陷3 2、分离持仓alpha因子的下凹效应:个股贡献分布的差异5 3、持仓alpha因子的全域改进:尾部切割8 3.1、构建持仓尾部alpha因子8 3.2、尾部切割适用其他alpha代理变量9 4、实用性讨论10 4.1、单因子应用:长尾alpha优选30组合10 4.2、多因子应用:增强评价类选基体系12 5、风险提示14 图表目录 图1:不同参数下的持仓alpha因子的效果4 图2:持仓alpha因子的多头区分效果不佳5 图3:持仓alpha因子的定价曲线具有下凹效应5 图4:持仓alpha因子衰减很快,在长期预测中表现不佳5 图5:基金A和基金B具有相近的持仓alpha因子值,但背后的个股贡献分布差异很大6 图6:双重排序法划分胜率组和赔率组6 图7:剥离胜率组可分离下凹效应,赔率组下持仓alpha因子具有近线性的预测性7 图8:不同预测期限下,赔率组总是优于胜率组和全域7 图9:赔率组的10分组多头超额信息比率在长期预测中保持较高水平7 图10:胜率组多头的持仓组合更多暴露于模型未定义的beta8 图11:持仓尾部alpha因子构建示意图8 图12:最优的多头组表现总是出现在k<50的参数上,预测期限越长最优因子与原始因子的表现差异越大9 图13:叠加分域能够进一步增强barra_tail_20因子的效果9 图14:尾部切割能够改善基于carhart_alpha、普通收益率的持仓alpha因子10 图15:长尾alpha优选30组合相对885001.WI有稳定超额收益10 图16:大成竞争优势的持仓尾部alpha构成:寒武纪-U贡献了最多超额12 图17:持仓尾部alpha因子与基于净值的选股能力正相关,与交易能力因子负相关13 图18:纳入持仓尾部alpha因子后,合成因子的表现在各预测期限下提升13 图19:纳入持仓尾部alpha因子后,合成因子的多空对冲效果稳健14 表1:基于持仓的基金选股能力因子在各分域内T-value均不显著3 表2:持仓alpha因子的一般构造方法3 表3:2023年6月30日长尾alpha优选30组合的基金名单11 表4:开源金工评价类多因子选基体系(纳入持仓尾部alpha因子后)12 如何刻画主动基金经理的选股能力是基金研究的最重要议题之一。在专题报告 《主动权益基金的投资策略配置与选基因子增强》中,我们构建了两类度量基金经理选股能力的因子:一是基于基金真实净值,二是基于持仓组合表现。选基因子的IC测试结果显示,基于净值的选基因子大多显著有效,而基于持仓的选基因子效果不显著。 表1:基于持仓的基金选股能力因子在各分域内T-value均不显著 类别 维度 指标 全体策略 成长策略 价值策略 均衡策略 交易策略 capm_alpha 2.32 2.65 2.42 2.53 3.54 基于 hm_alpha 1.76 2.20 1.11 2.00 2.18 净值 tm_alpha 2.21 2.77 1.80 2.31 3.16 选股能力 carhart_alpha 3.63 3.27 2.69 3.43 4.63 基于brinson_stock_excess1.061.180.910.720.79 持仓barra_alpha1.441.21-0.220.721.63 数据来源:Wind、开源证券研究所(注:测试区间为2013.12.31-2022.11.30) 我们发现可以利用构成基金持仓alpha的个股贡献分布,改进基于持仓的选股能力因子(后简称持仓alpha因子),填补这一方面的空白。具体地,我们按以下框架展开: 第一部分中,我们讨论持仓alpha因子的一般构造方式,并对参数寻优。然而,即使在最优参数下,持仓alpha因子仍然存在缺陷:随着因子得分的提升,基金的预期收益在末端出现下降。 第二部分中,我们尝试利用分域解决上述缺陷。我们发现持仓alpha因子可以视作个股贡献分布的期望值,相似的持仓alpha水平背后对应着不同形态的分布。剥离不良分布的样本后,持仓alpha因子表现出更好的预测性。 第三部分中,我们利用分域研究带来的启示,切割形成尾部alpha因子,从而实现全域上的改进。除此之外,我们讨论了尾部切割方法对其他alpha代理变量的适用性。 第四部分中,我们探讨前述研究在单因子和评价类多因子选基中的实用性。 1、持仓alpha因子的参数寻优与下凹缺陷 持仓alpha因子的构造想法很直接,即将报告期披露的持仓组合作为基金经理对未来的观点,将两个报告期间的时间作为验证期,通过组合在这段时间的超额收益来验证基金经理观点的准确性,并作为选股能力的代理。以下是持仓alpha因子的一般构造方法: 顺序计算方法 表2:持仓alpha因子的一般构造方法 第一步 对于已公布的报告期持仓,假设自由涨跌,推算第j只基金每个月初对个股i的持仓权重:𝑤𝑖,� � � 第二步基于某类因子模型,计算全市场个股的月度alpha:α� 第三步聚合得到持仓组合的月度alpha:α�=∑�𝑤𝑖,𝑗α� ��� 顺序计算方法 � 第四步从能够获取的最近一个月算起,回看n个月求和,作为基金因子:α�=∑𝑡=(𝑠−𝑛):�α� 资料来源:开源证券研究所 构造中所涉及个股alpha有多种选择,如CAPM模型、Carhart四因子模型的截距项,或是个股相对所属行业指数的超额收益。本文中,我们以Barra风险模型的个股alpha为例,其alpha收益代表个股在剔除市场、行业、风格暴露后的超额收益。 在《主动权益基金的投资策略配置与选基因子增强》报告中,为了降低计算量,我们将回看期统一设定为12个月,本文我们进一步检验基金持仓alpha因子最优的回看期。图1展示了因子在不同的回看期和预测期限下的表现。可以观察到,回看期为6个月时是更好的选择,在不同的预测期限下均能获得更高的IC均值及ICIR。所以,之后的分析都将基于最优的6个月回看期进行。 图1:不同参数下的持仓alpha因子的效果 数据来源:Wind、开源证券研究所(注:测试区间为2012.12.31至2023.06.30) 但是,即使在最优参数下,持仓alpha因子仍然存在两大问题:下凹效应和衰减过快。 主要问题是因子的多头区分效果不佳:过去持仓表现最好(alpha最高)的基金在未来不再能保持领先优势。图2展示了持仓alpha因子的20分组夏普比率,可以观察到自G13以上,因子多头组合的表现就不再有明显的提升。图3绘制了持仓alpha因子的定价曲线。具体来说,我们拟合了带有二次项的Fama-Macbeth面板模型: 𝑟� ��2� (𝑡+1)=β0+𝛽1×𝑏𝑎𝑟𝑟𝑎_𝑎𝑙𝑝ℎ𝑎�+𝛽2×(𝑏𝑎𝑟𝑟𝑎_𝑎𝑙𝑝ℎ𝑎�) +ϵ(𝑡+1) 其中𝑟�为基金j在未来一个月的收益率,𝑏𝑎𝑟𝑟𝑎_𝑎𝑙𝑝ℎ𝑎�为基金j在t月的持仓 (𝑡+1)� alpha因子值。代入各参数估计值,即可计算不同因子取值下的预期收益: 𝐸[𝑟�]=β̂+β̂×𝑏𝑎𝑟𝑟𝑎_𝑎𝑙𝑝ℎ𝑎�+β̂×(𝑏𝑎𝑟