在本篇报告中,我们针对此前提出的非线性因子线性化以及动态纠正方法做出进一步探索,将插值类转换方法应用于传统因子,希望能够改善传统因子当前面临的困境,缓解因子失效现象的同时提升因子收益能力。 插值类转换方法回顾 在前期深度报告《Alpha掘金系列之三:高频非线性选股因子的线性化与失效因子的动态纠正》中,我们详细介绍过四种线性转换方法。本研究选择其中分段线性近似方法和线性插值方法对传统因子进行改进。从原理上来看,这两种方法都是根据过去因子的分位数组合收益来构建新的映射,并对当期因子值进行转换,使得过去收益率最高的分位数组合在当期对应的个股因子值更高。 大类传统因子的线性转换 我们将传统细分因子归为七个大类,并对细分因子进行筛选合成得到传统大类因子,包括一致预期因子、成长因子、动量反转因子、质量因子、技术因子、价值因子和波动率因子。我们首先对传统大类因子进行线性转换尝试。结果上来看,直接转换大类因子只能提高部分大类因子的多空组合表现,同时提升效果并不明显;从多头超额收益率来看也无法对所有因子起到增益效果。我们认为传统大类因子已包含较多来源的信息,应当对更底层的细分因子进行转换后合成,才能发挥插值方法的增益效果。 细分因子的线性转换与传统大类因子的重构 我们调整为先对各细分因子做转换,根据提升效果进行传统大类因子的重构。经过转换,七个因子大类116个细分因子中,71个细分因子的多空组合年化收益率有所改善。为了探究何种因子更适合进行插值转换,我们还提出了两个重要的因子评价指标——组合区分度和分布稳定性。这两个指标可以广泛应用于任意因子,考察其是否具有良好的性质,以及是否适合通过线性转换来提升收益表现。 我们在细分因子线性转换的基础上进行传统大类因子的重构。对于合成需要使用的细分因子,如果经过线性转换后多空组合收益表现有所提升,我们会选择用转换后的因子值替换原始因子值,否则不做替换。重新合成后,所有传统大类因子的多空组合表现均有所提升,其中重构后成长、波动率和动量反转因子提升最为明显,多空年化收益率分别从14.55%、39.78%和18.57%增大到17.28%、44.15%和22.17%,夏普比率分别从1.89、2.58和1.22增大到2.48、3.50 和2.15。多头超额收益方面除了价值因子外,其余因子在选择分段线性近似重构后都会有明显的提升,线性插值方法的提升程度相对低一些。总体而言,从细分因子入手,重构传统大类因子,提升效果明显优于直接转换大类合成因子。 风险提示 以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险;策略依据一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损。 内容目录 一、传统因子面临的问题4 二、插值类转换方法回顾4 2.1分段线性近似方法4 2.2线性插值方法5 三、传统大类因子的线性转换6 四、细分因子的线性转换与传统大类因子的重构6 4.1细分因子的转换效果7 4.2因子评价指标:组合区分度和分布稳定性7 4.3重构传统大类因子8 五、总结11 附录12 风险提示15 图表目录 图表1:一致预期、成长、反转和质量因子多空净值4 图表2:技术、价值和波动率因子多空净值4 图表3:分段线性近似方法示意图5 图表4:线性插值方法示意图5 图表5:大类因子转换前后检验指标6 图表6:成长因子转换前后多空净值6 图表7:波动率因子转换前后多空净值6 图表8:各大类细分因子转换后提升效果7 图表9:细分因子评估指标和转换前后多空收益8 图表10:因子组合区分度与多空收益8 图表11:因子组合区分度与多头超额收益8 图表12:因子分布稳定性与多空收益提升8 图表13:因子分布稳定性与多头超额收益提升8 图表14:重构使用的细分因子检验指标9 图表15:传统大类因子重构前后检验指标9 图表16:传统大类因子重构前后多空收益10 图表17:传统大类因子重构前后多头超额收益10 图表18:成长因子重构前后分位数组合表现10 图表19:成长因子重构前后多空净值10 图表20:反转因子重构前后分位数组合表现10 图表21:反转因子重构前后多空净值10 图表22:波动率因子重构前后分位数组合表现11 图表23:波动率因子重构前后多空净值11 图表24:转换前后71个细分因子的周频多空组合收益12 图表25:因子名称注解13 一、传统因子面临的问题 近年来,传统因子赛道越来越拥挤。根据跟踪计算,2020年以来,各传统的大类因子多空收益的稳定性都有出现一些下降。观察各传统的大类因子的多空净值走势,我们发现:质量因子和成长因子分别在2021年和2022年产生了较大回撤,反转因子和价值因子前期表现低迷,2022年开始才有所回升,而一致预期、技术和波动率因子的多空净值虽然在逐年增加,但呈现出波动放大趋势。总体而言,现阶段各大类基本面因子稳定预测股票未来收益的能力面临着一定的挑战。 图表1:一致预期、成长、反转和质量因子多空净值图表2:技术、价值和波动率因子多空净值 2 1.5 1 0.5 0 4 3.5 3 2.5 2 1.5 1 0.5 0 一致预期成长反转质量技术价值波动率 来源:Wind,国金证券研究所 注:大类因子回测股票池选取全部A股,分位数组合测试分10组,每周末调仓。 来源:Wind,国金证券研究所 在前期深度报告《Alpha掘金系列之三:高频非线性选股因子的线性化与失效因子的动态纠正》中,我们提出了四种线性转换方法,它们既能够大幅改善因子的线性特征,又可以对部分时间段失效的因子进行动态纠正,使因子对股票未来收益的有效预测更加持续和稳定,从而明显提升多空组合的年化收益。对于高频价格区间占比因子,四种转换方法都能优化因子的多空表现,提升比例相差也不是很大。但相比之下,分段线性近似和线性插值这两种插值类方法的原理更简单,操作流程更简洁,而且由于因子回测分组数量通常设置为10组,转换时的计算成本也相对小很多,具有一定的优势。因此,本研究选择将插值类转换方法应用于传统基本面因子,希望这两种方法能够对传统基本面因子也发挥出强大的作用,改善传统基本面因子当前面临的困境,缓解因子失效现象的同时提升因子收益能力。 在文章的第二部分,我们首先回顾分段线性近似方法和线性插值方法的原理和操作流程。接着,使用这两种方法对传统大类因子进行转换。但是我们发现,直接转换大类合成因子只能明显提高成长因子和波动率因子的多空组合表现,对其余的基本面因子并不奏效。于是,我们考虑调整为先对各大类的细分因子做转换,根据提升效果进行传统大类因子的重构。结果表明,除一致预期因子外,这种间接转换方式能够提升所有传统大类因子的多空组合年化收益,值得关注。 此外,本研究还提出了两个重要的因子评价指标——组合区分度和分布稳定性。这两个指标可以广泛应用于任意因子,考察其是否具有良好的性质,以及是否适合通过线性转换来实现多空收益的提升。 二、插值类转换方法回顾 在深度报告《Alpha掘金系列之三:高频非线性选股因子的线性化与失效因子的动态纠正》中,我们详细介绍过四种线性转换方法,并验证了它们在提升高频价格区间占比因子多空组合表现方面的效果。这里,为方便读者理解后文,我们对分段线性近似方法和线性插值方法的原理和操作流程做简单的回顾。本文重点关注传统基本面因子,因此我们将以周频换仓为例进行陈述。 2.1分段线性近似方法 使用分段线性近似方法,首先需要在每周的交易日对待转换因子历史收益率的分布情况进行分析。我们按照因子值从高到低,等分等权构建�个股票组合,并根据各组合在过去�周的平均收益情况,计算每个组合相对于全部股票等权基准的超额收益率,从而得到该因子在截面上分组收益率的分布。 我们假设该分布在未来一段时间内会保持稳定,因此可以通过这一分布情况来对不同分组内股票的未来收益进行预测。为了化简问题,我们只选择边界、超额收益率的极大值点和极小值点对应的组合作为节点。在每个节点之间,利用线性插值进行近似,从而将全部股票的因子值转化为超额收益率的预测值,完成线性转换。在这里,为了避免因子原始取值的统计分布可能出现时变的特征,我们使用因子值截面的百分位数。此外,下方示意图中的多头组合和空头组合为原始因子值排名最高和最低的两个组合,即边界。 图表3:分段线性近似方法示意图 来源:国金证券研究所 根据收益率最高和最低的分位数组合所处的位置,可以有不同的分段函数构建方法,我们以上方示意图中极大值点和极小值点所处位置的情况进行举例,其转换后因子值的计算公式为 𝑟𝑚𝑎�−𝑟𝑡𝑜� ﻟ𝑟𝑡𝑜�+� −� ·(�−𝑥𝑡𝑜𝑝),�>𝑥𝑚𝑎� I𝑚𝑎� � 𝑡𝑜� 𝑥𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟�= ❪ 𝑟𝑚𝑎� +𝑚𝑖�−𝑟𝑚𝑎�·(�−� 𝑥𝑚𝑖�−𝑥𝑚𝑎� 𝑚𝑎� ),� 𝑚𝑖� <�≤� 𝑚𝑎� I� �𝑚𝑖� +𝑟𝑏𝑜𝑡𝑡𝑜�−𝑟𝑚𝑖�·(�−� 𝑥𝑏𝑜𝑡𝑡𝑜�−𝑥𝑚𝑖� 𝑚𝑖� ),�≤� 𝑚𝑖� 其中,�表示转换前因子值对应的百分位数,𝑥𝑡𝑜�和𝑥𝑏𝑜𝑡𝑡𝑜�分别表示多头组合和空头组合因子值百分位数的中位数,𝑟𝑡𝑜�和𝑟𝑏𝑜𝑡𝑡𝑜�分别表示多头组合和空头组合过去�周的年化超额收益率,𝑥𝑚𝑎�和𝑥𝑚𝑖�分别表示极大值点和极小值点组合因子值百分位数的中位数,𝑟𝑚𝑎�和𝑟𝑚𝑖�分别表示极大值点和极小值点组合过去�周的年化超额收益率。当极大值和极小值点的位置发生变化时,该分段方法也应该进行调整。 2.2线性插值方法 使用线性插值方法进行线性转换,在每周的交易日,也需要按照因子值从高到低,等分等权构建�个股票组合,并根据各组合在过去�周的超额收益率情况,依次从第1个组合开始,利用第�个组合与第�+1个组合因子值百分位数的中位数以及两个分组的超额收益率进行线性插值。自然地,构建�个分位数组合,会得到有�−1个分段的线性插值函数。在这里,我们假设第�个组合中股票因子值百分位数的中位数对应了该分组的平均超额收益率。 对于�取10分组的情况,下方示意图可以做较好的展示。得到每个分段的线性关系后,可以把原始因子值根据其在截面上的百分位数转换为对超额收益率的预测值,从而完成线性转换,两端区间外的数据将根据对应函数进行外延。 与分段线性近似方法类似,线性插值方法也假设每个子区间内股票收益随因子的排序数值线性变化。值得一提的是,分段线性近似方法未能将全部分组的数据用于建模,与之相比,线性插值方法充分利用了�个分位数组合的历史收益率信息,其对不同分段收益率的刻画更加精细,损失的信息相对较少。 图表4:线性插值方法示意图 来源:国金证券研究所 三、传统大类因子的线性转换 在简单回顾分段线性近似方法和线性插值方法之后,需要考虑如何将它们应用于传统基本面因子。通常情况下,我们会把传统基本面的所有细分因子归为七个大类,分别合成得到一致预期因子、成长因子、动量反转因子、质量因子、技术因子、价值因子和波动率因子。这些大类合成因子能够反映一类细分因子的整体风格,因此,我们一般直接使用大类合成因子的过往表现来预测股票的未来收益。在这里,我们同样选择直接对大类合成因子进行线性转换,并通过回测评估两种转换方法能否提升大类合成因子对股票未来收益的预测能力。因子回测股票池为全部A股,时间范围为2017年1月至2023年12月,分位数组合测试分10组,周频换仓,交易价格为上一周的收盘价。线性转换时,�取 10分组,�取过去52周。 下表统计了线性转换前后各传统大类因子的表现。转换后传统大类因子的IC稍有下降。从多空组合年化收益率来看,只有成长因子、反转、价值和波动率因子提升明显。其中,使用分段线性近似方法,成长因子的多空年化收益从13.71%增大到14.77%,波动率因子的