您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[光大证券]:量化选股系列报告之十四:因子分域初探:确定分域方式 - 发现报告
当前位置:首页/宏观策略/报告详情/

量化选股系列报告之十四:因子分域初探:确定分域方式

2024-09-28祁嫣然、张威光大证券付***
AI智能总结
查看更多
量化选股系列报告之十四:因子分域初探:确定分域方式

2024年9月27日 金融工程 因子分域初探:确定分域方式 ——量化选股系列报告之十四 要点 因子分域建模尤为重要 传统多因子模型,是按照股票因子值在全市场对其进行排序,然后打分——这种方式将所有股票同等看待。通常,不同股票的基本面、量价等属性存在较大区别。低估值、规模较大、持续支付股息的蓝筹股,和高估值、规模较小、股息支付不稳定的成长股,可比性较差。因此,对股票分域建模显得尤为重要。 因子分域研究主要应用在因子计算和因子合成 我们尝试探究因子分域的应用,而因子分域方式多种多样,本篇报告主要介绍因子分域的研究框架,即解决因子如何分域的问题。因子分域研究主要分为两部分:因子计算和因子合成。 分域法应用于因子计算较为常见,首先选定一个特征将股票划分成多个域,再对不同分域内的股票差异化计算因子。常见的因子计算分域方式有很多,比如按照行业划分,将因子不适用的行业因子值设置为市场中位数;再比如按照风格因子划分,探究不同市值、估值等风格下,因子的不同表现。除了应用于因子计算以外,因子合成阶段也可以使用分域法,市场中已有研究如动态情景模型等就是如此。 因子分域后,相较于原始因子,表现提升明显 因子计算分为截面分域和时间序列分域,截面分域又细分为离散型分域和连续型分域,我们以估值因子、早盘收益因子以及反转因子为案例,详细介绍了各类分域方式的原理。从分域结果来看,分域后因子表现相较于原始因子均具有不同程度提升。 在因子合成阶段,不同因子具备不同的表达,因子可分为线性和非线性因子,可使用不同学习模型去拟合不同类型的因子,再进行合成,我们称之为多模型拟合。此外,当因子计算阶段的单个因子拓展到多个因子时,也需要合成。我们以同花顺量化因子为例,回测结果表明分域后因子表现显著提升。 风险分析:报告结果均基于历史数据,历史数据存在不被重复验证的可能。 作者分析师:祁嫣然 执业证书编号:S0930521070001010-57378031 qiyanran@ebscn.com 分析师:张威 执业证书编号:S0930524070004 010-57378050 zhangw@ebscn.com 相关研报日内收益的精细切分:提炼动量与反转效应——量化选股系列报告之二(2021-10-22) 目录 1、因子分域建模的逻辑4 2、因子分域建模应用场景综述6 2.1因子计算6 2.1.1截面分域6 2.1.2时序分域7 2.2因子合成10 2.2.1多模型拟合10 2.2.2分域合成12 3、总结14 4、风险提示15 中庚基金 图目录 图1:反转因子-净值曲线4 图2:反转因子分域多空组合净值对比4 图3:反转因子分域多头组净值对比5 图4:反转因子分域空头组净值对比5 图5:因子分域框架5 图6:估值因子-净值曲线6 图7:估值因子分域多空组合净值对比6 图8:市值加权估值因子多空组合净值对比7 图9:早盘收益因子-分组净值曲线8 图10:早盘收益因子多空组合净值曲线8 图11:改进早盘收益因子-分组净值曲线8 图12:改进早盘收益因子多空组合净值曲线8 图13:反转因子-分组净值曲线9 图14:改进反转因子-分组净值曲线9 图15:反转因子和改进反转因子多空组合净值曲线9 图16:反转因子和改进反转因子多头组净值对比9 图17:因子多头组净值10 图18:等权因子和加权因子多头组净值对比10 图19:非线性因子转换为线性因子图示11 图20:因子分域建模图示11 图21:同花顺量化因子数据库12 图22:同花顺量化因子多空组合净值曲线13 图23:风格因子分域结果展示(RankIC)13 图24:同花顺量化因子-分域多空组合净值曲线对比14 表目录 表1:估值因子业绩指标对比6 表2:市值加权估值因子业绩指标对比7 表3:早盘收益因子业绩指标对比8 表4:反转因子业绩指标对比(多空组合)9 表5:反转因子业绩指标对比(多头组)10 表6:因子说明10 表7:同花顺量化因子说明12 表8:同花顺量化因子业绩指标对比13 表9:流动性因子分域同花顺因子业绩对比14 1、因子分域建模的逻辑 传统多因子模型,是按照股票因子值在全市场对其进行排序,然后打分——这种方式将所有股票同等看待。通常,不同股票的基本面、量价等属性存在较大区别。低估值、规模较大、持续支付股息的蓝筹股,和高估值、规模较小、股息支付不稳定的成长股,可比性较差。因此,对股票分域建模显得尤为重要。 传统分域建模的逻辑是基于不同股票池下因子的表现不同,进而对因子的权重进行重新调整,增厚收益。最常见的是对不同行业使用不同的因子。 按照行业建模的通常做法是不同行业内差异化计算因子,将因子不适用的行业中的股票因子值设置为全市场股票因子值的中位数,然后再进行多因子合成;另一种方式是根据行业内显著有效的因子,对股票单独打分,再汇总所有行业,得到全市场股票的综合得分。 此外,还可以按照盈利等风格特征,将股票划分到不同域。例如60日反转因子 (本章下文简称为“反转因子”),利用“单季度ROE同比”将其分域,可以发现分域前后因子表现区别明显。这样分域的逻辑在于前期超跌的股票,其基本面并没发生明显恶化,其股价后续大概率能反弹回合理的价格区间。 我们按照“单季度ROE同比”从大到小将全市场股票分为2组,分别为Big组和Small组,反转因子在两组股票池中的表现区别明显。可以发现,反转因子多空组合在Small组中表现更佳。详细拆解多空组合收益可以发现,Small组中的空头组,贡献了较多负收益。 图1:反转因子-净值曲线图2:反转因子分域多空组合净值对比 667 5 4 3 2 1 0 56 45 34 23 2 1 1 0 0 空头组多头组多空净值(右轴) 多空组合(单季度ROE同比:Big)多空组合(单季度ROE同比:Small) 资料来源:Wind,光大证券研究所;统计区间:2014.01.03-2024.08.30资料来源:Wind,光大证券研究所;统计区间:2014.01.03-2024.08.30 从绝对收益角度来看,多头组(Big)>多头组(Small),空头组(Big)>空头组(Small)。反转因子在结合单季度ROE同比因子后,多头组绝对收益有所提升,但空头组股票,贡献了较多负收益。 由于A股市场做空的限制,采用单季度ROE同比因子对反转因子进行分域的方式,能够提供一定的增量信息,我们认为单季度ROE同比因子明显区分了反转因子。因此,可以按照单季度ROE同比因子将股票分域,然后在单季度ROE同比较高的股票池中提高反转因子权重,单季度ROE同比较低的股票池中降低反转因子权重。 图3:反转因子分域多头组净值对比图4:反转因子分域空头组净值对比 7 3 2.5 2 1.5 1 0.5 0 6 5 4 3 2 1 0 多头组(单季度ROE同比:Big)多头组(单季度ROE同比:Small) 空头组(单季度ROE同比:Big)空头组(单季度ROE同比:Small) 资料来源:Wind,光大证券研究所;统计区间:2014.01.03-2024.08.30资料来源:Wind,光大证券研究所;统计区间:2014.01.03-2024.08.30 基于上述发现,我们尝试探究因子分域的应用,而因子分域方式多种多样,本篇报告作为系列第一篇,主要介绍因子分域的研究框架,即解决因子如何分域的问题。本文的因子分域研究框架如下,主要分为两部分:因子计算和因子合成。 因子计算:因子计算细分为截面分域和时间序列分域,截面分域又细分为离散型分域和连续型分域,在后文中我们将详细介绍其原理。 因子合成:不同因子具备不同的表达,因子可分为线性和非线性因子,可使用不同学习模型去拟合不同类型的因子,再进行合成,本文称之为多模型拟合。此外,因子计算阶段中的分域,拓展到多个因子层面,即是因子合成。 图5:因子分域框架 截面分域 离散型分域、连续型分域 因子计算 时序分域 因子在时序上的分域 因子分域 多模型拟合 多因子分域建模 因子合成 分域合成 因子分域合成、动态情景Alpha模型 资料来源:光大证券研究所绘制 2、因子分域建模应用场景综述 因子分域的研究在市场中由来已久,在多因子框架下,分域一般会应用在两个步骤:因子计算和因子合成。 分域法应用于因子计算较为常见——首先选定一个特征将股票划分成多个域,再对不同分域内的股票差异化计算因子。常见的因子计算分域方式有很多,比如按照行业划分,将因子不适用的行业因子值设置为市场中位数;再比如按照风格因子划分,探究不同市值、估值等风格下,因子的不同表现。除了应用于因子计算以外,因子合成阶段也可以使用分域法,市场中已有研究如动态情景模型等就是如此。 2.1因子计算 2.1.1截面分域 截面分域,又分为离散型分域和连续型分域。我们在上一章中,使用单季度ROE同比对股票进行分域的方式,即是离散型分域。 离散型分域的案例较多,以估值因子为例,估值因子无论在学术界还是投资界都是关注度较高的价值类因子。如果按照市值将股票划分为大市值和小市值两个域,我们发现估值因子在小市值域内存在稳健的收益,而在大市值域内的表现与全市场的表现较为一致——对于估值因子来说,市值风格就是一个有效的分域。 图6:估值因子-净值曲线图7:估值因子分域多空组合净值对比 73.54 63 5 2.5 4 2 3 1.5 2 11 0 0.5 3.5 3 2.5 2 1.5 0.5 1 空头组多头组多空组合(右轴) 小市值域大市值域 资料来源:Wind,光大证券研究所;统计区间:2014.01.03-2024.08.30资料来源:Wind,光大证券研究所;统计区间:2014.01.03-2024.08.30 表1:估值因子业绩指标对比 总收益率 年化 收益率 年化 波动率 夏普比率 最大回撤 最大回撤起始日期 最大回撤月度截止日期胜率 周频 RankIC 全域213.74% 11.64% 5.23% 1.65 7.80% 2015/1/5 2015/5/2165.63% 3.85% 大市值233.37%12.30% 分域 6.07%1.538.56%2019/4/192020/7/1066.41%3.60% 小市值261.41%13.18%4.60%2.215.36%2015/1/52015/6/275.00%4.94% 分域 资料来源:Wind,光大证券研究所;统计区间:2014.01.03-2024.08.30 与离散型分域不同的是,连续型分域使用分域因子对目标因子进行连续分域。以上述估值因子和市值因子为例,除了在截面上根据市值大小将股票池分为大小市值两组外,我们还可以对估值因子进行简单的市值加权,提升小市值股票的估值因子权重,即可实现连续型分域。 𝑤𝑒𝑖𝑔ℎ�𝑓𝑎𝑐𝑡𝑜�=�×|𝑥|� |𝑥| 𝑤𝑒𝑖𝑔ℎ�=𝑤𝑒𝑖𝑔ℎ�𝑓𝑎𝑐𝑡𝑜� ∑𝑤𝑒𝑖𝑔ℎ�𝑓𝑎𝑐𝑡𝑜� 上述公式中,x为对数市值的倒数。参数n越大,权重越向x正方向集中。 下图展示了n=4时,市值因子加权估值因子的回测结果。从回测表现来看,提升了小市值股票的因子值权重之后,估值因子的表现提升明显。因子总收益率从213.74%提升至346.36%,周频RankIC从3.85%提升至了4.69%;月度胜率从65.63%提升至了74.22%。 图8:市值加权估值因子多空组合净值对比 4.5 4 3.5 3 2.5 2 1.5 0.5 1 加权因子原始因子 资料来源:Wind,光大证券研究所;统计区间:2014.01.03-2024.08.30 表2:市值加权估值因子业绩指标对比 总收益率 年化 收益率 年化 波动率 夏普比率 最大回撤 最大回撤起始日期 最大回撤月度截止日期胜率 周频RankIC 原始因子213.74% 11.64% 5.23% 1.65 7