金工专题报告20230904 证券研究报告·金融工程·金工专题报告 万流归宗多因子系列研究(一)——基于量价因子的多因子决策树 前言 从《量稳换手率选股因子——量小、量缩,都不如量稳?》到《换手率变化率的稳定GTR因子——助推换手率的所有家族成员》,东吴金工在过去两年中发布了共计15个各具特色的量价类选股单因子。2023年上半年,大量选股因子包括部分量价类因子,出现了同时失效的情况,我们希望通过构建多因子模型的方式来降低单因子失效的风险。 传统的多因子模型,往往是在不同大类因子间做组合,如在估值类因子、一致预期类因子、技术类因子间做一个合成因子。每个大类因子内部,往往是采用等权相加或是挑选近期表现最好的因子作为代表等较为简单的方法来进行处理。我们希望能找到一个多因子模型,既能够在不同类因子间使用,也能够在同大类因子内使用,使我们的大类合成因子不仅能够比最好的单因子好,也能比等权组合好。 多因子决策树框架 基于量价因子的决策树框架,其底层模型包含3种线性滤波模型与4种非线性模型,通过构建综合得分矩阵与信息偏离度矩阵,能够合理调用底层模型,对因子进行分类合成。通过类决策树的构架,层层递进,直到合成最终因子。 通过决策树框架合成的最终因子,其绩效表现全面战胜作为基准的等权组合以及最好的单因子。以2006/01/01-2023/07/31为回测区间,合成因子在全体A股中的月度IC均值为-0.086,年化ICIR为-3.028;十分组多空对冲的年化收益为39.60%,年化波动为11.83%,信息比率为3.349,月度胜率为80.00%,最大回撤为9.20%。 风险提示:模型所有统计结果均基于历史数据,未来市场可能发生重大变化;单因子的收益可能存在较大波动,实际应用需结合资金管理、风险控制等方法;模型测算可能存在相对误差,不构成实际投资建议。 2023年09月04日 证券分析师高子剑 执业证书:S0600518010001 021-60199793 gaozj@dwzq.com.cn 研究助理凌志杰 执业证书:S0600123040053 lingzhj@dwzq.com.cn 1/42 东吴证券研究所 内容目录 1.引言5 2.传统的多因子组合方法6 2.1.等权6 2.2.ICIR7 2.3.横截面因子值回归下一期收益率8 2.3.1.学术常用方法8 2.3.2.最小二乘法9 2.3.3.岭回归10 3.线性多因子的组合11 3.1.横截面因子回归本期收益率11 3.2.滤波方法13 3.2.1.小波滤波13 3.2.2.卡尔曼滤波15 3.2.3.高斯滤波16 3.2.4.线性模型总结18 4.非线性多因子组合方法18 4.1.支持向量回归(SVR)18 4.2.XGBOOST20 4.3.随机森林21 4.4.神经网络23 5.多因子模型的灵活应用24 5.1.东吴金工单因子的表现24 5.2.东吴金工单因子的截面时序相关性、共线性、综合得分24 5.3.主成分分析在同类因子中的应用26 6.基于相关性和共线性和信息偏离度的多因子决策树模型28 6.1.多因子决策树模型28 6.2.多因子决策树推演29 6.2.1.第一层推演29 6.2.2.第二层推演31 6.2.3.第三层推演33 6.2.4.合成因子34 6.2.5.合成因子的分年度表现35 6.2.6.纯净化合成因子36 6.2.7.合成因子的多空收益分解38 6.2.8.其他样本空间的情况38 7.总结40 8.风险提示41 2/42 东吴证券研究所 图表目录 图1:等权多因子组合十分组及多空对冲净值走势6 图2:ICIR多因子组合十分组及多空对冲净值走势8 图3:最小二乘法预测版十分组及多空对冲净值走势9 图4:岭回归预测版十分组及多空对冲净值走势11 图5:最小二乘法拟合版十分组及多空对冲净值走势12 图6:岭回归拟合版十分组及多空对冲净值走势12 图7:小波滤波拟合版十分组及多空对冲净值走势14 图8:卡尔曼滤波拟合版十分组及多空对冲净值走势16 图9:高斯滤波十分组及多空对冲净值走势17 图10:支持向量回归十分组及多空对冲净值走势19 图11:XGBOOST十分组及多空对冲净值走势20 图12:随机森林十分组及多空对冲净值走势22 图13:ANN的十分组及多空对冲净值走势23 图14:东吴金工因子截面时序的相关性25 图15:东吴金工因子截面时序的共线性25 图16:东吴金工因子截面时序的综合评分26 图17:东吴金工因子测试集的相关性29 图18:东吴金工因子测试集的共线性30 图19:东吴金工因子测试集的综合打分30 图20:东吴金工因子测试集的信息偏离度31 图21:第一层合成因子测试集的相关性32 图22:第一层合成因子测试集共线性32 图23:第一层合成因子测试集的综合打分32 图24:第一层合成因子测试集的信息偏离度32 图25:第二层合成因子测试集的相关性33 图26:第二层合成因子测试集共线性33 图27:第二层合成因子测试集的综合打分33 图28:第二层合成因子测试集的信息偏离度33 图29:第三层合成因子测试集的相关性34 图30:第三层合成因子测试集共线性34 图31:第三层合成因子测试集的综合打分34 图32:第三层合成因子测试集的信息偏离度34 图33:合成因子十分组及多空对冲净值走势35 图34:纯净合成因子十分组净值走势图37 图35:沪深300指数增强净值走势38 图36:中证500指数增强净值走势39 图37:中证1000指数增强净值走势40 3/42 东吴证券研究所 表1:东吴金工特色量价选股因子5 表2:等权多因子组合的十分组多空对冲绩效指标7 表3:ICIR多因子组合的十分组多空对冲绩效指标8 表4:最小二乘法预测版的十分组多空对冲绩效指标10 表5:岭回归预测版的十分组多空对冲绩效指标11 表6:拟合版的十分组多空对冲绩效指标13 表7:小波滤波拟合版的十分组多空对冲绩效指标14 表8:卡尔曼滤波拟合版的十分组多空对冲绩效指标16 表9:高斯滤波的十分组多空对冲绩效指标17 表10:不同滤波方法的十分组多空对冲绩效指标18 表11:支持向量回归的十分组多空对冲绩效指标19 表12:XGBOOST的十分组多空对冲绩效指标21 表13:随机森林的十分组多空对冲绩效指标22 表14:ANN的十分组多空对冲绩效指标24 表15:东吴因子的十分组多空对冲绩效指标24 表16:UTR,STR主成分分析的十分组多空对冲绩效指标27 表17:SPS,TPS主成分分析的十分组多空对冲绩效指标27 表18:SPS_Turbo,TPS_Turbo主成分分析的十分组多空对冲绩效指标28 表19:合成因子的十分组多空对冲绩效指标35 表20:合成因子分年度回测绩效指标36 表21:合成因子与Barra的相关性36 表22:纯净合成因子的多空对冲绩效指标37 表23:纯净合成因子分年度回测绩效指标37 表24:合成因子的多空拆解回测绩效指标38 表25:沪深300指数增强38 表26:中证500指数增强39 表27:中证1000指数增强40 4/42 东吴证券研究所 1.引言 从《量稳换手率选股因子——量小、量缩,都不如量稳?》到《换手率变化率的稳定GTR因子——助推换手率的所有家族成员》,东吴金工在过去两年中发布了共计15个各具特色的量价类选股单因子。2023年上半年,大量选股因子,包括部分量价类因子,出现了同时失效的情况,我们希望通过构建多因子模型的方式来降低单因子失效的风险。我们这次将选取其中样本外依然有效的11个单因子,作为我们多因子组合的因子池。 表1:东吴金工特色量价选股因子 构造思路 因子名称 相关报告 换手率均值 Turn20STR UTR SPSTPS SPS_TurboTPS_TurboSCR PctTurn20CPV RPV RCP UTD 殊途同归 GTR 《东吴证券_金工专题报告_量稳换手率选股因子——量小、量缩,都不如量稳?》《东吴证券_金工专题报告_优加换手率UTR选股因子2.0--“技术分析拥抱选股因子”系列研究(十二)》《东吴证券_金工专题报告_成交价改进换手率因子》《东吴证券_金工专题报告_成交价改进换手率因子》《东吴证券_金工专题报告_换手率变化率的稳定GTR因子——助推换手率的所有家族成员》《东吴证券_金工专题报告_换手率变化率的稳定GTR因子——助推换手率的所有家族成员》《东吴证券_金工专题报告_改进STR——换手率要比别人稳,也要比自己稳》《东吴证券_金工专题报告_量价配合视角下的新换手率因子》《东吴证券_金工专题报告_“技术分析拥抱选股因子”系列研究(一):高频量价相关性,意想不到的选股因子》《东吴证券_金工专题报告_新量价相关性RPV选股因子——相关性是量价配合最好的尺—技术分析拥抱选股因子”系列研究(十一)》《东吴证券_金工专题报告_重拾自信选股因子——从过度自信到重拾自信》《东吴证券_金工专题报告_“技术分析拥抱选股因子”系列研究(四):换手率分布均匀度,基于分钟成交量的选股因子》《东吴证券_金工专题报告_成交量对动量因子的修正:日与夜之殊途同归《东吴证券_金工专题报告_换手率变化率的稳定GTR因子——助推换手率的所有家族成员 换手率标准差STR与Turn20的结合 量价因子纯净结合量价因子纯净结合 换手率与换手率变化率纯净结合换手率与换手率变化率纯净结合长期换手率变化率标准差长期换手率变化率平均值 量价相关性 (日内分钟频率量价绝对数值) 量价相关性 (分日、夜日频率序列相关性)日内涨跌差回归日内收益,找到未来补涨股票 (情绪) 高频换手率标准差分布,相 当于换手率标准差的标准 差 换手率切割动量因子,量 越高,反转越明显 短期换手率变化率均值 数据来源:东吴证券研究所 5/42 东吴证券研究所 2.传统的多因子组合方法 传统的多因子模型,往往是在不同大类因子间做组合,如在估值类因子、一致预期类因子、技术类因子间做一个合成因子。每个大类因子内部,往往是采用等权相加或是挑选近期表现最好的因子作为代表等较为简单的方法来进行处理。我们希望能找到一个多因子模型,既能够在不同类因子间使用,也能够在同大类因子内使用,使我们的大类合成因子不仅能够比最好的单因子好,也能比等权组合好。 2.1.等权 等权多因子组合方法是一种传统的多因子投资策略,其核心思想是假设每个因子对投资组合的贡献是相等的,因此每个因子被赋予相同的权重,从而使得每个因子对投资组合的影响程度相等。这种方法的优点在于简单和直观,不需要复杂的因子权重调整过程。它可以作为多因子投资策略的一种起点,为后续的研究提供一个基准组合进行比较。此外,等权多因子组合方法也有助于降低模型参数的敏感性并减少过度拟合的风险。然而,等权多因子组合方法的局限性在于未考虑因子相关性以及因子的有效性和稳定性,可能对投资组合产生负面影响。因此,在实际应用中,需要综合考虑其他辅助方法,以提高投资组合的绩效。 以2016/01/01-2023/07/31为回测区间,等权多因子组合的月度IC均值为-0.084,RankIC均值为-0.114,年化ICIR为-3.030,年化RankICIR为-4.110。下图1展示了等权多因子组合的十分组及多空对冲净值走势,表2展示了等权多因子组合的多空对冲绩效指标。 图1:等权多因子组合十分组及多空对冲净值走势 数据来源:Wind资讯,东吴证券研究所 6/42 东吴证券研究所 表2:等权多因子组合的十分组多空对冲绩效指标 等权 年化收益率: 39.36% 波动率: 13.06% 信息比率: 3.015 胜率: 76.67% 最大回撤 11.09% IC -0.084 ICIR -3.030 RankIC -0.114 RankICIR -4.110 数据来源:Wind资讯,东吴证券研究所 2.2.ICIR 最大化ICIR(Informat