量化专题报告 基于深度学习的指数增强策略 低频因子模型的挑战。 基本面因子是低频多因子模型的重要alpha来源,然而我们发现2021年以来业绩类因子出现普遍性的大面积回撤。对此,我们曾经提出过三个维度的应对方案:深入基本面、拥抱beta以及量价+AI。 前两者基于逻辑驱动,依托于投资人对于财务、宏观风格的深入理解,我们曾做过深入覆盖。而量价+AI基于数据驱动,从模型层面捕捉市场短期的定价不充分,我们在本篇报告中展开初步探索。 深度学习模型与特征构建。 金融数据具有显著的时序关联性,而深度学习中RNN类模型对于时序数据的建模表现最为亮眼。我们认为模型绩效的提升可以从三个维度入手: 1.通过调整超参数选取、label构建、数据预处理方式等精进单一模型; 2.对同一数据集根据不同模型训练,堆叠多模型的输出; 3.对同一模型构建差异化数据集输入,堆叠多数据集的输出。 基于RNN类模型中的LSTM,我们以第三个维度为切入点,希望通过构建差异化的数据集作为模型输入,捕捉具有增量性的信息。 深度学习选股因子。 通过构建6个不同的数据集,我们训练了6个深度学习指标,综合6个指标后的深度学习因子绩效良好。2017年以来多空年化收益100.8%,多头超额收益38.2%,因子IC均值12.7%,ICIR达到1.23。 基于深度学习模型的指数增强策略。 基于深度学习因子我们构建周度调仓的中证500/1000指数增强组合: 1.中证500指数增强组合2017年以来,组合年化收益15.4%,超额中证500指数17.1%,跟踪误差5.7%,信息比率2.84。 2.中证1000指数增强组合2017年以来,组合年化收益19.4%,超额中证1000指数24.6%,跟踪误差5.7%,信息比率4.04。 风险提示:结论基于历史数据以及模型推算,存在失效风险。 证券研究报告|金融工程研究 2023年11月06日 作者 分析师缪铃凯 执业证书编号:S0680521120003邮箱:miaolingkai@gszq.com 分析师刘富兵 执业证书编号:S0680518030007邮箱:liufubing@gszq.com 相关研究 1、《量化分析报告:从A+H核心资产中掘金——中银MSCI中国A50互联互通指数增强基金投资价值分析》2023-11-05 2、《量化周报:市场或将继续反弹》2023-11-05 3、《量化分析报告:择时雷达六面图:本期打分无变化 2023-11-04 4、《量化点评报告:十一月配置建议:如何对红利风格进行择时?——资产配置思考系列之四十七》2023-11-02 5、《量化分析报告:“机器替人”大势所趋,机器人产业进程加速——国泰中证机器人ETF投资价值分析》2023-10-31 请仔细阅读本报告末页声明 内容目录 一、低频因子模型的挑战4 二、深度学习模型与特征构建6 三、深度学习选股因子9 3.1低频行情数据集9 3.2日内行情数据集10 3.3其他衍生数据集合11 3.4综合因子nn_score12 四、基于深度学习模型的指数增强策略14 4.1中证500指数增强14 4.2中证1000指数增强15 �、总结16 风险提示16 图表目录 图表1:基本面因子2021年以来绩效4 图表2:价值/成长与公募机构资金流入相关性4 图表3:政府补助因子绩效5 图表4:小盘价值组合分年收益5 图表5:因子模型框架6 图表6:RNN网络结构6 图表7:RNN模型输入7 图表8:模型训练流程图8 图表9:bar_daily因子分年绩效9 图表10:bar_daily因子多头超额累计9 图表11:bar_weekly因子分年绩效9 图表12:bar_weekly因子多头超额累计9 图表13:bar_minutely因子分年绩效10 图表14:bar_minutely因子多头超额累计10 图表15:intra_return因子分年绩效10 图表16:intra_return因子多头超额累计10 图表17:money_flow因子分年绩效11 图表18:money_flow因子多头超额累计11 图表19:pv_factor因子分年绩效11 图表20:pv_factor因子多头超额累计11 图表21:因子截面相关性矩阵图12 图表22:综合因子分年绩效12 图表23:综合因子多头超额累计12 图表24:不同预测区间下综合因子绩效13 图表25:综合因子预测能力衰减13 图表26:不同指数成分股中因子ic13 图表27:综合因子与常用指标相关性13 图表28:中证500指数增强组合净值14 图表29:中证500指数增强组合分年绩效14 图表30:中证1000指数增强组合净值15 图表31:中证1000指数增强组合分年绩效15 一、低频因子模型的挑战 基本面因子是低频多因子模型的重要alpha来源,然而我们发现2021年开始业绩类因子普遍出现大规模的回撤。其中盈利、成长、预期调升类因子失效最为明显,多头回撤显著,这种现象在中证800指数成分股中更为强烈。 图表1:基本面因子2021年以来绩效 因子简称 因子 中证800 wind全A 多头-2021年以来ic-2021年以来 多头-2023年以来ic-2023年以来 多头-2021年以来ic-2021年以来 多头-2023年以来ic-2023年以来 EarningsUpRatio 财报超预期幅度 -1.7% -0.3% -7.1% -0.2% -1.4% 1.1% -9.5% 0.4% EarningsUpNum 分析师预期调升幅度 -0.8% -1.4% 4.0% -2.8% -7.0% 4.5% -14.0% 4.8% ROE 净资产收益率 0.2% -1.0% 0.7% -2.1% 0.0% 2.8% -3.1% 4.7% ROA 总资产收益率 0.8% -1.3% 2.2% -2.1% 0.2% 2.3% 0.6% 4.5% dROE roe同比变化 -6.1% 1.4% -7.9% 1.1% 2.3% 3.0% -0.6% 3.8% dROA roa同比变化 -6.9% 1.0% -9.1% 0.7% 1.7% 2.7% -0.3% 3.4% profitYOY 净利润增速 -0.5% 0.7% -4.7% -1.7% 5.7% 2.3% 3.6% 2.6% saleYOY 营收增速 -5.1% -0.9% -2.0% -3.5% -1.5% 0.8% -5.8% -0.5% TotProfitYOY 总利润增速 -2.8% -0.2% -4.7% -2.5% 1.1% 1.6% 0.7% 1.7% SUE SUE -1.6% 1.8% -7.3% -0.1% 6.1% 2.1% 0.6% 2.3% SUR SUR -2.4% 0.4% -5.2% 0.1% 5.0% 1.3% -3.9% 0.1% BP 市净率倒数 15.2% 7.9% 20.0% 15.3% 7.8% 7.1% 5.8% 10.9% EP 市盈率倒数 5.3% 5.8% 12.0% 9.6% 11.5% 5.9% 12.5% 9.3% SP 市销率倒数 4.6% 5.3% 12.4% 10.8% 7.9% 5.2% 4.4% 7.4% HoldRatio 公募基金平均持股权重 3.3% -0.8% 7.9% 1.1% -4.5% 2.3% -6.0% -1.0% 资料来源:wind,国盛证券研究所 关于业绩类因子的回撤是短期现象还是长期持续,众说纷纭。风格呈现出周期性波动,而基本面因子在长期虽有alpha,但短期更像是beta,其绩效受到众多因素的影响。 例如,机构资金流入与价值、成长风格绩效呈现出明显相关性。主动权益基金规模环比增速与当季度成长因子(dROE)多头超额收益表现出明显正相关,序列相关性达到32.8%,而其与估值因子(BP)多头超额收益序列相关性则为-17.8%。 因此,我们相信长期而言业绩类因子终将回归,那么短期我们可以做些什么应对? 图表2:价值/成长与公募机构资金流入相关性 1.4100% 1.280% 1.060% 0.840% 0.620% 0.40% 0.2-20% 0.0-40% 20100331 20100630 20100930 20101231 20110331 20110630 20110930 20111231 20120331 20120630 20120930 20121231 20130331 20130630 20130930 20131231 20140331 20140630 20140930 20141231 20150331 20150630 20150930 20151231 20160331 20160630 20160930 20161231 20170331 20170630 20170930 20171231 20180331 20180630 20180930 20181231 20190331 20190630 20190930 20191231 20200331 20200630 20200930 20201231 20210331 20210630 20210930 20211231 20220331 20220630 20220930 20221231 20230331 20230630 -0.2-60% 主动权益基金规模环比增速(右轴)估值因子(bp)多头超额收益成长因子(dROE)多头超额收益 资料来源:wind,国盛证券研究所 关于业绩类因子的失效,我们曾经提出过三个维度的应对方案: 1.深入基本面:在基本面数据中挖掘仍未失效的alpha; 2.拥抱beta:在组合维度应用行业轮动、主动量化等策略; 3.量价+AI:提高换手,运用机器学习、深度学习捕捉短期的量价信息。 全 年份 多空收益 多头超额 IC均值 ICIR IC胜率 2011 7.0% 3.1% 2.1% 2.18 66.7% 2012 15.8% 9.2% 3.6% 2.80 83.3% 2013 7.6% -2.9% 4.7% 5.12 100.0% 2014 17.2% 11.2% 2.7% 2.17 75.0% 2015 8.1% 6.6% 2.8% 1.96 66.7% 2016 11.8% 9.9% 5.4% 3.50 91.7% 2017 28.1% 14.5% 7.6% 7.62 100.0% 2018 12.4% 7.1% 5.8% 4.04 91.7% 2019 28.7% 15.9% 6.6% 2.67 83.3% 2020 29.0% 8.7% 6.5% 5.21 100.0% 2021 10.7% 9.0% 3.8% 2.74 83.3% 2022 11.5% 10.8% 3.2% 2.46 75.0% 20230928 18.0% 9.9% 6.5% 5.32 88.9% 全样本 16.5% 9.0% 4.7% 3.28 85.0% 年份 组合收益 国证2000指数 年化超额 信息比率 最大回撤 超额 2012 23.6% 0.8% 22.9% 4.43 -20.0% 2013 51.0% 33.3% 17.7% 2.15 -1 2014 61.6% 42.4% 19.2% 2.08 2015 139.9% 88.1% 51.8% 2016 11.3% -12.1% 23.5% 2017 -5.2% -16.9% 11 2018 -20.0% -33.8% 2019 38.2% 23. 2020 44.6% 2021 43.0 2022 202309 图表3:政府补助因子绩效图表4:小盘价值组合分年收益 资料来源:wind,国盛证券研究所资料来源:wind,国盛证券研究所 关于前两个维度,在以往的报告中我们有所涉及: 关于深入基本面,我们在前期