量化专题报告 基于深度学习的指数增强策略 低频因子模型的挑战。 基本面因子是低频多因子模型的重要alpha来源,然而我们发现2021年以来业绩类因子出现普遍性的大面积回撤。对此,我们曾经提出过三个维度的应对方案:深入基本面、拥抱beta以及量价AI。 前两者基于逻辑驱动,依托于投资人对于财务、宏观风格的深入理解,我们曾做过深入覆盖。而量价AI基于数据驱动,从模型层面捕捉市场短期的定价不充分,我们在本篇报告中展开初步探索。 深度学习模型与特征构建。 金融数据具有显著的时序关联性,而深度学习中RNN类模型对于时序数据的建模表现最为亮眼。我们认为模型绩效的提升可以从三个维度入手: 1通过调整超参数选取、label构建、数据预处理方式等精进单一模型; 2对同一数据集根据不同模型训练,堆叠多模型的输出; 3对同一模型构建差异化数据集输入,堆叠多数据集的输出。 基于RNN类模型中的LSTM,我们以第三个维度为切入点,希望通过构建差异化的数据集作为模型输入,捕捉具有增量性的信息。 深度学习选股因子。 通过构建6个不同的数据集,我们训练了6个深度学习指标,综合6个指标后的深度学习因子绩效良好。2017年以来多空年化收益1008,多头超额收益382,因子IC均值127,ICIR达到123。 基于深度学习模型的指数增强策略。 基于深度学习因子我们构建周度调仓的中证5001000指数增强组合 1中证500指数增强组合2017年以来,组合年化收益154,超额中证500指数171,跟踪误差57,信息比率284。 2中证1000指数增强组合2017年以来,组合年化收益194,超额中证1000指数246,跟踪误差57,信息比率404。 风险提示:结论基于历史数据以及模型推算,存在失效风险。 证券研究报告金融工程研究 2023年11月06日 作者 分析师缪铃凯 执业证书编号:S0680521120003邮箱:miaolingkaigszqcom 分析师刘富兵 执业证书编号:S0680518030007邮箱:liufubinggszqcom 相关研究 1、《量化分析报告:从AH核心资产中掘金中银MSCI中国A50互联互通指数增强基金投资价值分析》20231105 2、《量化周报:市场或将继续反弹》20231105 3、《量化分析报告:择时雷达六面图:本期打分无变化 20231104 4、《量化点评报告:十一月配置建议:如何对红利风格进行择时?资产配置思考系列之四十七》20231102 5、《量化分析报告:“机器替人”大势所趋,机器人产业进程加速国泰中证机器人ETF投资价值分析》20231031 请仔细阅读本报告末页声明 内容目录 一、低频因子模型的挑战4 二、深度学习模型与特征构建6 三、深度学习选股因子9 31低频行情数据集9 32日内行情数据集10 33其他衍生数据集合11 34综合因子nnscore12 四、基于深度学习模型的指数增强策略14 41中证500指数增强14 42中证1000指数增强15 、总结16 风险提示16 图表目录 图表1:基本面因子2021年以来绩效4 图表2:价值成长与公募机构资金流入相关性4 图表3:政府补助因子绩效5 图表4:小盘价值组合分年收益5 图表5:因子模型框架6 图表6:RNN网络结构6 图表7:RNN模型输入7 图表8:模型训练流程图8 图表9:bardaily因子分年绩效9 图表10:bardaily因子多头超额累计9 图表11:barweekly因子分年绩效9 图表12:barweekly因子多头超额累计9 图表13:barminutely因子分年绩效10 图表14:barminutely因子多头超额累计10 图表15:intrareturn因子分年绩效10 图表16:intrareturn因子多头超额累计10 图表17:moneyflow因子分年绩效11 图表18:moneyflow因子多头超额累计11 图表19:pvfactor因子分年绩效11 图表20:pvfactor因子多头超额累计11 图表21:因子截面相关性矩阵图12 图表22:综合因子分年绩效12 图表23:综合因子多头超额累计12 图表24:不同预测区间下综合因子绩效13 图表25:综合因子预测能力衰减13 图表26:不同指数成分股中因子ic13 图表27:综合因子与常用指标相关性13 图表28:中证500指数增强组合净值14 图表29:中证500指数增强组合分年绩效14 图表30:中证1000指数增强组合净值15 图表31:中证1000指数增强组合分年绩效15 一、低频因子模型的挑战 基本面因子是低频多因子模型的重要alpha来源,然而我们发现2021年开始业绩类因子普遍出现大规模的回撤。其中盈利、成长、预期调升类因子失效最为明显,多头回撤显著,这种现象在中证800指数成分股中更为强烈。 图表1:基本面因子2021年以来绩效 因子简称 因子 中证800 wind全A 多头2021年以来ic2021年以来 多头2023年以来ic2023年以来 多头2021年以来ic2021年以来 多头2023年以来ic2023年以来 EarningsUpRatio 财报超预期幅度 17 03 71 02 14 11 95 04 EarningsUpNum 分析师预期调升幅度 08 14 40 28 70 45 140 48 ROE 净资产收益率 02 10 07 21 00 28 31 47 ROA 总资产收益率 08 13 22 21 02 23 06 45 dROE roe同比变化 61 14 79 11 23 30 06 38 dROA roa同比变化 69 10 91 07 17 27 03 34 profitYOY 净利润增速 05 07 47 17 57 23 36 26 saleYOY 营收增速 51 09 20 35 15 08 58 05 TotProfitYOY 总利润增速 28 02 47 25 11 16 07 17 SUE SUE 16 18 73 01 61 21 06 23 SUR SUR 24 04 52 01 50 13 39 01 BP 市净率倒数 152 79 200 153 78 71 58 109 EP 市盈率倒数 53 58 120 96 115 59 125 93 SP 市销率倒数 46 53 124 108 79 52 44 74 HoldRatio 公募基金平均持股权重 33 08 79 11 45 23 60 10 资料来源:wind,国盛证券研究所 关于业绩类因子的回撤是短期现象还是长期持续,众说纷纭。风格呈现出周期性波动,而基本面因子在长期虽有alpha,但短期更像是beta,其绩效受到众多因素的影响。 例如,机构资金流入与价值、成长风格绩效呈现出明显相关性。主动权益基金规模环比增速与当季度成长因子(dROE)多头超额收益表现出明显正相关,序列相关性达到328,而其与估值因子(BP)多头超额收益序列相关性则为178。 因此,我们相信长期而言业绩类因子终将回归,那么短期我们可以做些什么应对? 图表2:价值成长与公募机构资金流入相关性 14100 1280 1060 0840 0620 040 0220 0040 20100331 20100630 20100930 20101231 20110331 20110630 20110930 20111231 20120331 20120630 20120930 20121231 20130331 20130630 20130930 20131231 20140331 20140630 20140930 20141231 20150331 20150630 20150930 20151231 20160331 20160630 20160930 20161231 20170331 20170630 20170930 20171231 20180331 20180630 20180930 20181231 20190331 20190630 20190930 20191231 20200331 20200630 20200930 20201231 20210331 20210630 20210930 20211231 20220331 20220630 20220930 20221231 20230331 20230630 0260 主动权益基金规模环比增速右轴估值因子bp多头超额收益成长因子dROE多头超额收益 资料来源:wind,国盛证券研究所 关于业绩类因子的失效,我们曾经提出过三个维度的应对方案: 1深入基本面:在基本面数据中挖掘仍未失效的alpha; 2拥抱beta:在组合维度应用行业轮动、主动量化等策略; 3量价AI提高换手,运用机器学习、深度学习捕捉短期的量价信息。 全 年份 多空收益 多头超额 IC均值 ICIR IC胜率 2011 70 31 21 218 667 2012 158 92 36 280 833 2013 76 29 47 512 1000 2014 172 112 27 217 750 2015 81 66 28 196 667 2016 118 99 54 350 917 2017 281 145 76 762 1000 2018 124 71 58 404 917 2019 287 159 66 267 833 2020 290 87 65 521 1000 2021 107 90 38 274 833 2022 115 108 32 246 750 20230928 180 99 65 532 889 全样本 165 90 47 328 850 年份 组合收益 国证2000指数 年化超额 信息比率 最大回撤 超额 2012 236 08 229 443 200 2013 510 333 177 215 1 2014 616 424 192 208 2015 1399 881 518 2016 113 121 235 2017 52 169 11 2018 200 338 2019 382 23 2020 446 2021 430 2022 202309 图表3:政府补助因子绩效图表4:小盘价值组合分年收益 资料来源:wind,国盛证券研究所资料来源:wind,国盛证券研究所 关于前两个维度,在以往的报告中我们有所涉及: 关于深入基本面,我们在前期报告中提出基于财报中的政府补助信息构建的政府补助因子,其可以作为盈利类因子的优秀补助。政府补助因子与因子的截面相关性接近50,但是在盈利类因子多头普遍失效的情形下,因子多头在近3年均保持每年约10的年超额收益。 因此,我们相信基本面信息中仍然存在有效的alpha信息,但是对于这些信息的挖掘需要深入财报、对基本面有深刻理解,寻找增量的信息具有较高的难度。 关于拥抱beta,在对应的市场风格下一些smartbeta类的主动量化策略能取得亮眼的收益表现。我们跟踪的小盘价值组合历经1年多的样本外跟踪,今年以来截至20230928日,组合取得绝对收益211,超额国证2000指数211,超额显著。 但是,拥抱beta需要我们对于市场风格具有一定的敏感性,在对应的市场状态下配置可行的主动量化策略,而对于风格的判断从来都不是一件简单的事情。 关于量价AI,与前两者最大的差异点在于我们将获取超额收益的方式从理解市场、理解基本面切换到了数据建模层面。随着算力的发展与技术的进步,深度学习模型已经从传统的统计学中脱离,我们不再追求逻辑层面的可解释性,基于数据建模分析维度同样也能捕获到金融市场中短期的定价不足。 本文,我们将对于第三个维度“量价AI”展开初步的探索,希望补充基本面模型对于市场短期alpha捕捉的不足。 二、深度学习模型与特征构建 基于多因子模型的