证券分析师 金融工程专题 再探预测目标、预测周期、交易换手和风格控制在GRU选股策略中的影响 ——德邦金工机器学习专题之七 肖承志 资格编号:S0120521080003 邮箱:xiaocz@tebon.com.cn 证券研究报告|金融工程专题 深度报告 2024年07月25日 研究助理 投资要点: 相关研究 1.《基于分钟数据的GRU模型在选股策略中的应用初探——德邦金工机器学习专题之六》2024.07.01 2.《基于模型池的机器学习选股— —德邦金工机器学习专题之五》2022.05.24 3.《动态因子筛选——德邦金工机器学习专题之四》2022.03.09 4.《基于财务与风格因子的机器学习选股——德邦金工机器学习专题之三》2022.01.25 5.《机器学习残差因子表现归因— —德邦金工机器学习专题之二》2021.11.24 6.《利用机器学习捕捉因子的非线性效应——德邦金工机器学习专题之一》2021.10.18 选择预测目标的价格时,在模型使用vwap计算的未来收益作为预测目标时,其IC表现相比预测open未来收益的模型有较大提升,但是模型引入了更多风格特征,组合净值的综合表现不如预测open未来收益的模型与预测close未来收益的模型。具体来看,vwap1d模型对于未来5日vwap收益率的平均IC为0.082, open1d模型IC为0.062。相对中证1000指数,vwap1d模型超额年化收益率为17.52%,最大回撤为18.01%,open1d模型超额年化收益率为15.60%,最大回撤为10.21%;close1d模型超额年化收益率为14.79%,最大回撤为10.99%。 预测更长周期未来收益率的GRU模型,表现上类似于预测vwap未来收益的模型。在IC表现上,预测多日未来收益的GRU模型相比仅预测1日未来收益的GRU模型有所提升,但是组合上看暴露更多的风格特征。在组合表现上预测多日 未来收益的GRU模型各方面都弱于预测1日未来收益的模型。 预测目标的风格特征能显著影响GRU模型的风格特征,预测剥离更多风格特征未来收益的GRU模型能获得更纯的alpha收益。剥离预测目标的风格特征后,模型在IC和收益方面有所减弱,在组合回撤和波动率的表现上显著增强。2021年后, 原先的GRU模型引入更多的风格特征,其小市值偏好显著增加,模型在2021年后相对基准的市值风格暴露为-0.46。剥离预测目标中的风格特征之后,组合的小市值偏好得到明显的改善,剥离size风格的模型在2021年后相对基准的市值风格暴露缩小至-0.17,剥离所有barra风格特征的模型市值风格暴露为-0.23。 在换手率设置方面,相比以open价格交易,以vwap价格进行交易需要设置更低的换手率能取得更优的组合表现,日频交易相对于周频交易的换手设置更为敏感。对于日频交易的情况下,使用open价格进行交易时,单边换手率设置为11%时组合表现最优;使用vwap价格进行交易时,单边换手率设置为3%时组合表现 最优。周频交易的情况下,使用open价格交易的最优单边换手约为14%-20%,使用vwap交易时单边换手率设置为6%-20%较优。 预测更长周期未来收益率的GRU模型,需要注意剥离风格信息的影响。更长周期的预测目标中带有的风格信息相比短期预测目标明显增加,这会导致长周期的预测模型很容易学到过多的风格特征。剥离掉预测目标中的风格特征后,增加预测周 期能一定程度上提升模型的表现。 风险提示:人工智能模型挖掘市场规律是对历史数据的总结,市场规律在未来可能发生变化。深度学习模型可能存在过拟合风险。深度学习模型存在随机数影响,训练结果可能无法完全复刻。本文测试均在理想状态下使用开盘价或者VWAP价格进行成交计算,实际交易中可能存在其他影响因素导致成交价格出现偏差。 请务必阅读正文之后的信息披露和法律声明 内容目录 1.问题提出4 2.预测目标对于GRU模型的影响5 2.1.因子表现5 2.2.组合收益表现6 2.3.组合风格特征7 3.预测周期对于GRU模型的影响8 3.1.因子表现8 3.2.组合收益表现9 3.3.组合风格特征10 4.风格控制对于GRU模型的影响11 4.1.因子表现11 4.2.组合收益表现12 4.3.组合风格特征13 5.交易换手对于GRU模型的影响14 5.1.以open价格交易时的换手率影响14 5.2.以vwap价格交易时的换手率影响15 6.长周期预测的风格处理16 6.1.未来收益率与风格的相关性16 6.2.Barra5d的净值表现17 7.总结18 8.风险提示18 信息披露19 图表目录 图1:因子累积IC图(各模型因子与未来5日vwap收益率的IC)5 图2:因子分组收益(未来5日vwap收益率)6 图3:各模型超额组合净值6 图4:组合相对基准的size暴露走势图7 图5:组合相对基准的风格暴露8 图6:因子累积IC图(各模型因子与未来5日vwap收益率的IC)8 图7:因子分组收益(未来5日vwap收益率)9 图8:各模型超额组合净值9 图9:组合相对基准的size暴露走势图10 图10:组合相对基准的风格暴露10 图11:因子累积IC图(各模型因子与未来5日vwap收益率的IC)11 图12:因子分组收益(未来5日vwap收益率)12 图13:各模型超额组合净值12 图14:组合相对基准的size暴露走势图13 图15:组合相对基准的风格暴露13 图16:不同换手率组合的超额年化收益率14 图17:不同换手率组合的超额年化收益率15 图18:各模型超额组合净值17 表1:不同预测目标的模型对不同未来收益的IC6 表2:各模型组合表现7 表3:不同预测目标的模型对不同未来收益的IC9 表4:各模型组合表现10 表5:不同预测目标的模型对不同未来收益的IC11 表6:各模型组合表现13 表7:不同换手率组合表现14 表8:不同换手率组合表现15 表9:不同周期未来收益率的风格相关性16 表10:各模型组合表现17 1.问题提出 在上一篇报告里,我们简要介绍了将日内分钟频的量价数据应用于A股市场进行选股。但是由于篇幅及行文连贯性原因仍然有一些问题没有深入探讨,本文将逐一对这些问题进行研究。 问题一(预测目标):在传统的收益率预测里,更常见的做法是预测closeT0tocloseT1对应的收益率1。而在上一篇报告里,我们的做法却是预测openT1toopenT2对应的收益率2,甚至对于实际的交易来说,预测vwapT1tovwapT2对应的收益率更合理。 问题二(预测周期):上文所述是预测1天也即T0到T1或者T1到T2,但是对于许多机构客户来说,无法做到日频调仓,对于他们更需要的可能是周频甚至双周频的调仓策略,对应于T0到T5或者是T1到T6,甚至是T0到T10或者T1到T11。 问题三(风格控制):在相同的预测周期和预测目标下,尤其是当预测周期在周度及以上时,预测的收益率通常带有比较明显的风格收益率特征。为此,传统的做法是通过因子组合优化时约束相对基准的风格暴露和行业的偏离度来进行风险控制。这种做法并不改变因子本身,且不同管理人对于风险偏好的不同也会导致结果差异。因此,我们尝试通过改变预测目标来控制这一问题。具体的做法为,将预测目标对行业和风格进行回归取残差,由于残差本身剔除了相关的风格,所以在GRU模型的学习过程中不会学习到线性部分的风格。这也体现出非线性模型相对线性模型的优势。具体做法可以参考《利用机器学习捕捉因子的非线性效应 ——德邦金工机器学习专题之一》。 问题四(交易换手):对于不同的预测周期和预测目标下,会产生不同的预测效果。例如,上一篇报告里,当预测目标是openT1toopenT2时,用开盘价交易相对于vwap价格交易在控制日换手单边5%的水平下,会产生近10%左右的滑点。但是对于开盘交易和vwap交易而言,控制相同的换手率水平并没有绝对的道理。因为开盘价较vwap价格具有更强的预测能力,而对于vwap价格而言,很难在交易价格上具备优势,因此更多的换手反而不能带来更好的预测收益。同理,T1到T6,这个问题也同样存在,只不过由于日期跨度更大,导致日内open相对vwap的优势在周度层面的优势没有那么大,但并非毫无关系。因此,仍然需要系统性研究不同预测周期和预测目标下所合适的换手率水平。 因此,本文着重从以上四个问题出发,力求尽可能详细和客观地分析不同变量影响,以控制变量的思想,将不同处理结果与基础模型3进行对比,从而得到相关结论。 1即把因子生成日当做T0,预测当日收盘价(T0)到下一个交易日(T1)收盘价所对应的涨跌幅。 2在上一篇报告里,我们虽然并未引入T0、T1和T2的记号,但行文并不会产生歧义。为了更精确的描述以及方便读者对比,本文将把所有的训练目标的定义均标记上对应的日期和股价。若不做特殊说明,该股价均代表后复权的股价。 3基础模型的框架为上一篇报告《基于分钟数据的GRU模型在选股策略中的应用初探——德邦金工机器学习专题之六》中提到的 GRU模型,即本篇报告中的open1d模型。 2.预测目标对于GRU模型的影响 本文中用到的简称含义: IC:均表示RankIC。 Close1d:以close价格计算的未来一日收益率(closeT0tocloseT1)。OpenXd:以open价格计算的未来X日收益率(openT1toopenTX+1)。Vwap1d:以vwap价格计算的未来一日收益率(vwapT1tovwapT2)。Size1d:Open1d与log市值线性回归后的残差项。BarraXd:OpenXd与barra风格因子线性回归后的残差项。 PriceXd模型:以PriceXd为预测目标的GRU模型。数据统计区间:2019年1月1日-2024年6月28日。 回测参数如下(若无其他说明,本文回测均为此参数): 选股范围:全市场股票,剔除st、*st、上市不满1年、停牌无法交易的股票对比基准:中证1000指数 选股数量:500只等权配置 换仓频率:周频换仓,每期换35只股票交易价格:全天VWAP 手续费率:双边千3 多头组合不做行业以及风格约束 2.1.因子表现 图1:因子累积IC图(各模型因子与未来5日vwap收益率的IC) 资料来源:Wind,RiceQuant,德邦研究所 对于未来5日的vwap收益率,vwap1d模型在IC上明显优于close1d模型和open1d模型。 模型设置不同的预测目标,最终因子的IC表现也会有所不同。当模型预测目标与未来收益统计方式一致时,模型IC表现较好。vwap1d模型对长周期的预测目标(open5d和vwap5d)更有优势。 表1:不同预测目标的模型对不同未来收益的IC close1d open1d open5d vwap1d vwap5d Close1d模型 0.131 0.074 0.074 0.045 0.059 Open1d模型 0.114 0.074 0.077 0.045 0.062 Vwap1d模型 0.095 0.066 0.086 0.060 0.082 资料来源:Wind,RiceQuant,德邦研究所 从分组收益上看,vwap1d模型的多头组合(第10组)和空头组合(第1组)表现都更为强势。close1d模型的多空能力表现较差,分组也并不线性,其第8组的收益表现明显优于第10组。 图2:因子分组收益(未来5日vwap收益率) 资料来源:Wind,RiceQuant,德邦研究所 2.2.组合收益表现 图3:各模型超额组合净值 资料来源:Wind,RiceQuant,德邦研究所 从收益上看,vwap1d模型表现最佳,但是综合考虑风险类指标的情况下,vwap1d模型的表现最弱,最大回撤远大于open1d模型和close1d模型。open1d模型的综合表现更为强势,从信息比率、最大回撤和calmar比率上看op