您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[民生证券]:量化专题报告:深度学习模型如何控制策略风险? - 发现报告
当前位置:首页/其他报告/报告详情/

量化专题报告:深度学习模型如何控制策略风险?

2024-04-25叶尔乐、韵天雨民生证券
量化专题报告:深度学习模型如何控制策略风险?

量化专题报告 深度学习模型如何控制策略风险? 2024年04月25日 深度学习模型2024年年初波动较大,本报告提出三类解决方案提升风险 控制能力。因为资金面震荡,微盘股表现不佳等原因,传统深度学习因子二月初多空回撤超过20%,波动明显。本报告尝试了三个试图提高深度学习稳定性的方法以增强其应对风险的能力: 1.通过对高频数据的引入,提高模型颗粒度以更快应对市场异常; 2.在模型中加入风格控制,减少对风格轮动的学习,约束风格暴露;3.使用元增量学习方法,提高模型敏感度。 分析师叶尔乐执业证书:S0100522110002邮箱:yeerle@mszq.com 方案1:高频行情输入优化交易提升了收益但对回撤控制作用有限。我们采用过去五个交易日的五分钟高频量价数据,预测未来2个交易日的股票收益排序。高频输入的深度学习因子日度RankIC均值0.087,在宽基指数内IC衰 研究助理韵天雨执业证书:S0100122120002邮箱:yuntianyu@mszq.com 减降低。用高频信号对日频信号策略进行调仓优化,优化后混频策略在中证500,中证1000内年化超额收益分别提升4.6%,4.9%,但跟踪误差均无明显 相关研究1.基金分析报告:基金季报2024Q1:有色 变化,且今年回撤仍然较大。故由于高频输入对3σ外的风险限制能力有限,且 仓位高点,金铝为主-2024/04/23 单日的交易优化无法避免组合持续回撤的趋势,无法显著控制组合回撤。 2.量化周报:流动性与分歧度边际回升-202 方案2:在模型中加入风格惩罚,控制模型风格暴露,降低风险。深度学习因子在2023年下半年通过在价值,盈利,波动率,流动性等因子上的暴露获得了一定收益,2024年初,因子风格发生剧烈波动,在2月份突然偏向小微 4/04/213.量化分析报告:黄金:1978-2024/04/174.量化周报:预期不定环境选择高置信度区间-2024/04/14 盘,并且在贝塔,市值等因子上与市场走势完全相反。模型在此期间进行了错 5.量化周报:继续保持一致上涨状态-2024/ 误的风格择时,很大程度上导致了因子表现的回撤。故我们可以通过在模型中 04/07 加入风格因子及风格动量的嵌入,以及在损失函数端加入关于风格偏离的惩罚来进行风险控制。改进后因子RankIC有一定降低,但中性化因子的IC衰减显著优于改进前模型,多头组合年化收益有所降低,但信息比率显著提升。 方案3:沿用元增量学习框架可进一步控制模型回撤。鉴于元增量学习具 有对于市场变化快速适应的能力,我们可以将这一框架与模型进行结合。将底层模型改为加入风格输入后的ALSTM模型,并在损失函数中加入风格偏离的控制,在外层沿用上一篇研究中提出的元增量学习框架。最终策略在中证500上信息比率提升0.5,在中证1000上信息比率提升0.4,并且2024年均已取得正向超额收益。重新对模型多头端进行风格分析,发现模型的风格偏离降低,且风格波动减小,帮助模型控制了风险。 综合来说,应用加入风格惩罚的元增量学习模型可以较好地控制模型回 撤。在本篇研究中,针对深度学习模型在今年年初波动过大的问题,我们尝试了3种控制模型风险的方法,对基模型进行改进。分别为加入高频数据输入,在模型中添加风格因子,风格动量嵌入与风格惩罚,以及应用元学习框架进行增强。最终通过对前三篇研究成果的同时应用控制了模型风险,构建了兼顾收益与风险的深度学习策略。 风险提示:量化模型基于历史数据,市场未来可能发生变化,策略模型有 失效可能。 目录 1传统深度学习模型风险显露3 2方案1:构造高频行情输入以优化交易策略7 2.1用高频数据构建深度学习模型7 2.2基于短期收益预测的交易优化策略8 3方案2:在深度学习模型中加入风格惩罚12 3.1深度学习风格波动明显12 3.2通过风格控制降低策略风险13 4方案3:加入风格控制的元增量学习17 4.1加入元增量学习的ALSTM模型17 4.2效果实证与分析19 5总结与思考22 6风险提示24 插图目录25 表格目录25 1传统深度学习模型风险显露 尽管传统深度学习模型有着出色的历史表现,但是在2024年一月下旬至春节前出现了较大回撤。深度学习由于其历史上的优异表现,已经被广泛应用于投资组合构建。然而,随着深度学习在小盘风格上的暴露逐渐增加,深度学习模型的风险也渐渐显露。在2024年2月初市场风格波动明显的情况下,传统深度学习模型因子的多空收益回撤超过20%。尽管在节后反弹明显,但截至4月中旬,因子多头组超额收益仍然没有回正,对很多投资者产生了较大影响。 针对深度学习模型的风险控制,本篇尝试了三个试图提高深度学习稳定性的方法以增强其应对风险的能力: 1.通过对高频数据的引入,提高模型颗粒度以更快应对市场异常; 2.在模型中加入风格控制,减少对风格轮动的学习,约束风格暴露; 3.使用元增量学习方法,提高模型敏感度。 日频ALSTM因子多头组合在2024.2月初回撤较大。主要原因为市场出现的资金面踩踏及微盘股的巨幅下跌。深度学习因子在大幅暴露小市值的情况下,较其他的量化因子出现了更大回撤,单周多空收益回撤超过20%。在春节前3天指数大幅回弹时,因子多头组合仍然下跌,表现黯淡。尽管节后有所反弹,但反弹程度仍不及指数。 图1:日频ALSTM因子2023年下半年以来表现图2:宽基指数2023下半年以来表现 资料来源:wind,民生证券研究院资料来源:wind,民生证券研究院 对于基模型,我们采用的是《基于可见性图嵌入的沪深300深度学习增强策略》中的DA-RNN第二步注意力机制。即时序上的注意力结构,模型旨在对每一个时间步上面LSTM隐藏层的输出进行加权,影响隐藏层的输出,同时一起输出相当于隐藏层维度的注意力权重分数。此ALSTM的模型结构如下图所示。 图3:ALSTM模型结构示意 资料来源:YaoQinetal.2017,民生证券研究院 我们采用股票日频行情中常见的7个量价指标作为模型的输入。模型的特征处理,模型结构与训练参数如下图所示: 特征X:过去60个交易日的高、开、低、收、成交额、成交量、VWAP,维度为( 特征处理 n,60,7)特征处理:对过去60日的量价指标除以最新一天的值标签y:七个交易日open-to-open收益排序,T+1-T+8 ALSTM:input_size=7,hidden_size=64,num_layers=2,rnn_type=lstm模型结构Dropout:dropout概率为0.1 MLP:全连接层,输入维度64,输出维度1 训练参数 损失函数:-IC其他参数:batch_size:某一天的所有股票,学习率:0.001,优化器:Adam数据集划分:训练集:验证集=85:15,训练数据为10年 图4:模型结构,特征处理与训练参数 资料来源:民生证券研究院绘制 采用半年滚动训练的模式,每半年用过去10年日频行情数据训练模型,预 测未来半年的股票收益排序。训练轮数最大100轮,最小50轮,连续20轮验证集表现无法更好即训练早停。在取每次训练的batch数据时,每五个交易日取当天的所有股票样本,即每五个交易日一个batch,训练时训练集不打乱,即按照时间顺序传播梯度,避免样本随机性过大带来的表现衰减。单样本的数据输入示意如下: 图5:数据输入格式示意 资料来源:民生证券研究院绘制 日频ALSTM因子在今年一月底至二月初的IC回撤较大。在最近一次的训练中(训练集+验证集数据截至2023年12月31日),模型拟合较快,验证集损失 函数在训练9轮左右达到收敛。每次训练取验证集表现最好的一次模型对未来半年的股票收益排序进行预测作为因子,滚动样本外因子在全A上进行回测,回测时间2019-2024.4.12,周度IC均值0.085,ICIR0.87,表现尚可,但在图7中可以看出因子IC今年出现了剧烈波动。 图6:模型训练及验证损失函数走势图7:ALSTM日频模型因子IC及累计IC 资料来源:wind,民生证券研究院资料来源:wind,民生证券研究院 日频ALSTM深度学习因子在中证500和中证1000指数内RankIC有所降低,但今年RankIC波动较小。在中证500内周度RankIC均值0.067,ICIR0.58。在中证1000内周度RankIC均值0.072,ICIR0.68,在今年并没有出现巨幅回撤。说明在成分股不偏离的情况下,深度学习因子风险不大;即今年以来的回撤更多来自于成分股外。 图8:ALSTM日频模型因子IC及累计IC-中证1000图9:ALSTM日频模型因子IC及累计IC-中证500 资料来源:wind,民生证券研究院资料来源:wind,民生证券研究院 2方案1:构造高频行情输入以优化交易策略 为了降低组合风险并提高稳定性,我们首先纳入了股票5分钟频数据集,尝试利用高频数据中的量价特征预测股票的短期收益,并将信号用于调仓优化中,以更精准的短期预测来增强组合收益,降低组合波动率。深度学习本质上是统计模型,对于“3𝜎”外的极端行情,若训练时样本内没有足够的类似场景,则无法很好地应对市场的剧烈波动;而提高颗粒度可以使得日频上“3𝜎”外的波动分解到分钟频上“3𝜎”内的波动,从而有更大概率学习其中的风险规律。 2.1用高频数据构建深度学习模型 为了足够细致地分解日频数据中的波动,且不为模型增加太大的负担,我们采用过去五个交易日的五分钟高频量价数据,预测未来2个交易日的股票收益排 序。取样时,为了与调仓优化一致,我们只取过去3年每周最后一个交易日数据样本,预测周一开盘至周三开盘的收益排序。仍然使用ALSTM模型建模,单样本形状为[240,6],并且在batch中将时间顺序打乱。模型其他细节与日频模型相同。 图10:高频数据集ALSTM模型结构 资料来源:民生证券研究院绘制 利用高频数据集建立的ALSTM模型在最近一次训练时在23轮左右模型收敛,模型在样本序列加长后训练变慢。回测高频数据ALSTM模型的日频因子,模型在全A中日均RankIC为0.087,ICIR0.94,表现尚可,但因子RankIC在2月初回撤仍然较大,因子在2.1-2.8日度RankIC均值为-0.12。 图11:高频ALSTM模型训练及验证损失函数走势图12:ALSTM高频模型因子日度IC及累计IC 资料来源:wind,民生证券研究院资料来源:wind,民生证券研究院 高频ALSTM深度学习因子在中证500内日度RankIC均值0.077,ICIR0.61,在中证1000中日度RankIC均值为0.079,ICIR0.7,衰减较周频模型低,且更加稳定。 图13:ALSTM高频模型因子IC及累计IC-中证500图14:ALSTM高频模型因子IC及累计IC-中证1000 资料来源:wind,民生证券研究院资料来源:wind,民生证券研究院 2.2基于短期收益预测的交易优化策略 因高频深度学习因子预测窗口较短,与日频模型的标签不一致,我们不做二者在模型上的结合,而希望通过部分交易优化降低策略波动。由于高频因子的短窗口IC较高,我们可以将其用做延迟调仓的信号,对日频深度学习因子策略进行调仓优化。具体地,我们对于因子的多头组合做如下调整。 图15:高频信号调仓优化策略示意 资料来源:民生证券研究院绘制 在T日调仓日,我们检查日频因子的多头组中是否包含预测单日收益Rank在排名后50%的股票,若包含,则暂缓买入这部分股票,若卖出股票中包含预测单日收益Rank在排名前30%的股票,则暂缓卖出。因高频与日频的深度学习因子在空头端相关性较多头端相关性更强,故我们将延迟买入部分阈值调高。每期延迟调仓时,若延迟买入的信号比例小于/大于延迟卖出的信号比例,则按照延迟买入/卖出信号相同的比例取做延迟卖出/买入,以保证仓位在100%不变。下图 展示了平滑后的因子相关性以及延迟调仓数量占比。 图16:高频与日频因子多头收益与空头收益相关性图17:多空延迟