金融工程专题 2024年12月12日 深度学习赋能风格轮动与多策略融合 金融工程研究团队 ——开源量化评论(103) 魏建榕(首席分析师) 魏建榕(分析师)盛少成(分析师) 证书编号:S0790519120001 张翔(分析师) weijianrong@kysec.cn 证书编号:S0790519120001 shengshaocheng@kysec.cn 证书编号:S0790523060003 证书编号:S0790520110001 傅开波(分析师) 证书编号:S0790520090003 高鹏(分析师) 证书编号:S0790520090002 苏俊豪(分析师) 证书编号:S0790522020001 胡亮勇(分析师) 证书编号:S0790522030001 王志豪(分析师) 证书编号:S0790522070003 盛少成(分析师) 证书编号:S0790523060003 苏良(分析师) 证书编号:S0790523060004 何申昊(分析师) 证书编号:S0790524070009 陈威(研究员) 证书编号:S0790123070027 蒋韬(研究员) 证书编号:S0790123070037 相关研究报告 《遗传算法赋能交易行为因子—市场微观结构(20)》-2023.8.6 《深度学习赋能交易行为因子—市场微观结构(24)》-2024.5.24 《深度学习赋能分析师行为:更稳的盈利预期调整组合—开源量化评论 (99)》-2024.8.8 深度学习赋能交易行为因子挖掘 在《深度学习赋能交易行为因子》中,我们从最基本的行情和财务数据出发,讨论了LSTM模型在因子挖掘中的应用,从2019年至今月度RankIC均值为9.37%。在《深度学习赋能分析师行为:更稳的盈利预期调整组合》中,我们利用了Transformer模型进行了研报情感的判断,其也可用在因子挖掘中,相较于LSTM模型,该模型能够更好的把握时序数据的隐含关系,月度RankIC提升至10.27%。 深度学习维度下的风格选择 对于风格的界定,本文以多策略基本面选股公式“股票收益=估值提升+盈利+分红”为基础,同时考虑了对市场影响较大的其他风格,最终确定为:市值、价值、质量、成长、红利。我们采取全市场股票高低二分组,并将不同的风格进行两两组合,构建40个股票等权组合,月度更新,形成40种风格指数。 若直接从指数层面出发,指数Transformer因子的月度RankIC为6.13%,具备一定风格轮动效果,但该因子在优选多头层面效果一般,在尾部剔除层面效果较好。若从Transformer股票因子维度出发,其截面分位点聚合至指数的绝对比例有一定区分度,且多头效果优于空头。 深度学习风格综合优选方案:首先使用指数Tramsformer因子剔除排名后1/4的风格,再在剩下的风格指数池中利用股票Tramsformer因子聚合至指数的绝对比例优选2种风格,相较风格等权而言,超额收益波动比为0.97。 强化学习维度下的风格选择 对于强化学习输入端,我们使用Transformer模型进行风格指数短周期(1日)和长周期(5日)的滚动预测,并将短、长周期的隐藏层合并后输入强化学习模型。对于PPO和SAC算法而言,日度调仓下SAC算法的效果明显优于PPO算法。 但SAC方法在月频的训练结果一般,样本量较少导致收敛较难以及稳定性较差。因此综合考虑后的月频调仓方式为:将每日风格持仓的变动滚动20日取平均,每月底取较高的10种风格,相较风格等权而言,超额收益波动比为1.70。 多策略融合实践 综合考虑深度学习和强化学习的优劣,采取强化学习为主、深度学习为辅的方式:1、在强化学习优选的10种风格中,每种风格选取股票Transformer因子值较大的100只个股,取并集,得到股票池A,并统计每只个股出现的次数,得到A_count序列; 2、若股票池A中有股票位于深度学习优选的2种风格中,则在原始计数上加上 A_count中位数的1/3倍,得到A_count_adjust序列; 3、选取A_count_adjust序列靠前的100只个股,若出现两只股票排序相同的情况,优先选择股票Transformer因子值较大那只。相较于Transformer100而言,考虑风格后的Transformer优选100收益波动比从0.94提升至1.47。 风险提示:本报告模型基于历史数据测算,市场未来可能发生重大改变。 金融工程研究 金融工程专题 开源证券 证券研究报 告 目录 1、深度学习赋能交易行为因子挖掘4 1.1、LSTM深度学习因子挖掘框架和绩效回顾4 1.2、Transformer深度学习因子挖掘对比5 1.3、Transformer因子多头优选6 2、深度学习维度下的风格选择7 2.1、风格优选:指数Transformer因子7 2.2、风格优选:股票Transformer因子8 2.3、风格优选:深度学习综合方案9 3、强化学习维度下的风格选择10 3.1、PPO和SAC优选对比10 3.2、基于SAC的月度风格选择11 4、基于风格优选的多策略融合实践12 5、风险提示14 图表目录 图1:围绕收益拆解公式衍生出的基本面选股框架4 图2:开源金工特色LSTM因子挖掘整体流程5 图3:LSTM因子10分组多空对冲的年化收益率为32.74%5 图4:Transformer因子10分组多空对冲的年化收益率为38.77%6 图5:Transformer和LSTM因子累计RankIC6 图6:Transformer和LSTM因子10分组多空对冲6 图7:Transformer100净值较为优异6 图8:指数Transformer因子4分组绩效8 图9:指数Transformer因子尾部剔除效果较为优异8 图10:绝对比例4分组绩效:多头效果优于空头8 图11:比例相对变化4分组绩效8 图12:大盘价值风格2024年基本都位于多头端9 图13:深度学习综合方案:优选风格个数敏感性分析9 图14:深度学习综合方案:优选2种风格净值较为优异10 图15:PPO算法和SAC算法伪代码10 图16:开源金工特色强化学习风格轮动流程11 图17:SAC算法最终净值优于PPO算法11 图18:强化学习风格因子:优选风格个数敏感性分析12 图19:强化学习风格因子:优选10种风格净值较为优异12 图20:Transformer优选100收益波动比随lambda变化13 图21:Transformer优选100净值明显更优13 图22:Transformer优选100净值较为优异13 表1:Transformer100绝对收益年化23.37%,收益波动比0.947 表2:随着滚动天数N的变化,月度强化学习风格SAC因子4分组年化收益统计12 表3:深度学习和强化学习方法优选超额绩效对比12 表4:Transformer优选100绩效较为优异14 对于多策略融合而言,我们过去一系列报告的做法是从轮动规律相对较为显著的价值和成长展开,分别构建内部选股模型和模型间的轮动模型,如图1所示。 图1:围绕收益拆解公式衍生出的基本面选股框架 资料来源:开源证券研究所 对于图1的基本面选股框架,我们在做每个组合时通常分为两大步骤: (1)寻找优质股票池的界定标准。比如对于预期调整Plus组合,我们精细化的改进了分析师预期调整因子;对于价值Plus组合,我们精细化的改进了估值PB因子。 (2)寻找优质股票池内的优质因子和最优结合方式。比如对于超预期Plus组合和预期调整Plus组合而言,特色大小单资金流因子都是组合超额的重要补充。 以上做法理论上可以把每一类策略从可解释逻辑的层面做到极致,以及寻找出最优的风格配比,但缺点是耗时长、完备性差。 本文尝试从深度学习和强化学习角度出发,自动选择风格,并在风格内优选股票,从而实现使用基本的行情和财务指标,就可进行有效的多策略融合。 值得一提的是,在机器学习领域,我们已经发布一系列报告,分别为《遗传算法赋能交易行为因子》、《深度学习赋能交易行为因子》、《深度学习赋能分析师行为:更稳的盈利预期调整组合》,感兴趣的读者可自行查阅。 1、深度学习赋能交易行为因子挖掘 1.1、LSTM深度学习因子挖掘框架和绩效回顾 在《深度学习赋能交易行为因子》中,我们从最基本的行情和财务数据出发,讨论了LSTM模型在因子挖掘中的应用,模型的架构如图2,绩效如图3所示。从20190101至20241129,LSTM因子的月度RankIC均值为9.37%,RankICIR为3.86。 10分组多空对冲的年化收益率为32.74%,月度最大回撤为4.26%,月度胜率82.86%。 图2:开源金工特色LSTM因子挖掘整体流程 资料来源:开源证券研究所 图3:LSTM因子10分组多空对冲的年化收益率为32.74% 数据来源:Wind、开源证券研究所(统计区间:20190101-20241129) 1.2、Transformer深度学习因子挖掘对比 在《深度学习赋能分析师行为:更稳的盈利预期调整组合》中,我们利用了Transformer模型进行了研报情感的判断,其也可用在因子挖掘中。相较于LSTM模型而言,该模型对于时序数据的隐含关系能够更好的把握,或有更好的选股效果,这里我们对其进行了尝试。其中数据处理细节和初始数据都和LSTM因子挖掘中保持一致,财务数据合并在了Decoder层后的隐藏层中。 从20190101至20241129,Transformer因子的月度RankIC均值为10.27%,RankICIR为4.35。10分组多空对冲的年化收益率为38.77%,月度最大回撤为4.46%,月度胜率为81.43%。相较于LSTM因子而言,整体的绩效有一定程度的提升,RankIC从9.37%提升至10.27%。 从RankIC累计曲线以及10分组多空来看,Transformer因子跑赢LSTM因子主要在2021年以来,其或说明Transformer在风格变化较快的市场中,有着更强的信息提取能力,所以本文后续展开的研究主要以Transformer为主。 图4:Transformer因子10分组多空对冲的年化收益率为38.77% 数据来源:Wind、开源证券研究所(统计区间:20190101-20241129) 图5:Transformer和LSTM因子累计RankIC图6:Transformer和LSTM因子10分组多空对冲 数据来源:Wind、开源证券研究所(统计区间:20190101-20241129数据来源:Wind、开源证券研究所(统计区间:20190101-20241129 1.3、Transformer因子多头优选 这里我们以优选100只股票为例,展示了Transformer因子的多头优选能力,具体净值如图7,绩效如表1所示。从20190101至20241129,Transformer100绝对收益年化为23.37%,收益波动比为0.94。 图7:Transformer100净值较为优异 数据来源:Wind、开源证券研究所(统计区间:20190101-20241129) 年度 区间收益 收益波动比 月度最大回撤 月度胜率 2019 55.65% 2.08 5.18% 63.64% 2020 31.62% 1.37 8.47% 66.67% 2021 28.71% 2.24 3.27% 75.00% 绝对收益2022 -10.57% -0.37 20.58% 50.00% 2023 29.18% 2.09 4.07% 75.00% 2024 17.55% 0.45 18.08% 54.55% 全区间 23.37% 0.94 24.40% 64.29% 2019 21.11% 4.85 0.00% 100.00% 2020 9.38% 1.17 5.22% 75.00% 2021 11.30% 1.0