您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开源证券]:市场微观结构(24):深度学习赋能交易行为因子 - 发现报告

市场微观结构(24):深度学习赋能交易行为因子

2024-05-24魏建榕、盛少成开源证券梅***
市场微观结构(24):深度学习赋能交易行为因子

2024年05月24日 金融工程研究团队 ——市场微观结构(24) 魏建榕(首席分析师)证书编号:S0790519120001 魏建榕(分析师)weijianrong@kysec.cn证书编号:S0790519120001 盛少成(分析师)shengshaocheng@kysec.cn证书编号:S0790523060003 张翔(分析师)证书编号:S0790520110001 遗传算法绩效回顾 我们在《遗传算法赋能交易行为因子》中,创新性地提出“切割算子”,并结合其他算子和变量,利用改进的遗传算法流程,经过1轮10代的挖掘,得到了开源金工遗传算法因子:Alpha185。从2017年1月至2024年4月,合成后因子RankIC为12.14%,RankICIR为4.45,10分组多空年化收益为34.79%,信息比率为3.16,2022年6月份以来的样本外整体表现也较为优异。 傅开波(分析师)证书编号:S0790520090003 高鹏(分析师)证书编号:S0790520090002 深度学习挖掘因子 基于LSTM框架的因子挖掘,为本文主要讨论的部分,从输入层到输出层分为4部分:1、输入层。我们考虑了三大类变量:日频量价、分钟频量价、大小单资金流;2、中间主体模型。我们使用时序处理应用较多的LSTM模型;3、加入财务数据,弥补量价类因子多头端分层一般的劣势;4、输出层。我们对比了单输出和多输出的绩效差别。基于该框架,产生了三大月频因子:𝐿𝑆𝑇𝑀𝑖𝑛𝑖𝑡、𝐿𝑆𝑇𝑀𝑝𝑟𝑜、𝐿𝑆𝑇𝑀𝑝𝑟𝑜_𝑚𝑢𝑙𝑡𝑖: 苏俊豪(分析师)证书编号:S0790522020001 胡亮勇(分析师)证书编号:S0790522030001 王志豪(分析师)证书编号:S0790522070003 1、未考虑财务数据的𝐿𝑆𝑇𝑀𝑖𝑛𝑖𝑡RankIC为8.08%,RankICIR为3.99,已经具备较为优异的选股效果,但10分组多头较为一般,为量价类因子普遍的劣势。进一步地,我们引入财务数据去改善。 盛少成(分析师)证书编号:S0790523060003 2、对于财务数据而言,考虑到其时序变化较慢,我们并没有将其和日度变化的量价类指标一起作为初始输入层数据,而是将其转化为分位点后,放入输出层前一层,和量价类指标通过隐藏层后的神经元进行拼接,一起通过全连接层输出为最后的因子𝐿𝑆𝑇𝑀𝑝𝑟𝑜。该因子RankIC为9.17%,RankICIR为4.49,相较于𝐿𝑆𝑇𝑀𝑖𝑛𝑖𝑡整体的绩效有所提升,更为重要的是,多头端的分层效果更为优异。 苏良(分析师)证书编号:S0790523060004 何申昊(研究员)证书编号:S0790122080094 3、通过在原始损失函数的基础上加上多因子间的相关性惩罚,我们构建了多输出𝐿𝑆𝑇𝑀𝑝𝑟𝑜_𝑚𝑢𝑙𝑖𝑡,但是该因子绩效相较于𝐿𝑆𝑇𝑀𝑝𝑟𝑜并无显著提升,训练成本反而更高,所以𝐿𝑆𝑇𝑀𝑝𝑟𝑜为本文最后推荐的因子。 陈威(研究员)证书编号:S0790123070027 深度学习改进因子 除了因子挖掘,LSTM框架还可以尝试因子改进,本文我们以理想反转为例进行小篇幅展开,尝试使用LSTM对其进行改进,具体的做法即在原损失函数的基础上考虑与待改进因子的相关系数。改进理想反转因子的RankIC为-9.03%,RankICIR为-4.13,明显优于原始理想反转。 蒋韬(研究员)证书编号:S0790123070037 相关研究报告 人工因子、遗传算法因子、深度学习因子对比 对于人工因子而言,我们选取了8大因子:理想反转、APM、聪明钱、理想振幅、主动买卖、大单残差、小单残差、散户羊群效应,8大因子的等权合成综合因子RankICIR为4.59;遗传算法Alpha_185因子RankICIR为4.45;深度学习因子RankICIR为4.49。在多头超额上,深度学习因子表现最优,在中证1000指数增强上表现也最好。 《遗传算法赋能交易行为因子—市场微观结构(20)》-2023.8.6 《A股反转之力的微观来源—市场微观结构(1)》-2019.12.23 风险提示:本报告模型基于历史数据测算,市场未来可能发生重大改变。 目录 1、遗传算法因子Apha185绩效回顾............................................................................................................................................32、基于LSTM框架应用一:因子挖掘........................................................................................................................................42.1、输入层数据:3大类变量..............................................................................................................................................42.2、主体模型:LSTM............................................................................................................................................................52.3、输出层前一层:加入财务数据.....................................................................................................................................62.4、输出层:因子数量的讨论.............................................................................................................................................72.5、LSTM因子挖掘绩效汇总...............................................................................................................................................82.6、不同样本空间测试.........................................................................................................................................................92.7、深度学习因子与人工因子、遗传算法因子的对比分析............................................................................................103、基于LSTM框架应用二:因子改进......................................................................................................................................124、风险提示..................................................................................................................................................................................14 图表目录 图1:开源金工特色遗传算法整体流程.......................................................................................................................................3图2:开源金工遗传算法Alpha185因子合成后10分组表现较为优异....................................................................................4图3:开源金工特色LSTM因子挖掘整体流程...........................................................................................................................4图4:𝑳𝑺𝑻𝑴𝒊𝒏𝒊𝒕因子10分组表现较为优异,但多头端分组效果一般....................................................................................6图5:加入财务后构建的因子𝑳𝑺𝑻𝑴𝒑𝒓𝒐的10分组表现:多头端改善明显............................................................................7图6:多输出𝑳𝑺𝑻𝑴𝒑𝒓𝒐_𝒎𝒖𝒍𝒕𝒊的10分组对冲:相较于𝑳𝑺𝑻𝑴𝒑𝒓𝒐而言,收益波动比提升..................................................8图7:深度学习因子𝑳𝑺𝑻𝑴𝒑𝒓𝒐的中证1000指增净值表现较为优异........................................................................................9图8:人工因子、遗传算法因子、深度学习因子挖掘因子流程..............................................................................................10图9:人工因子RankIC统计:综合因子RankIC达到11.1%..................................................................................................11图10:人工因子、遗传算法因子和深度学习因子的中证1000指增超额净值对比..............................................................11图11:原始理想反转因子10分组多空对冲收益波动比为2.84..............................................................................................13图12:相较于原始理想反转,改进理想反转多空对