自适应时空图网络周频alpha模型 ——因子选股系列之一〇一 杨怡玲yangyiling@orientsec.com.cn执业证书编号:S0860523040002 研究结论 自适应图模型的优势 ⚫本文提出了一个RNN中嵌入自适应图的网络结构(ASTGNN)来进行因子挖掘任务。这种新的网络结构能够同时对时间和空间信息进行挖掘,既能考虑到时间维度上个股特征演化关系,又能兼顾空间截面上所有个股的交互作用。 陶文启taowenqi@orientsec.com.cn ⚫相较于传统图模型通过行业分类、是否属于同一基金持仓或者基本面这些人为选取且滞后性较高的信息构建的邻接矩阵,新模型定义的邻接矩阵完全是数据驱动的,通过个股自身走势或者相关特征自助捕捉个股间的交互关系,因而新模型对空间截面上个股交互关系的刻画更加客观且实时性更强。 基于抗噪的AI量价模型改进方案:——因子选股系列之九十八2023-12-24基于残差网络的端到端因子挖掘模型:——因子选股系列之九十六2023-08-24基于循环神经网络的多频率因子挖掘:——因子选股系列之九十一2023-06-06 ⚫自适应图模型邻接矩阵规模只依赖于输入数据量,而不再需要固定其规模,因而自适应图模型的灵活性更高、实用性更大。 单数据集上实验结论 ⚫从各数据集生成因子分别的回测结果来看,我们可以得到:数据集week生成因子表现最好,RankIC和多头收益率均显著超过另外几个数据集,但波动和回撤也较大。而l2数据集表现最弱,但多头最大回撤相对较低走势稳健性相对较好。近年来day数据集出现了一定的衰减,而l2数据集几乎未出现衰减。 ⚫从各数据集通过ASTGNN和GRU生成单因子相关系数矩阵结果来看:1.两模型在各数据集上生成单因子的相关性均在85%~95%之间,相对较高,说明两个模型在各数据集上挖掘出的有效信息相似度较高但仍具有一定的差异性。2.ASTGNN在各数据集上生成单因子间的相关性普遍低于GRU,说明不同数据集上挖掘出的个股关联关系有一定差异性。 合成因子的实验结论 ⚫从最终因子回测结果来看我们可以得到:1.相较于GRU,ASTGNN模型RankIC、ICIR、RankIC>0占比等指标均显著提升,最大回撤也显著降低。这说明通过在因子挖掘阶段嵌入图结构确实能辅助GRU得到更多的的信息增量。2.相较于GRU,新模型换手率有所上升,这可能和邻接矩阵变化存在一定的关系,即本期和上一期RNN部分挖掘的特征向量可能变化不大,但由于邻接矩阵变化导致两期最终生成的弱因子差异性上升,最终使得换手率上升。 ⚫基于ASTGNN模型在各个数据集上进行因子挖掘然后非线性加权所得打分2018年和2020年以来在中证全指、沪深300、中证500、中证1000四个指数上十日RankIC均值分别为16.00%、10.50%、12.30%、15.27%和14.27%、9.68%、10.32%、12.99%,top组年化超额分别为46.11%、27.92%、25.28%、34.44%和37.19%、27.28%、21.91%、27.48%。相较于基准模型,各宽基指数股票池上新模型生成因子的选股效果均有明显提升。 ⚫本文生成因子也可以直接应用于指数增强策略,在各宽基指数上均能获得显著的超额收益,在成分股不低于80%限制、周单边换手率约束为20%约束下,2018年以来,新模型打分在沪深300、中证500和中证1000增强策略上年化超额收益率分别为16.59%、22.32%和31.12%。 风险提示 ⚫量化模型失效⚫极端市场造成冲击,导致亏损 目录 引言...............................................................................................................4 一、自适应时空图循环神经网络.....................................................................5 1.1图与图神经网络简介.....................................................................................................51.2自适应时空循环神经网络简介......................................................................................6 二、各数据集单因子分析...............................................................................7 2.1回测说明.......................................................................................................................72.2各数据集单因子绩效分析.............................................................................................82.3各数据集单因子相关系数分析......................................................................................9 三、各数据集因子非线性加权结果分析........................................................10 3.1中证全指上的表现......................................................................................................103.2各宽基指数上的表现...................................................................................................11 四、合成因子指数增强组合表现...................................................................12 4.1增强组合构建说明......................................................................................................124.2沪深300指数增强......................................................................................................124.3中证500指数增强......................................................................................................134.4中证1000指数增强....................................................................................................14 风险提示......................................................................................................16 参考文献......................................................................................................17 图表目录 图1:端到端AI量价模型框架......................................................................................................4图2:权重图示意图......................................................................................................................5图3:自适应时空图网络结构.......................................................................................................7图4:各数据集生成因子汇总表现(回测期20170101~20231231)...........................................8图5:各数据集生成因子分组测试结果(回测期20170101~20231231)....................................8图6:各数据集ASTGNN生成因子多头净值走势(回测期20170101~20231231)....................9图7:各数据集生成因子相关系数................................................................................................9图8:中证全指选股汇总表现(回测期20180101~20231231).................................................10图9:中证全指各年度选股表现(回测期20180101~20231231).............................................11图10:各宽基指数上选股表现(回测期20180101~20231031)...............................................11图11:沪深300指增组合分年度超额收益率(截至20231231)...............................................12图12:沪深300指增组合汇总结果(截至20231231).............................................................13图13:沪深300指增组合净值走势(成分股80%限制,净值左轴,回撤右轴).......................13图14:中证500指增组合分年度超额收益率(截至20231031)..............................................13图15:中证500指增组合汇总结果(截至20231231).............................................................14图16:中证500指增组合净值走势(成分股80%限制,净值左轴,回撤右轴).......................14图17:中证500指增组合净值走势(成分股不限制,净值左轴,回撤右轴)...........................14图18:中证1000指增组合分年度超额收益率(截至20231231)..........................