您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:因子选股系列之九十六:子选股系列之九十八 - 发现报告
当前位置:首页/其他报告/报告详情/

因子选股系列之九十六:子选股系列之九十八

2024-02-28杨怡玲东方证券亓***
因子选股系列之九十六:子选股系列之九十八

自适应时空图网络周频alpha模型 ——因子选股系列之一〇一 研究结论 自适应图模型的优势 本文提出了一个RNN中嵌入自适应图的网络结构(ASTGNN)来进行因子挖掘任务。这种新的网络结构能够同时对时间和空间信息进行挖掘,既能考虑到时间维度上个股特征演化关系,又能兼顾空间截面上所有个股的交互作用。 相较于传统图模型通过行业分类、是否属于同一基金持仓或者基本面这些人为选取 金融工程|专题报告 报告发布日期2024年02月28日 杨怡玲yangyiling@orientsec.com.cn 执业证书编号:S0860523040002 陶文启taowenqi@orientsec.com.cn 且滞后性较高的信息构建的邻接矩阵,新模型定义的邻接矩阵完全是数据驱动的,通过个股自身走势或者相关特征自助捕捉个股间的交互关系,因而新模型对空间截面上个股交互关系的刻画更加客观且实时性更强。 自适应图模型邻接矩阵规模只依赖于输入数据量,而不再需要固定其规模,因而自适应图模型的灵活性更高、实用性更大。 单数据集上实验结论 从各数据集生成因子分别的回测结果来看,我们可以得到:数据集week生成因子表现最好,RankIC和多头收益率均显著超过另外几个数据集,但波动和回撤也较大。而l2数据集表现最弱,但多头最大回撤相对较低走势稳健性相对较好。近年来day数据集出现了一定的衰减,而l2数据集几乎未出现衰减。 从各数据集通过ASTGNN和GRU生成单因子相关系数矩阵结果来看:1.两模型在各数据集上生成单因子的相关性均在85%~95%之间,相对较高,说明两个模型在各数据集上挖掘出的有效信息相似度较高但仍具有一定的差异性。2.ASTGNN在各数据集上生成单因子间的相关性普遍低于GRU,说明不同数据集上挖掘出的个股关联关系有一定差异性。 合成因子的实验结论 从最终因子回测结果来看我们可以得到:1.相较于GRU,ASTGNN模型RankIC、ICIR、RankIC>0占比等指标均显著提升,最大回撤也显著降低。这说明通过在因子挖掘阶段嵌入图结构确实能辅助GRU得到更多的的信息增量。2.相较于GRU,新 模型换手率有所上升,这可能和邻接矩阵变化存在一定的关系,即本期和上一期RNN部分挖掘的特征向量可能变化不大,但由于邻接矩阵变化导致两期最终生成的弱因子差异性上升,最终使得换手率上升。 基于ASTGNN模型在各个数据集上进行因子挖掘然后非线性加权所得打分2018年和2020年以来在中证全指、沪深300、中证500、中证1000四个指数上十日RankIC均值分别为16.00%、10.50%、12.30%、15.27%和14.27%、9.68%、10.32%、12.99%,top组年化超额分别为46.11%、27.92%、25.28%、34.44%和 37.19%、27.28%、21.91%、27.48%。相较于基准模型,各宽基指数股票池上新模 型生成因子的选股效果均有明显提升。 本文生成因子也可以直接应用于指数增强策略,在各宽基指数上均能获得显著的超额收益,在成分股不低于80%限制、周单边换手率约束为20%约束下,2018年以来,新模型打分在沪深300、中证500和中证1000增强策略上年化超额收益率分别为16.59%、22.32%和31.12%。 风险提示 量化模型失效 极端市场造成冲击,导致亏损 基于抗噪的AI量价模型改进方案:——因子选股系列之九十八 基于残差网络的端到端因子挖掘模型:— —因子选股系列之九十六 基于循环神经网络的多频率因子挖掘:— —因子选股系列之九十一 2023-12-24 2023-08-24 2023-06-06 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 引言4 一、自适应时空图循环神经网络5 1.1图与图神经网络简介5 1.2自适应时空循环神经网络简介6 二、各数据集单因子分析7 2.1回测说明7 2.2各数据集单因子绩效分析8 2.3各数据集单因子相关系数分析9 三、各数据集因子非线性加权结果分析10 3.1中证全指上的表现10 3.2各宽基指数上的表现11 四、合成因子指数增强组合表现12 4.1增强组合构建说明12 4.2沪深300指数增强12 4.3中证500指数增强13 4.4中证1000指数增强14 五、结论15 风险提示16 参考文献17 图表目录 图1:端到端AI量价模型框架4 图2:权重图示意图5 图3:自适应时空图网络结构7 图4:各数据集生成因子汇总表现(回测期20170101~20231231)8 图5:各数据集生成因子分组测试结果(回测期20170101~20231231)8 图6:各数据集ASTGNN生成因子多头净值走势(回测期20170101~20231231)9 图7:各数据集生成因子相关系数9 图8:中证全指选股汇总表现(回测期20180101~20231231)10 图9:中证全指各年度选股表现(回测期20180101~20231231)11 图10:各宽基指数上选股表现(回测期20180101~20231031)11 图11:沪深300指增组合分年度超额收益率(截至20231231)12 图12:沪深300指增组合汇总结果(截至20231231)13 图13:沪深300指增组合净值走势(成分股80%限制,净值左轴,回撤右轴)13 图14:中证500指增组合分年度超额收益率(截至20231031)13 图15:中证500指增组合汇总结果(截至20231231)14 图16:中证500指增组合净值走势(成分股80%限制,净值左轴,回撤右轴)14 图17:中证500指增组合净值走势(成分股不限制,净值左轴,回撤右轴)14 图18:中证1000指增组合分年度超额收益率(截至20231231)14 图19:中证1000指增组合汇总结果(截至20231231)15 图20:中证1000指增组合净值走势(成分股80%限制,净值左轴,回撤右轴)15 图21:中证1000指增组合净值走势(成分股不限制,净值左轴,回撤右轴)15 引言 随着人工智能学科的快速发展,以神经网络、决策树为主的机器学习模型在量化领域大放异彩,前期报告《基于循环神经网络的多频率因子挖掘》、《基于残差网络端到端因子挖掘模型》、 《基于抗噪的AI量价模型改进方案》中,我们利用循环神经网络(RNN)、残差网络(ResNets)和决策树模型搭建了端到端AI量价模型框架,这套框架的输入是个股最原始的高开低收等,而最终的输出则是具有较强选股能力的alpha因子。我们将其该框架生成的因子应用于选股策略。回测结果显示该策略在样本外有着十分显著的选股效果。 这套AI量价模型框架主要是基于多个不同频率数据集搭建的,这些数据集分别是周度 (week)、日度(day)、分钟线(ms)和Level-2(l2)数据集。其中周度和分钟线数据集我们分别是将每五个交易日日K线和每日半小时K线形成矩阵数据,然后将这些矩阵通过ResNets提取出相应时间频度的特征向量而形成的,而Level-2则是将原始数据通过人工合成成日频因子的方式形成的。 整个AI量价模型框架分为三个部分,数据预处理、提取因子单元、因子加权。数据预处理包括去极值标准化和补充缺失值三个步骤,而提取因子单元则是通过RNN将输入转化成一系列具有一定选股能力的弱因子,因子加权则是利用决策树对这些RNN生成的弱因子进行短周期非线性加权形成模型最终的个股得分,部分整个流程如下图所示: 图1:端到端AI量价模型框架 数据来源:东方证券研究所 考虑到这套框架在因子单元生成阶段使用的是RNN模型,该模型只能学习个股自身历史序列的信息而忽略了股票之间的交互关系,而A股市场相似股票(比如相同产业链、相同概念板块)存在着一定程度的同涨同跌的同步效应,强势个股也可能带领整个概念板块所有个股的上涨,因此捕捉股票间交互作用显得尤为重要。为了克服RNN的这种缺陷,本文中我们在框架中因子单元生成阶段嵌入图结构,来捕捉这种交互作用。 一、自适应时空图循环神经网络 1.1图与图神经网络简介 图是用来表示数据点之间关联关系的一种结构。对于一个数据点集�=[𝑥1,𝑥2,⋯,𝑥𝑛],这里 𝑥�表示第�个节点对应的特征,如果我们把这些点看做图的一系列节点(node),第�个节点称之为𝑣�这些节点的集合记作𝑉,有关联关系的顶点之间相互连接形成一系列边(edge),给这些边设置相应的权重并且把这些带权重的边构成的集合记作𝐸,将连接节点�与�的边记为𝑒𝑖,�其对应权重记为𝑤𝑖,�(当图是无向图时显然有𝑤𝑖,�=𝑤𝑗,�),则我们可以构建一个权重图�=(𝑉,𝐸)来表示这些图上节点之间的关联关系。当数据点数量趋于无穷大时,权重图则能收敛于数据分布的底层流形。因而权重图是刻画数据分布以及数据间关联关系的重要手段。 图2:权重图示意图 数据来源:东方证券研究所 特别的,如果我们用𝑢�作为节点�在这个图上的一个表示,那么我们自然希望如果节点�、� 之间边权重𝑤𝑖,�越大则对应的表示𝑢�与𝑢�之间距离越近,显然所有节点的表示矩阵�= [𝑢1,𝑢2,⋯,𝑢𝑛]可以通过极小化以下能量函数进行求解: 2 min�∑𝑤𝑖,𝑗(𝑢�−𝑢𝑗) 𝑖,� 𝑖,�𝑖,� 记𝑑�=∑�𝑤𝑖,�,则我们称矩阵�=[𝑤𝑖,𝑗]为图�的邻接矩阵,矩阵�=[𝑤𝑖,𝑗]为图�的度矩阵,矩阵�−�则称为图�的非标准化的graphLaplacian,剔除向量�长度和分量全为1的常值解影响,上述优化问题可以等价为寻找矩阵�=�−𝑫−𝟏/𝟐𝑨𝑫−𝟏/�特征值和特征向量问题进行求解,这里矩阵�为单位矩阵,矩阵�则被称之为图�的标准化的graphLaplacian。当采样点个数趋于无穷大时,graphLaplacian将收敛于底层流形上的内蕴量——Laplace算子,因而graphLaplacian矩阵能很好的刻画权重图的关联信息。 类似傅里叶卷积变换的操作,如果以标准化的graphLaplacian特征向量作为一组基向量,对于一个给定向量�,我们也可以定义图卷积操作: 𝑔�∗�=𝑼𝑔𝜃𝑼𝑻� 这里𝑔�是对角矩阵,其对角元是一组参数,矩阵�是graphLaplacian矩阵特征向量构成的。如果我们把𝑔�的对角元作为一组可学习的参数,并且利用利用1阶切比雪夫多项式进行逼近,则图卷积操作信号输出�则可近似为[1]: �=(�+𝑫−𝟏/𝟐𝑨𝑫−𝟏/𝟐)𝑿� 一个多层的图卷积神经网络结构则可表示为: 𝒁𝒍+�=𝜎((�+𝑫−𝟏/𝟐𝑨𝑫−𝟏/𝟐)𝒁𝒍𝑾𝒍) 这里𝑾�表示图神经网络第�层可学习的权重参数,𝒁�表示第�层输入和第�−1层输出(𝒁�为图神经网络的输入,即𝒁�=𝑿),𝜎(∙)表示层之间的激活函数通常取ReLU(x)=max(x,0)。可以看到图神经网络通过将一个先验的邻接矩阵作为输入,可以辅助模型有效的学习出空间域内数据点之间的关联关系。 1.2自适应时空循环神经网络简介 传统的图神经网络需要预定义用于图卷积运算的邻接矩阵𝑨,现有方法主要是利用距离函数或者相似性度量来事先计算该矩阵,比如使用所属行业、主营业务、基本面等等来衡量相似性,但是这些方法有着许多不合理因素: 1.滞后性较高,比如基本面需要根据业绩报告一个季度更新一次、所属行业分类则更新频率更低。因此对于中高频策略往往实用性更低。 2.主观性较高,股票短期相似性可能受到所属概念炒作的影响,因此股票相似性很可能体现在个股自身短期走势上,所以预定义的邻接矩阵往往不能包含有关个股完整信息的空间依赖性,而导致与所需预测的未来收益率没有直接关系,最终使得邻接矩阵对个股关联关系的度量有着