报告发布日期 基于风险注意力的因子挖掘模型 ——因子选股系列之一〇六 杨怡玲yangyiling@orientsec.com.cn执业证书编号:S0860523040002薛耕xuegeng@orientsec.com.cn执业证书编号:S0860523080007 研究结论 ⚫在之前的报告中,我们通过使用行业关联、分析师共同覆盖和基金共同持仓这三种股票间的显式关系,构建了一个异构图模型。这个模型使得个股特征可以在三种关系路径上传播和聚合,从而引入关联股票的信息,提升了原始因子的表现。在本文中,我们利用注意力机制解决了股票间关联关系刻画的诸多难点,实现了时序信息和空间信息的融合。仅仅使用行情信息和风险因子的情况下,我们的RankIC达到了0.106,多头超额年化收益率达到了40.3%。 非线性市值风控全攻略:——因子选股系列之一〇五2024-05-27融合基本面信息的ASTGNN因子挖掘模型:——因子选股系列之一〇四2024-05-27DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案:——因子选股系列之一〇三2024-05-14 ⚫先验图的缺陷包括以下几点:1)稀疏性:例如,近期没有被分析师覆盖的大多数个股,无法与其他股票在分析师层面上产生关联。2)对称性:大部分的先验关系不具有方向性,大小市值的个股对彼此的影响权重是相同的,这有悖于常识。3)主观性:先验关系大多来自于人为定义,比如行业定义、研报覆盖窗口和基金池等。4)滞后性:类似基金持仓的披露数据相比实际发生时间滞后了2-4个月。5)类别众多:异构图模型的参数量与关系种类成正比,关系种类越多,模型参数量越大。 ⚫图网络与注意力机制的一致性:图注意力网络(GAT)通过将“目标节点特征”和“源节点特征”合并并降维,计算出关联权重,这种注意力机制被称为“加性注意力”。与之对应的“乘性注意力”则通过“目标节点特征(Q)”和“源节点特征(K)”的点积来获得关联权重。无论使用哪种注意力机制,一旦获得关联权重,节点特征(V)便在该关联矩阵上进行传播和聚合,二者的机制基本一致。 ⚫用风险关联传播量价特征:在传统的Transformer模型中,如果Q、K、V都来自同一数据源,则为自注意力;如果只有K和V来自同一数据源,则为跨注意力。在本文中,Q和K源自风险因子,而V源自行情数据,用以探索基于风险特征的注意力是否能引入关联股票的量价特征,从而增强个股的量价特征。我们将这个模型称为Risk-Attention模型。 ⚫数据和训练:本文使用了30天的OHLCV时序数据作为行情数据,10个DFQ-2020因子(类似Barra因子)加上29个行业哑变量,共计39个截面风险因子。我们对未来T+1至T+11天的收益率标签进行拟合。训练策略采用“10+1+1”的“训练-验证-测试”窗口,按年进行滚动训练。每个数据集训练三次,并取预测结果的平均值,样本频率为周频。 ⚫回测结果:Risk-Attention模型在周频(2018年1月5日-2024年3月15日)上的表现如下:RankIC为0.106,ICIR为6.30,夏普值为5.23,多头超额年化收益率达到40.3%。相较于仅使用时序信息的Raw GRU和简单拼接风险因子的Cat MLP,Risk-Attention在2020年后的收益表现尤为突出,体现出了其结构的有效性(如下图所示)。 风险提示 量化模型失效风险、市场极端环境冲击 目录 一、引言........................................................................................................4 二、模型与数据.............................................................................................6 2.1图与注意力机制............................................................................................................62.2风险注意力模型............................................................................................................72.3数据说明......................................................................................................................8 三、测试结果.................................................................................................9 3.1训练策略......................................................................................................................93.2回测说明....................................................................................................................103.3回测结果....................................................................................................................11 四、Risk-Attention模型讨论........................................................................13 4.1注意力结构带来的信息增量........................................................................................134.2对于注意力权重矩阵的解读........................................................................................14 五、总结与讨论...........................................................................................16 六、风险提示...............................................................................................17 七、引用文献...............................................................................................17 图表目录 图1:前序报告模型和因子回测结果.............................................................................................4图2:加性注意力和乘性注意力....................................................................................................6图3:Risk-Attention模型结构......................................................................................................7图4:大类风险因子列表..............................................................................................................8图5:训练策略说明......................................................................................................................9图6:回测说明...........................................................................................................................10图7:因子整体表现及多头净值分析...........................................................................................11图8:IC序列、IC50周滚动均值及IC累加................................................................................11图9:分年RankIC及分年多头超额...........................................................................................11图10:分组超额净值(颜色越深,因子打分越高)...................................................................12图11:分组超额年化收益...........................................................................................................12图12:三模型结构说明..............................................................................................................13图13:三模型净值对比..............................................................................................................14图14:三模型分组年化超额收益对比.........................................................................................14图15:三模型因子回测表现.......................................................................................................14图16:注意力权重矩阵热力图...............................................................................................