金融工程 专题报告 探索股价动态关联,捕捉属性敏感的动量溢出 ——量化研究系列报告之十六 报告日期:2024-3-21 主要观点: 分析师:骆昱杉 执业证书号:S0010522110001邮箱:luoyushan@hazq.com 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 相关报告 1.《加速换手因子:“适逢其时”的换手奥秘——量化研究系列报告之十 �》2024-03-19 2.《风格轮动三部曲:重构、探索和实践——量化研究系列报告之十四》2023-12-19 3.《PB之变:精细分拆,新生华彩— —量化研究系列报告之十三》2023-12-20 4.《收益和波动共舞:非对称性理论蕴含的alpha——量化研究系列报告之十二》2023-09-11 5.ChatGPT与研报文本情绪的碰撞 ——量化研究系列报告之十一》2023-08-14 6.《股价和资金流间的引力和斥力— —量化基本面系列报告之十》2023-06-12 本篇报告采用属性敏感的图注意力网络解决通过动量溢出效应预测股票走势的两个问题:(1)如何设计恰当的网络来处理属性敏感的动量溢出效应;(2)如何找到一种恰当的动态关系建模公司间的动态关联网络。 二级市场的动量溢出效应,普遍存在却难以量化 在股票市场中,一家公司股价的变化可能影响与其关联的其他公司股价,即动量溢出效应普遍存在,但很多传统方法却很难精准量化这种传播。如图神经网络GCN、GAT虽然聚合了关联公司的信息,但忽 略了属性的差异性,而关联公司之间的影响属性本身是非常敏感的。同时,传统方法多依赖预定义关系,这种关系是低频变化甚至是静态的,很难实时反映公司关系的变化。 DAM-GAT架构解决属性敏感与自动学习公司间的关联网络 本文构建了一种属性敏感且动态的图神经网络(DAM-GAT),来处理股票间属性敏感的动量溢出,并通过主动学习建立连接各个公司的动态关联网络。该模型结合高维张量在横截面捕捉特征的交互作用, 通过GRU处理特征的时序依赖问题,通过引入门控机制来刻画公司间的属性敏感性,通过动态关系推断公司关系,既考虑了属性差异,又自动学习了节点间的潜在联系,整体超越传统GNN模型的局限性。 DAM-GAT模型展现了一定的收益预测能力 通过DAM-GAT模型,以高频量价与以基本面为主的传统因子为输入预测的股票未来5日的收益因子𝒑𝒓𝒆𝒅𝟓�在不同指数域的都有选股能力,尤其在中小市值股票中表现出色。2020-2023年,周频调仓模 式下,𝑝𝑟𝑒𝑑5�因子在全域的RankIC为6.8%,ICIR为7.39,IC周胜率88.2%,费后多空年化超额41.09%,多头年化收益24.11%,较全A等权的超额13.43%,连续4年均取得了显著正超额。从指增策略的表现看,基于𝑝𝑟𝑒𝑑5�的指增策略在沪深300、中证500、中证1000、国证2000的年度超额分别为5.17%、8.55%、12.08%和11.08%。 风险提示 量化模型基于历史数据,过去的回测业绩不代表未来;量化模型本身存在失效的风险。 敬请参阅末页重要声明及评级说明证券研究报告 正文目录 1动量溢出效应,普遍存在却难以量化5 2特征驱动下的动量溢出模型6 2.1特征高维融合捕捉非线性的特征交互效应6 2.2序列嵌入:时序特征的提取8 2.3属性敏感的动量溢出网络图10 2.3.1如何设计恰当的网络来处理属性敏感的动量溢出效应11 2.3.2如何找到一种恰当的关系以描述存在动量溢出效应的公司对?12 2.4动态模拟动量溢出的股价预测网络(DAM-GAT)15 3DAM-GAT模型的性能评估16 3.1多频特征融合与公司关系网络16 3.2模型参数设置概览与训练效率18 3.3探索特征融合与属性溢出图的有效性20 3.3.1“特征融合”模块的测试结果20 3.3.2“属性溢出图”模块的测试结果21 3.3.3衍生探索:任务类别与输入的影响23 4DAM-GAT模型的收益预测能力26 4.1𝒑𝒓𝒆𝒅𝟓�因子在全域的表现26 4.2𝒑𝒓𝒆𝒅𝟓�因子在不同指数域的边际贡献27 5总结30 风险提示:30 图表目录 图表1关联公司的属性敏感性5 图表2GCN与GAT的要点6 图表3考虑属性敏感的动量溢出的股价趋势预测流程图6 图表4特征简单拼接与拼接&交互作用7 图表5交互特征的生成过程8 图表6特征融合+序列嵌入流程图9 图表7LSTM与GRU网络的循环单元结构10 图表8处理动量溢出效应的两个难题10 图表9GCN特征聚合示意图(以平均函数变换为例)11 图表10动量溢出:公司�的价格异常下跌是否能传导到关联公司�?12 图表11多头图注意力网络13 图表12邻居公司对目标公司的属性溢出14 图表13多头注意力机制下的属性溢出14 图表14网络结构图15 图表15模型训练周期划分示意图16 图表16量价指标列表及说明17 图表17传统因子列表及说明17 图表18公司关系列表及说明17 图表19数据预处理方法18 图表20股票池数量(只)18 图表21模型参数与基本设置19 图表22损失函数与评估函数设置19 图表23模型耗时与显存占用测算(RTX4090)19 图表24“特征融合”模块测试模型列表及说明20 图表25特征融合模块测试结果表(验证集与测试集损失)21 图表26特征融合:验证集损失21 图表27特征融合:测试集损失21 图表28PRED5D因子的表现(特征融合,2023.07.01-2023.12.29)21 图表29属性溢出图:测试模型列表及说明21 图表30属性溢出图:测试结果表(验证集与测试集损失)22 图表31属性溢出图:验证集损失22 图表32属性溢出图:测试集损失22 图表33PRED5D因子的表现(属性溢出图,2023.07.01-2023.12.29)22 图表34公司关系:测试模型列表及说明22 图表35公司关系:测试结果表(验证集与测试集损失)23 图表36公司关系:验证集损失23 图表37公司关系:测试集损失23 图表38PRED5D因子的表现(公司关系,2023.07.01-2023.12.29)23 图表39DAM-GAT分类预测的模型指标(2023.07.01-2023.12.29)24 图表40PRED_UP5D因子的表现(2023.07.01-2023.12.29)24 图表41AUC示意图及计算方式24 图表42数据新闻数据基本信息25 图表43数据新闻数据的主要字段及说明25 图表44不同输入下DAM-GAT模型的表现26 图表45𝒑𝒓𝒆𝒅𝟓�因子表现(周频调仓)26 图表46𝒑𝒓𝒆𝒅𝟓�因子的RANKIC(周频调仓)27 图表47𝒑𝒓𝒆𝒅𝟓�因子的分组净值曲线(%,周频调仓)27 图表48𝒑𝒓𝒆𝒅𝟓�因子的分年度表现(周频调仓)27 图表49𝒑𝒓𝒆𝒅𝟓�因子表现(周频、双周、月频调仓)27 图表50PRED5D因子在不同指数域的表现(十分组)28 图表51沪深300指增策略业绩对比29 图表52中证500指增策略业绩对比29 图表53中证1000指增策略业绩对比29 图表54国证2000指增策略业绩对比30 1动量溢出效应,普遍存在却难以量化 在股票市场中,相关公司之间存在“动量溢出”,即一家公司股价趋势往往会受到与其关联的公司的影响。在传统研究领域,我们一般通过产业链、概念板块等预定义好的关系寻找与领先上涨公司相关的关联公司。例如,A、B、C为关联公司,若A上涨,则认为B和C有较大的概率会跟涨。这种做法简单直接,但容易忽视B、C公司和A公司其他属性的差异,即很难将公司B、C本身的属性(如估值、换手、资金流等)相结合去量化公司A上涨对公司B和公司C的影响程度。 在神经网络出现后,我们可以通过图神经网络(GraphNeuralNetwork,GNN),将公司认为是图结构的“节点”,公司之间的关系为图的“边”,从图结构数据中学习每个邻居公司对中心公司的影响程度,并通过输入预定义的公司关系邻接矩阵来聚合节点的邻居信息,也就是说,图中的每个节点(中心公司)的状态表示为邻居(关 联公司)状态的聚合。然而,传统的GNN模型,如GCN(GraphConvolutional Network)、GAT(GraphAttentionNetwork),虽然聚合了邻居节点(公司)的信息,但考虑的层面只限于“邻居”,没有深入到“邻居的每个属性”,即并未考虑到邻居公司不同属性的差异,而在实际的股票市场中,关联公司的属性本就是动态变化的,他们之间的相互影响是属性敏感的。例如,图表1中的公司B和公司C是公司A的 关联公司,公司A出现了6%的大幅下跌,公司B和公司C预期会下跌吗?观察公司A本身,其估值达到了50倍,且交易量很小,换手率仅0.1%,则: (1)对于关联公司B而言,其估值仅10倍,价格本身可能被低估了,如果A 公司的下跌是杀估值,那么其异常价格下跌可能不会溢出到公司B; (2)关联公司C和公司A的估值和交易活跃度类似,属性相似性极高,那么A 的下跌蔓延到公司C的概率较高。 图表1关联公司的属性敏感性 资料来源:华安证券研究所整理 此外,传统图神经网络(GNN)的大概原理是先学习邻居表示,然后对相关的邻居公司的状态进行聚合,这里有两个关键点:图的基本结构(哪些节点是相互连接的)、边的强度。边的强度上,GCN等权聚合每条边的信息,而GAT在通过注意力 机制学习每条边的重要性。图的基本结构上,即哪些节点是相互连接的,GCN、GAT 都需要输入这个图的骨架,因为聚合的时候往往会依赖于这个骨架,一般做法是我们预定义一个公司关系的邻接矩阵(用0,1表示),告诉模型哪些节点是相互连接的,然后根据这个矩阵去聚合邻居的信息,如上游供应商、下游客户、竞争者、行业或板块等显性的公司之间的关系。显然,这些关系倾向于是低频变化甚至是静态的,而属性状态是通过各种公司关系传播的,除了这些预定义的静态的显性关系,还应 与宏观环境、市场走势、风格、投资者认知与交易习惯有一定关联,是随时间而变化 的,仅限于几种预定义关系会不可避免地引入噪声,从而误导股票预测。如,我们 常说的价值vs成长、小盘vs大盘,在市场上行时,投资者的风险偏好较高,在小盘成长类型的股票中的溢出效应就会更加明显,静态关系很难捕捉到这层隐藏传播线。 图表2GCN与GAT的要点 图神经网络 图的结构 边的连接强度 GCN GraphConvolutionalNetwork 预定义(哪些节点是相互连接的) 等权,每个邻居对中心节点的影响力相同 GAT GraphAttentionNetwork 通过注意力机制学习每条边的重要性,可不同 资料来源:华安证券研究所整理 2特征驱动下的动量溢出模型 要处理股票较属性敏感的动量溢出,同时解决“预定义关系”难以实时反映公司动态关系的问题,最后达到预测股价趋势的目的,本文设计了包含截面特征处理 (特征融合)、时序特征处理(序列嵌入)和考虑属性敏感的动量溢出(属性溢出图) 3大模块的模型。 图表3考虑属性敏感的动量溢出的股价趋势预测流程图 资料来源:华安证券研究所整理 2.1特征高维融合捕捉非线性的特征交互效应 在因子模型中,我们会通过不同类型的指标去预测股价走势,如量价数据、基本面为主的传统因子、文本因子等,传统做法是将不同类型的特征连接到一个超级向量中作为预测模型的输入,这不可避免地会忽略它们之间的内在关联,尤其是不同类型的特征相结合的时候,如高频量价(市场行为)与中低频基本面因子(财务指标)。因此,我们在预测模型之前嵌入捕捉不同特征交互作用的“特征融合”模块,其目的是寻找两种不同类型的数据之间的隐藏连接,以揭示它们是如何相互作用的,然后生成更丰富的表示-“交互特征”,然后将“交互特征”和原始输入特征一起作为预测模型的输入。 图表4特征简单拼接与拼接&交互