您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:量化专题报告:基于深度学习的短周期量价风控体系 - 发现报告

量化专题报告:基于深度学习的短周期量价风控体系

2025-01-15缪铃凯、刘富兵国盛证券付***
量化专题报告:基于深度学习的短周期量价风控体系

指数增强的超额回撤 2024年以来,由于市场波动放大、风格切换速度加快等原因,指数增强基金出现过数次大幅跑输业绩基准,超额收益明显回撤的行情。从组合业绩归因来看,风格因子贡献了显著的负超额收益。 然而我们发现,在组合构建时约束风格因子的相对暴露,对于组合的风险表现改善并无明显效果。为此,我们希望基于量价数据提取变化更为迅速的风险特征以改善指增组合的风险表现。 基于深度学习量价风险因子 我们基于深度学习从不同类别的数据特征集合中构建了8个维度的短周期量价风险刻画,这些风险指标对于股票周度窗口的截面收益呈现出显著的解释能力。 为了避免构建的风险特征中夹杂alpha选股信息,我们在风险因子中剥离其蕴含的alpha信息,得到因子IC序列围绕零均值波动的纯粹风险刻画。 指数增强组合的量价风控 对于中证500、中证1000等宽基指数增强组合而言,历史上短周期量价风险约束能保证不损失组合收益前提下,有效降低组合的波动和回撤,显著改善指增组合的风险表现。 尤其在于2024年,约束短周期量价风险后,指数增强组合超额收益的回撤幅度明显降低。 风险提示:报告结论基于历史数据统计建模,模型过拟合、市场风格切换均可能导致失效。 一、指数增强的超额回撤 在《基于深度学习的指数增强策略》报告中,我们探讨了在基本面指标大面积失效的环境下,如何利用神经网络从股票量价数据中挖掘有效选股信息;在《提升AI模型边际效能:图注意力网络与特征集成》报告中,我们探讨了如何构建AI选股信号的多维度集成以增强选股能力。至此,AI选股策略中的alpha信号构建工作已基本完成,我们转而将目光聚焦在组合风险部分。 2024年以来,指数增强基金在获取超额收益方面已经面临着严峻挑战,许多基金出现阶段性的大幅超额回撤,组合风控重要性愈加凸显。2024年春节假期前后,由于市场大小盘风格切换,跟踪中证500、中证1000等指数的量化私募产品出现大幅超额回撤;9月末到10月初的市场单边上涨行情中,许多公募指数增强基金跑输基准;10月下旬后市场板块轮动加快、风格切换频繁,也增大了指数增强基金获取超额收益的难度。 图表1:指数增强组合绩效(2024.1.1~2024.10.31) 以我们跟踪的中证500和中证1000指数增强组合为例,2024年出现了两次较大幅度的超额收益回撤。其中,春节前后指数增强超额收益回撤主要来自于SIZE风格,而9月下旬以后,BETA风格暴露则是组合主要的负向超额收益来源。 图表2:指增业绩归因(20240115~20240207,%) 图表3:指增业绩归因(20240918~20241031,%) 从风格因子净值走势来看,部分风格因子在2024年的波动显著放大,SIZE、BETA等指标在2024年2月和10月份分别出现两次剧烈的因子收益跳动。因此,风格因子收益的剧烈波动是2024年以来指增超额回撤的一个重要原因,通常风格因子波动率放大时,控制组合风格暴露往往能有效改善组合的风险表现。 图表4:风格因子净值走势 图表5:风格因子区间收益(%) 然而,2024年以来,组合端约束传统风格因子暴露却难以有效改善组合的风险表现。以2024年9月末以来指增的超额收益回撤为例,事后绩效归因看,低BETA暴露贡献了组合大部分负向超额收益。但是,我们在组合维度约束BETA风格因子的相对偏离,随着风险约束收紧,2024年以来组合超额收益明显降低,但是组合超额收益的回撤幅度却不出现下降。 图表6:不同风险约束下指增组合表现(2024.1.1~2024.10.31) 为此,我们寻求更有效的风险优化特征。相比于barra风格因子侧重于长窗口收益的解释,2024年明显的变化是风格切换速度加快,同时AI选股模型偏向于交易型的信号更容易让组合在短期量价风险维度有更高暴露,因而我们希望基于量价数据提取变化更为迅速的风险特征。 对于风险特征而言,我们认为有两种方式可以改善组合的风险绩效。 1.利用风险调整alpha信号:面对组合回撤,我们归因于alpha信号失效,通过风险特征调整alpha,进而改善组合绩效; 2.利用风险调整组合暴露:面对组合回撤,我们归因于选股体系遭遇短期风险事件,通过在组合优化端调整组合风险暴露,进而改善组合风险绩效。 alpha架构体系依靠着长年的研究积累,轻易改变并非易事。因此,我们倾向于在组合优化端,通过风控体系调整组合面临的风险暴露。本文将尝试基于神经网络,从量价数据中训练、提取有效的短周期量价风险特征。 二、基于深度学习的量价风险因子 以往我们可能会构建短窗口波动、反转等特征控制组合短期量价风险,相较于手工构建风险特征,利用神经网络模型挖掘短期量价风险指标是更为高效的方式。本章节中,我们将尝试利用神经网络模型从各类量价数据中提取短期风险特征。 2.1数据输入 我们依据不同数据源构建特征集合独立训练神经网络模型。数据集1到6为本文基础数据集合,相比之前的报告,我们以日内量价统计量更新了数据集6的特征构成。此外,对于数据集1)和2),除短窗口特征外,我们增加了150日长窗口的训练。 1)数据集:日K线 数据特征:开盘价、最高价、最低价、收盘价、均价、成交量、成交额。 数据预处理: 1.数据滚动30日窗口取日K线数据构建数据集,数据序列长度为30; 2.价格数据先除以最新收盘价进行标准化,成交量/额数据除以序列均值进行标准化。 2)数据集:分钟K线 数据特征:开盘价、最高价、最低价、收盘价、均价、成交量、成交额。 数据预处理: 1.数据滚动20日窗口取2小时分钟线数据构建数据集,数据序列长度为40; 2.价格数据先除以最新收盘价标准化,成交量/额数据除以序列均值标准化。 3)数据集:日内收益分布 数据特征:开盘收益率、早盘/尾盘收益率、日内最高/最低收益率、日内平均收益率。 数据预处理: 1.以30分钟K线将每日行情拆成8个窗口,并计算窗口内股票收益率; 2.基于8个收益率特征计算股票在日内的收益分布特征,序列长度为30。 4)数据集:资金流 数据特征:大小单(特大单、大单、中单、小单)买入/卖出金额。 数据预处理 1.将各类型资金流金额除以当日成交总额得到比例值; 2.数据滚动30日窗口取数据构建数据集,数据序列长度为30。 5)数据集:日间技术特征 数据特征:日收益率、换手率、非流动冲击、振幅等基础量价特征信息。 数据预处理 1.基于原始行情数据预处理后得到常用技术指标; 2.数据滚动30日窗口取数据构建数据集,数据序列长度为30。 6)数据集:日内技术指标 数据特征:日收益率、波动率等基础量价特征信息。 数据预处理 1.基于5分钟行情数据预处理后得到常用技术指标; 2.数据滚动30日窗口取数据构建数据集,数据序列长度为30。 2.2网络结构 对于提取风险特征的网络结构,我们延续之前提取alpha信息的神经网络架构,采用时序网络以及截面网络的组合。 首先,我们采用了LSTM结合自注意力机制的结构,从股票的量价数据中有效提取了时序特征。LSTM(长短期忆网网络)作为(RNN(环环神经网络)的一种,在在处理股票时( 间序列信息方面表现出色,能够捕捉到关键的时序动态。 其次,在实际的投资决策中,除了单只股票的时间序列信息外,股票之间的截面关联同样蕴含着至关重要的信息。为了捕捉这种股票间的相互关系,我们引入了图注意力网络GAT((Graph Attention Network)。GAT是一种图神经网络,在通过注意力机制来编码股票之间的复杂截面关系,从而为我们提供了一个全面的视角来分析和预测市场动态。 最终,通过结合LSTM的时序分析能力和GAT的截面关联捕捉能力,我们的模型能够更全面地理解股票市场的行为,为投资决策提供更为深入和精确的洞察。 因此,在本文中我们结合时序分析和图结构分析构建复合模型,以全面捕捉股票市场的特征。LSTM模型处理每个样本在时间维度上的迭代,其能够忆住长期依赖关系,但并不涉及样本数据间的交互。将LSTM的输出接入自注意力机制捕捉序列内部的依赖关系,再接入图注意力网络GAT以捕捉不同股票之间的相互关联。 我们具体的网络结构如下: 𝐿𝑆𝑇𝑀−>𝑠𝑒𝑙𝑓𝑎𝑡𝑡𝑒𝑛𝑡𝑖𝑜𝑛−>𝐺𝐴𝑇−>𝑀𝐿𝑃 1)𝐿𝑆𝑇𝑀 ℎ𝑖𝑑𝑑𝑒𝑛=𝐿𝑆𝑇𝑀(𝑖𝑛𝑝𝑢𝑡) 2)𝑠𝑒𝑙𝑓𝑎𝑡𝑡𝑒𝑛𝑡𝑖𝑜𝑛 𝑎𝑡𝑡=𝑠𝑒𝑙𝑓𝑎𝑡𝑡𝑒𝑛𝑡𝑖𝑜𝑛(ℎ𝑖𝑑𝑑𝑒𝑛) 3)𝐺𝐴𝑇 𝑔𝑎𝑡_𝑜𝑢𝑡𝑝𝑢𝑡=𝐺𝐴𝑇([𝑎𝑡𝑡,ℎ𝑖𝑑𝑑𝑒𝑛],𝑎𝑑𝑗) −1 4)𝑀𝐿𝑃 𝑜𝑢𝑡𝑝𝑢𝑡=𝑀𝐿𝑃(𝑔𝑎𝑡_𝑜𝑢𝑡𝑝𝑢𝑡) 其中input为模型输入,MLP之后得到output为网络模型输出,其为长度N的向量,对于任意时间点的N只股票,我们得到1个风险因子;[]符号表示矩阵concat操作,下标表示在时间维度取索引,adj为图网络中的股票邻接矩阵。 对比以往报告中我们对于alpha特征的提取,考虑到风险因子的不可加性,我们并未在一个特征集合提取多个风险特征,这将导致风险特征的维度爆炸。因此,我们选择在一个数据特征集合中只提取一个风险表示。 神经网络的训练过程中,我们遵环以下步骤提取风险信息: 1.滚动训练策略:我们采用滚动训练方法,每年更新模型,使用过去8年的历史数据作为训练基础,确保模型能够适应时间序列的变化; 2.数据时间序列拆分:我们将数据集按照时间顺序进行划分,将最后10%的数据保留作为验证集,用于评估模型的泛化能力,而其余数据则用于训练模型; 3.按日拆分训练批次:在训练过程中,我们按照日为单位将数据拆分为不同的批次,确保每批次输入网络的样本来自同一时间点; 4.早停机制:为了预防模型训练过程中的过拟合现象,我们引入了早停机制。该机制会在验证集上的性能不再提升时停止训练,从而保证模型的泛化性能。 对于图注意力网络GAT,我们将股票视为图的节点,N个节点的F维特征表示为:ℎ=⃗⃗⃗⃗⃗ ′ 𝐹×𝐹 𝐹 ′ ′ {ℎ,ℎ,ℎ,…,ℎ},ℎ∈𝑅,通过线性变化𝑊∈𝑅 得到N个节点的𝐹维特征表示ℎ。 𝑁 𝑖 ′𝐹 ′𝐹 ′𝑖 ′𝑗 ⃗ ⃗ 对于ℎ,ℎ而言,通过共享注意力机制𝛼:𝑅×𝑅−>𝑅,我们得到节点i对于节点j ⃗ ⃗ 的影响:𝑒=𝛼(𝑊ℎ,𝑊ℎ)。 𝑖𝑗 𝑖 𝑗 将目标节点与所有邻居节点算出权值之后做𝑠𝑜𝑓𝑡𝑚𝑎𝑥归一化:𝑎=𝑠𝑜𝑓𝑡𝑚𝑎𝑥(𝑒),最终 𝑖𝑗 𝑗 𝑖𝑗 ′𝑖 ⃗ ⃗ 每个节点的输出ℎ=𝜎(∑ 𝑎𝑊ℎ),其中𝑁是与节点i连通的节点集合。 𝑗∈𝑁 𝑖𝑗 𝑗 𝑖 𝑖 图表7:图注意力机制 因此,对于图网络模型而言,邻接矩阵的定义至为重要。在以往报告中,挖掘量价数据中的alpha信息时,我们认为股票节点之间的连通性与在们的风险暴露紧密相关,而行业和风格正是风险最自然的刻画,因此我们据此构建图结构。 行业以及风格的图结构关系长期稳健,而我们挖掘风险信息时希望更快速捕捉股票市场的风险变化,因此我们借助于股票走势趋同性获取更快速变化的图结构: 1.任意截面,初始化股票间原始邻接矩阵𝐴 =𝑜𝑛𝑒𝑠(𝑁,𝑁),N为股票数; 𝑠𝑡𝑦𝑙𝑒 2.根据股票历史收益序列,计算股票直接的协方差矩阵𝑐𝑜𝑟𝑟=𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑡𝑖𝑜𝑛(𝑟𝑒𝑡); 3.对于任意股票i,𝑓𝑜𝑟𝑖=1,…,𝑁; 4.选取日收益率相关性最高的k只股票,作为邻接节点𝑖𝑑