前言 深度学习在量化应用长期以来是投资者关注的重点。然而在2024年年初的A股市场中相关因子出现较大回撤,引发了我们对模型的重新思考。在我们先前的报告中将GRU模型运用在风格平衡的股票池,回测表现相对较好,分析其超额的来源主要我们在前端做了严格的基本面的筛选。在本篇报告,我们尝试将GRU、PatchTST、Transformer、TSMixer、ModernTCN进行多模型集成构建量价因子,并探讨集成因子在选股及ETF轮动上的应用。 集成因子测试结果对比 集成的量价因子在全A股票池、各大宽基指数(中证1000、中证500和沪深300)、风格池和基金重仓股等不同测试场景中,其单因子的区分度都非常高,IC的均值和中位数均在0.07以上,IC大于0占比均大于70%,同时不论是10分组还是20分组的线性区分度均非常显著。 我们发现在基金重仓股上的测试结果略优于在风格基准池中的测试结果。IC均值和中位数由0.08和0.084提高到0.081和0.088,IC大于0占比由70.3%提升到75.2%,年化IC_IR由4提升到4.7。两个池子的选股策略2018年来均能稳定跑赢对比的基准,风格池选股策略2018年来年化收益12.1%,最大回撤23.4%,相对收益8.9%。基金重仓股策略2018年来年化收益13.5%,最大回撤27.8%,相对收益12.1%。 ETF基准池中测试 在ETF轮动策略中,将ETF分为宽基风格与行业主题两大类,使用个股的集成因子对每只ETF进行评分,筛选得分最高的10只ETF构建轮动策略。宽基、风格ETF轮动策略在2019年01月01日至2024年2月29日期间年化收益率达到11.7%,大幅超过基准(沪深300)的3.1%,阿尔法达到8.5%。而行业、主题ETF轮动策略年化收益率为16%,阿尔法达到12.8%,但在大部分年份中,都实现了对基准的超额收益。 风险提示: 策略基于历史数据回测,不保证未来数据的有效性。 投资主题 报告亮点 近年深度学习强大表征能力使其在多个领域取得了显著的应用成果,如何将其运用在量化投资领域仍面临诸多挑战性问题。本文旨在探索不同深度学习模型的多模型集成应用。通过不同的深度学习模型设计,可能对数据产生不同的敏感度和处理能力。我们通过多模型集成提高模型的多样性和鲁棒性,使其在面对不确定性和噪声等复杂的市场环境时,表现出更强的稳定性和准确性。 我们在传统选股池的基础上进一步测试了ETF池上深度学习因子的效果,探索ETF作为深度因子的落地工具的可行性,为广大投资者提供新的研究思路,助力量化投资发展。 投资逻辑 集成模型的概念在机器学习、深度学习领域被广泛应用。通过集成多个深度学习模型利用每个模型的优点,弥补其他模型的不足。本文对不同架构的深度学习进行集成,并探索深度学习在ETF上的应用,对于推动量化投资领域的技术革新和发展具有参考价值。 一、策略回顾及时序网络概述 (一)选股策略表现回顾 在先前的研究报告《AI+HI系列:GRU网络在风格自适应中的创新与应用》中,我们对A股市场过去六年的风格变化进行了细致的分析。在该报告中,我们提出了一项创新性的方法,即采用GRU网络构建选股组合,以适应市场风格的快速转变。 1、GRU选股策略历史回顾 我们对该策略最近的表现进行简单的回顾: 图表1 GRU策略净值 策略自2023年12月1日开始样本外跟踪,截至2024年2月29日,市场经历了大幅震荡,特别是中小盘指数和微盘股指数的大幅回撤,相比之下,大盘股指数表现相对稳定。 具体而言,中证500指数下跌了3.58%,中证1000指数下跌了12.1%,而上证50指数上涨了1.99%,沪深300指数上涨了0.57%。 针对GUR策略,在样本外的表现显示,自2023年12月份以来,策略实现了2.33%的绝对收益,而基准中证1000指数下跌了12.1%。因此,策略在这一时期的超额收益达到了14.43%。此外,2024年至今(2024.2.29),策略实现了3.48%的绝对收益,超额收益为12.18%。市场上共有2945只股票型和偏股混合型基金,该策略排名第249位,即处于91.5%的分位数,显示了其相对较好的绩效表现。 图表2不同风格持仓占比 上图表示自23年12月以来组合每期持有的不同风格的个股总仓位,可以发现12月8日至2月29日大盘价值风格的平均仓位在六种风格中占比最高,其中2月23日的占比高达55%。 图表3不同风格占比 图表4大小盘总占比 上两图表示样本外跟踪的风格持仓占比,23年12月以来大盘的平均仓位为72%,小盘的平均仓位为29%。其中,大盘价值的平均仓位最高(36%),大盘成长平均仓位次高(19%)。 而这段时间主流宽基指数中的上涨50和沪深300的表现相对较好,市场的风格也由去年的小微盘股风格切换到大盘股风格。 2、canslim策略历史回顾 图表5 canslim策略2023年12月以来走势 上图表呈现了Canslim2.0策略自2023年12月以来的绩效数据。截至目前(2024.2.29),该策略的绝对收益率为8.66%,相对偏股混合基金指数超额收益为15.62%。主要归因于2024年2月份以来成长因子大幅反弹,canslim策略在2月份上涨19.71%,相对基准超额8.97%。 3、人气策略历史回顾 图表6人气策略2023年12月以来走势 上图表呈现了人气策略自2023年12月以来的绩效数据。截至目前(2024.2.29),该策略的绝对收益率为-5.81%,相对中证1000指数超额收益为6.29%。人气组合采用同花顺的人气指标以及基于朝阳永续的分析师研报文本数据构建的情感因子作为基础构建的选股组合,组合持仓风格偏小盘股因此对比基准选择中证1000指数,自23年12月以来组合相对基准有稳定的超额收益。 (二)行业轮动现象 图表7中信一级行业2018年以来每半年涨幅排名 近年来的市场风格的切换也影响着每个行业的走势变化,上图表示2018年以来各中信一级行业的半年度涨幅排名图,过去半年涨幅越大行业排名越高。可以看出行业轮动的现象非常明显。 可以看出,煤炭、银行、石油石化及非银金融四个行业是去年下半年至今连续表现较好的行业,其中煤炭行业是去年下半年和24年至今表现最好的行业,但在22年下半年和23年上半年煤炭的表现非常一般。 1、FESC行业轮动策略历史回顾 图表8 FESC行业轮动策略2023年12月以来走势 上图展示了FESC行业轮动策略2023年12月以来的绩效走势,23年12月至今(2024.2.29)FESC行业轮动策略绝对收益-1.11%,相对偏股混合基金指数超额收益5.85%。24年至今(2024.2.29),行业轮动策略绝对收益0.18%,相对收益5.01%。 二、深度时序因子集成 (一)模型概述 在之前的报告《AI+HI系列:PatchTST、TSMixer、ModernTCN时序深度网络构建量价因子》中我们介绍了三个Patch +通道独立的设计时序深度学习模型,它们分别基于自注意力、MLP、CNN实现时序信息挖掘。 我们在先前报告的测试发现,不同架构深度学习模型均能挖掘出IC较高的量价因子,但TOP组的多头收益、回撤表现差异较大,合理的骨干网络设计可能有助于提高多头组性能;架构差异更大的模型相关性低。 图表9模型流程 上图展示了PatchTST、TSMixer、ModernTCN模型的大致流程,考虑一个多变量时序类数据输入𝑋∈ ℝ: 𝑀×𝐿 in 在嵌入步骤首先将多变量序列分为多个单变量序列,对单变量序列进行Patch操作,用一个长度为P的窗口在时序上进行滑动截取,滑动步长为S,Patch处理后原始序列长度从L变为N,最后将每个长度为P的子序列映射至目标嵌入维度D,数据形状从初始的(M,L)变为(M,D,N); 将嵌入处理后的数据输入骨干网络中,基于自注意力/ MLP / CNN架构的骨干网络学习时序维度、变量维度(通道维度)、特征维度的信息交互,骨干网络输出数据形状为(M,D,N),对骨干网络的输出进行展平等处理后接入对应任务的线性层。 图表10 GRU模型 因在本篇报告中我们进一步加入GRU模型,考虑多模型集成的应用。GRU模型属于通道混合模型,通过门控循环机制学习输入的时序交互,对一个形状为(M,L)的输入样本,通常取最后一个时间步的GRU输出作为样本的表征,输出形状为(M,D),其中D为时点token的嵌入维度。 (二)时序因子相关性分析 本部分我们尝试构建集成因子。在对因子进行集成之前我们先对因子的相关性进行分析: 我们首先对因子之间的相关性进行分析,结果如下: 图表11时序因子相关性 上图表示5个时序模型单因子及其组合之后生成的集成因子之间的相关性,首先5个单因子间GRU因子与其他四个因子的相关性略低,GRU与PatchTST、TSMixer、ModernTCN、Transformer的相关性分别为:0.65、0.59、0.55、0.64。而其他四个单因子间的相关性均较高(均大于0.8)。归因于我们在构建GRU因子过程中采用的双任务的方式,首先以收益率作为目标进行学习,再使用分类任务作为目标继续训练模型。 (三)时序因子测试 再进行因子集成前我们先对每个因子进行测试,对比其中的测试结果; 图表12时序因子IC测试结果 上图表示5个时序因子的IC测试结果,对比各因子的IC统计结果相差不大,从数据上来看TSMixer的测试结果在几个时序因子中效果最佳。IC的均值和中位数分别为0.099和0.104,年化IC_IR为5.976,三个维度均为几个时序因子中最大值。GRU因子的IC大于0占比为81.3%,在几个因子中值最大。 图表13时序因子多头组测试结果 上图表示时序因子在全A上分20组测试时的多头结果,GRU因子的年化收益最大,夏普比率1.27也是几个因子中的最大值。其次为TSMixer因子,该因子年化收益率为26.2%,夏普比率为1.24。 (四)时序因子集成及测试 根据上文的介绍我们发现单纯以目前的输入特征来看(高、开、低、收、成交量、均价),不同的时序模型虽然架构会有差异,从最终的合成因子的测试结果来看,各时序因子的相关性非常高,同时IC的测试结果也比较相近。因此我们采用中性化的方式进行两阶段合成,首先将ModernTCN、PatchTST、Transformer、TSMixer四个相关性很高的因子进行合成,然后再将GRU与合成因子进行集成生成Ensemble_factor。 1、全A测试结果 本部分开始我们对集成因子在不同的股票池上进行测试来探讨其适用域,我们选择的股票池也都是市场近年来关注度最热的股票池。 首先我们在全A上对集成因子进行测试,测试结果如下: 因子IC测试结果 图表14全A因子IC统计结果 图表15全A因子IC历史表现 图表16全A因子衰减 上述图表均是Ensemble_factor在全A上的IC测试结果,对比图表12中各时序因子的IC测试结果,集成因子的IC均值和中位数均有提升,另外其年化IC_IR提升到6.37。 分组测试结果 图表17全A因子分组超额收益曲线 图表18全A因子分组绩效对比 图表19全A因子group_20收益统计 上述图表代表集成因子的分组测试结果,可以看出在分20组的情况下因子的区分度依然非常显著,多头分组的年化收益为27.52%,最大回撤20.84%,相比GRU因子有了明显提升,换手率66.45相比GRU因子也有一定的提升。 2、宽基成分股测试结果 在本部分我们对比因子在三个宽基指数上的测试结果,同样从IC和分组的结果来分析,另外鉴于沪深300与中证500的成分股数量较少我们考虑分10组来对比,而对于中证1000我们依然采用分20组。测试结果如下: 因子IC测试结果 图表20宽基因子IC统计结果 图表21沪深300因子IC历史表现 图表22