前言 A股市场的风格轮动长期以来是投资者关注的重点。我们将A股市场的风格细分为:大盘成长、大盘质量、大盘价值、小盘成长、小盘质量、小盘价值。 近年来A股市场走势分为两个阶段:2018年底至2021年初,市场主导风格为大盘质量和大盘成长;21年之后,小盘成长和小盘价值成为主流,特别是小盘价值表现尤为突出。本文旨在探讨如何运用GRU网络对这六大风格进行有效整合,实现风格自适应的研究目标。 GRU三因子测试对比 对GRU网络不同训练方式生成因子的测试对比发现,无论是原始因子还是中性化后的因子,GRU_50等权因子在全A范围内的测试效果更为显著。原始GRU_50等权因子在单因子IC均值达到9.9%,中位数为9.5%,年化IC_IR为7.13。此外,其多头组的年化收益率为32.93%,最大回撤为21.78%。 对比不同宽基指数上的测试结果,GRU_50等权因子和GRU_集成因子在沪深300指数上均表现出色;GRU_集成因子在中证500上测试效果更佳,而GRU_50等权因子在中证1000上表现最佳。对比这三个因子在宽基指数上多头组的年度收益,GRU_50等权因子在2021年前整体表现更佳,而21年后GRU_集成因子的效果最为显著。 风格基准池中测试 在风格基准池中对比三个因子的测试结果,GRU_集成因子的表现最为优越。 其单因子IC均值为8%,中位数为7.4%,多头分组的夏普比率也在三者中最为突出。因此,我们采用GRU_集成因子在基准池中进行每期选股,策略自2018年以来的年化收益率为15.2%,最大回撤为23.4%,换手率达42倍。历史数据显示,该策略稳定地超越基准及沪深300、中证1000、中证500指数。 风险提示: 策略基于历史数据回测,不保证未来数据的有效性。 投资主题 报告亮点 A股市场的风格轮动长期以来一直是投资者研究的焦点,本文旨在研究如何通过GRU网络来有效将六大风格组合进行有效的整合,以达到风格自适应的研究目标。 自ChatGPT在A股市场被广泛关注之后,如何将AI应用到量化投资领域越来越受到广大机构投资者的关注,本文选用当前热门的研究领域,巧妙的利用GRU网络将AI与传统基本面量化研究相结合,为广大投资者提供新的研究思路,助力量化投资的发展。 投资逻辑 市场风格的变化对各行业、投资经理以及基本面量化选股策略的影响显著。 因此,本文旨在通过量化方法整合不同风格的组合,以更有效地指导投资决策。 一、基本面量化策略回顾 A股市场的风格轮动长期以来一直是投资者研究的焦点。虽然对市场风格的分类有所不同,但通常可将其归纳为大盘、小盘、价值和成长等几个主要类别。对近年来A股市场的走势分析显示,市场经历了两个显著的发展阶段。 第一阶段(2018年底至2021年初)以大盘成长型股票的主导为特征。这一时期,多个被视作“核心资产”的股票如贵州茅台(2018年12月至2021年2月涨幅超350%)实现了显著的价值增长。此外,此阶段孕育了多位机构投资经理的崛起,他们管理的基金产品在此期间实现了显著的净值增长。在此期间,以大盘股为代表的上证50指数和沪深300指数分别实现了76.37%和92.89%的涨幅,远超中小盘股指数中证500和中证1000的58.95%和44.75%涨幅。 第二阶段(从2021年2月至今)则见证了市场风格向小盘价值股的转变。在此阶段,先前大幅增长的“核心资产”股票遭遇重大调整,很多股票价格大幅下跌。与此同时,中小盘股票在此阶段表现突出。相较而言,中证500和中证1000在这个阶段的表现超过了大盘指数上证50和沪深300,分别下跌14.69%和3.05%,而上证50和沪深300同期分别下跌41.15%和39.53%。 显然,市场风格的这种变化对各行业、投资经理以及基本面量化选股策略的影响显著。 因此,本文旨在通过量化方法整合不同风格的组合,以更有效地指导投资决策。 (一)近年来风格A股市场的风格轮动现象 图表1 2018年来风格轮动现象 上图表所示为我们选取的巨潮风格指数(涵盖六大市场风格)作为研究样本,对比其在过去数年的市场表现(用相对收益表示)。在2018年底至2021年初,大盘成长股相较于其他宽基市场风格,显示出显著的超额收益,呈现出明显的单边上升趋势。在这一时期内,中盘价值股和小盘价值股的表现相对较弱,其相对收益大多呈现单边下降趋势。然而,自2021年起,大盘成长股经历了显著的价格波动和下跌,与此同时,小盘价值股则展现出震荡上升的走势。 这种市场风格的转变直接影响了不同时期基于基本面分析的量化选股策略的选择与应用。 以下部分将回顾过去几年内一些代表性选股策略的绩效表现。 1、canslim策略历史回顾 图表2 canslim策略2018年来走势 上图表呈现了Canslim 1.0策略自2018年开始追踪以来的绩效数据。截至目前,该策略的累计收益率为69.4%。在各个年度的表现中,2019年取得了最高的年度收益率,为65%,其次是2020年,收益率达到50%,而2021年的收益率为15%。然而,在最近两年,策略表现出下滑趋势,2022年下跌9%、2023年下跌8%。 2、红利策略历史回顾 下图表3详细展示了自2018年起的红利策略净值变化情况。在此期间,该策略取得了显著的绝对收益,累计高达90.25%。对比而言,同期红利指数的涨幅仅为-5.71%,从而使得该策略的超额收益达到了95.96%。 在年度层面上,2019年、2020年和2021年,红利策略的涨幅分别为39%、21%和33%,而其相对红利指数的超额收益则分别为3%、-3%和35%。在最近两年(2022年和2023年),策略的收益率分别为-3%和0%,相应的超额收益则为18%和8%。 红利策略在2019年和2020年的牛市期间与Canslim策略相比略显逊色。然而,在过去三年中,红利策略不仅显著跑赢了红利指数,而且相对于Canslim策略也取得了可观的超额收益。 图表3红利策略2018年来走势 3、惠特尼·乔治小型价值股策略回顾 图表4惠特尼·乔治小型价值股策略2018年来走势 如所示图表中反映,惠特尼·乔治的小型价值股策略自2018年以来展现了显著的收益表现。在过去三年中,该策略的成果尤为突出。2021年,该策略实现了39%的绝对收益,相较于中证1000基准指数,其超额收益达到了35%。2022年,尽管绝对收益为负(-3%),但相对于基准指数仍实现了12%的超额收益。而在2023年至今,该策略实现了20%的绝对收益和相对基准的23%超额收益。然而,需要指出的是,在2019年和2020年,该策略的表现相对平平,未能超越canslim策略。2019年和2020年的绝对收益分别为24%和19%。 (二)行业轮动现象 图表5中信一级行业2018年以来每半年涨幅排名 近年来的市场风格的切换也影响着每个行业的走势变化,图表5表示2018年以来各中信一级行业的半年度涨幅排名图,过去半年涨幅越大行业排名越高。可以看出行业轮动的现象非常明显。 以汽车行业为例,汽车行业在2018年到2019年6月底期间表现平平。然而,自2019年下半年开始,该行业的排名基本上能够稳定在排名较高的行业中,仅在2020年上半年出现了排名第15的情况。随后,到了2022年下半年,汽车行业经历了大幅回撤,排名下降至第4位。然而,进入2023年后,汽车行业的排名再次回到排名较高的行业之一,保持在后三分之一的位置。 1、FESC行业轮动策略历史回顾 图表6 FESC行业轮动策略2018年来走势 图表6展示了FESC行业轮动策略在最近几年的绩效数据。具体而言,FESC策略在2019年、2020年和2021年分别实现了31.41%、75.1%和26.76%的绝对收益,表现出色。然而,在2022年,该策略经历了小幅回撤,收益率为-3.96%。截至目前,FESC策略的收益率为5.85%。与偏股混合基金指数相比,FESC策略在多数年份都实现了显著的超额收益。具体而言,FESC策略在2020年实现了高达19.19%的超额收益,2021年的超额收益为19.08%,2022年为17.07%,2023年为16.84%。 为更好地应对前文提到的风格轮动现象,我们考虑结合神经网络来实现多风格组合的结合,首先我们对所使用的方法和理论进行介绍。 二、GRU网络介绍 门控循环单元(Gated Recurrent Unit,简称GRU)由Cho等人在2014年提出,是循环神经网络(RNN)的一种变体。RNN网络是为处理序列类数据而特别设计的模型,其特点在于能够捕获并保留序列当前时间步之前的历史信息。 图表7经典RNN网络 如上图所示,在经典RNN网络中,每个时间步𝑡模型的输入为当前时间步的𝑋和前一时间步的隐状态(hidden state)𝐻,将二者拼接后再送入全连接层,最后得到当前时间步的隐状态𝐻,以此循环。通常最后一个时间步的隐状态可以用来作为整个序列的表征。 𝑡 𝑡−1 𝑡 图表8 GRU网络 GRU模型在传统RNN模型的基础上引入门控机制,减少了RNN网络的梯度消失问题,在处理长距离依赖问题时表现更好;相比LSTM(另一种常见的RNN变体模型),GRU在结构更为简单的同时能够实现相近的效果。 GRU的关键在于它的门控机制,这种机制可以决定哪些信息可以通过时间传递,哪些信息应该被丢弃,数学表达如下: 𝑧= σ(𝑊𝑥+ 𝑈ℎ + 𝑏) 𝑡 𝑧𝑡 𝑧𝑡−1 𝑧 𝑟= σ(𝑊𝑥+ 𝑈ℎ + 𝑏) 𝑡 𝑟𝑡 𝑟𝑡−1 𝑟 ̂ ℎ= ϕ(𝑊𝑥+ 𝑈(𝑟⊙ ℎ ) + 𝑏) 𝑡 ℎ𝑡 ℎ 𝑡 𝑡−1 ℎ ̂ ℎ= (1 − 𝑧) ⊙ ℎ + 𝑧⊙ ℎ 𝑡 𝑡 𝑡−1 𝑡 𝑡 ̂ 其中,𝑥表示当前时间步的输入,ℎ为输出的隐状态,ℎ为候选隐状态,𝑧_𝑡为更新门,𝑟_𝑡为重置门,σ表示sigmoid激活函数,ϕ表示tanh激活函数,𝑊,𝑈,𝑏表示全连接参数矩阵/向量。 𝑡 𝑡 𝑡 GRU单元的两个门——重置门和更新门,控制了隐状态的更新过程。更新门负责决定保留多少之前的记忆,当更新门趋近于1时,之前的记忆将被保留并传递给当前状态,反之新的记忆将替代旧的记忆;重置门它决定了是否应该忽略之前的记忆,如果重置门接近0,模型忘记过去的不重要的信息。 三、GRU网络在量化中的应用 (一)模型与特征构建介绍 根据上文对GRU模型的介绍,GRU网络的设计思路使其在处理自然语言等序列数据的任务中具有一定优势,股票的量价时序数据同样属于序列信息,我们希望GRU网络能不遗忘时序早期的重要信息,另一方面,量价序列中的各个时点间的信息含量不一,我们希望模型重置内部的隐状态表示,实现端到端的量价时序数据因子生成。以一只股票为例,我们可以将其过去30日的量价时序作为模型输入,搭建如下的GRU网络: 图表9 GRU模型输入示例 数据集说明: 2007-2023年A股日频量价数据,包括高、开、低、收、均价、成交量六个序列,我们进行如下筛选: 1、剔除上市不满120天的股票 2、剔除流通市值最小的10%的股票; 模型训练参数说明: 训练集划分:为了可能捕捉近期的市场风格变化,模型采用滚动训练的方式,即每年年底重新进行模型训练,在每年年底回溯过去10年作为训练集+验证集(其中最近的一年为验证集),次年为测试集;第一期模型的训练集为2007年1月-2016年12月,验证集为2017年1月-2017年12月,测试集为2018年,以此类推。 考虑到深度学习模型训练存在一定随机性的问题,在每年年末进行模型重训练时,设置5个固定的随机种子运行5次模型训练脚本,等权5个模型的输出作为最终结果。 图表10训练验证集划分 模型输入数据: 在每周的最后一个交易日𝑡