金融工程专题 2022年12月18日 大小单资金流alpha探究2.0:变量精筛与高频测算 金融工程研究团队 ——市场微观结构研究系列(18) 魏建榕(首席分析师) 魏建榕(分析师)盛少成(联系人) 证书编号:S0790519120001 张翔(分析师) weijianrong@kysec.cn 证书编号:S0790519120001 大小单资金流研究回顾 shengshaocheng@kysec.cn 证书编号:S0790121070009 证书编号:S0790520110001 傅开波(分析师) 证书编号:S0790520090003 高鹏(分析师) 证书编号:S0790520090002 苏俊豪(分析师) 证书编号:S0790522020001 胡亮勇(分析师) 证书编号:S0790522030001 王志豪(分析师) 证书编号:S0790522070003 盛少成(研究员) 证书编号:S0790121070009 苏良(研究员) 证书编号:S0790121070008 何申昊(研究员) 证书编号:S0790122080094 相关研究报告 《主动买卖因子的正确用法—市场微观结构研究系列(9)》-2020.09.05 《大单与小单资金流的alpha能力—市场微观结构研究系列(12)》 -2021.06.02 《新型因子:资金流动力学与散户羊群效应—市场微观结构研究系列 (14)》-2022.06.02 对于大小单资金流的研究,在之前系列报告中,我们分别从资金流强度以及相关 性结构两个角度出发,挖掘出了大小单残差以及散户羊群效应因子。其中在大小单残差因子的挖掘中,我们发现剥离收益率缠绕的资金流强度选股效果显著增强。而对于散户羊群效应因子,我们首次从小单资金流的角度进行了定义,选股效果较好且有独立信息增量。通过对两大因子的绩效跟踪,我们发现样本内外皆较为优异,但是其还有进一步改进的空间:1、变量的精筛;2、数据的高频化。 大小单残差因子的改进 对于原始大单残差,其使用的方式为大单资金流回归收益率,但是其中的非主动大单强度与收益率明显不相关,除此之外主动中单残差也具备一定正向选股能力,因此在变量精筛部分我们做的改进为:将主动大单净流入和主动中单净流入相加,计算主动大中单残差,再和非主动大单强度排序相加。相比于原始大单残 差,改进大单残差10分组多空信息比率从3.48提升至4.81。 对于原始小单残差,其使用的方式为小单资金流回归收益率,但是其中主动小单性质在2017年后发生变化,其或和市场成熟度提高,机构的拆单行为有关,所以我们在计算小单残差时不再考虑主动小单,只使用非主动小单残差。相比于原 始小单残差,改进小单残差10分组多空信息比率从3.02提升至3.56。 进一步地,我们对于改进大/小单残差进行高频化测算,最终发现维持日频的做法,即对于资金流强度以及月度收益率的计算,使用每月底回看过去20天的日度资金净流入和日度收益率是较优的做法。 散户羊群效应的改进 对于原始散户羊群效应而言,其计算方式为:当前交易日收益率𝑅�与下个交易日小单净流入𝑆𝑡+1之间的秩相关系数。对于其的改进,我们可以归纳为以下3点: (1)对于𝑅�的计算,使用日内收益率𝑐𝑙𝑜𝑠𝑒𝑡/𝑜𝑝𝑒𝑛�−1代替𝑐𝑙𝑜𝑠𝑒𝑡/𝑐𝑙𝑜𝑠𝑒𝑡−1−1; (2)由于主动小单2017年后性质的变化,我们使用小单非主动净流入代替小单 全部净流入;(3)对于小单非主动而言,使用开盘至10点之间的净流入代表𝑆𝑡+1。 相比于原始散户羊群效应因子,改进散户羊群效应因子10分组多空信息比率从 2.51提升至3.01,最大回撤从8.85%降至3.15%,为较为有效的改进方案。 大小单资金流综合应用方案 我们将改进大单残差、改进小单残差、改进散户羊群效应排序等权合成,将其命名为大小单综合资金流因子,该因子RankIC均值7.89%,RankICIR3.99,10分组多空对冲年化收益率35.36%,信息比率4.82,胜率89.19%,最大回撤2.09%,绩效非常优异。除此之外,该因子在沪深300、中证500、中证1000中多空对冲 收益波动比分别为:1.92、2.71、4.26。最后,我们对大小单综合资金流因子进行行业风格中性化,纯净新因子多空对冲信息比率依旧可达3.83。 风险提示:模型测试基于历史数据,市场未来可能发生变化。 金融工程研究 金融工程专题 开源证券 证券研究报 告 目录 1、大小单残差因子的再思考4 1.1、原始大小单残差因子样本内外绩效皆较为优异4 1.2、原始大单残差因子的改进:变量精筛5 1.3、原始小单残差因子的改进:变量精筛7 1.4、改进大小单残差因子的高频化测算9 2、散户羊群效应的再思考10 2.1、原始散户羊群效应的历史绩效较为优异10 2.2、原始散户羊群效应的改进:变量精筛10 2.3、原始散户羊群效应的改进:高频化的新发现11 3、大小单资金流因子综合应用方案13 3.1、大小单综合因子在其他样本空间依旧具备一定选股能力14 3.2、大小单综合因子剔除Barra风格因子后选股效果依旧优秀14 4、其他相关讨论:日内散户羊群效应15 5、风险提示16 图表目录 图1:以大单为例:原始大单残差alpha来源的解释5 图2:原始大小单残差因子选股效果皆较为优异5 图3:除了超大,其他三类资金流主动和非主动净流入强度与收益率相关性差别较大5 图4:大中单残差和非主动大单强度排序相加后,10分组多空信息比率4.816 图5:相比于原始大单残差,改进后的大单残差多空信息比率从3.48提升至4.817 图6:非主动小单残差10分组信息比率3.568 图7:小单主动强度在2017年前和2017年后与收益率相关性差别较大8 图8:相比于原始小单残差,改进后的小单残差多空信息比率从3.02提升至3.569 图9:随着参数N的变化,改进大单残差RankICIR在15:00效果最优9 图10:随着参数N的变化,改进小单残差的RankICIR变化不明显,在15:00时也是相对较优的状态9 图11:小单错位相关性的alpha来源10 图12:原始散户羊群效应的10分组多空对冲表现优异10 图13:主动小单2017年后的羊群效应明显弱于2017年前11 图14:2017年后,主动小单净流入在散户羊群效应中的贡献基本消失11 图15:对于散户羊群效应因子中𝑹�的计算,日内收益率为更优的选择12 图16:对于散户羊群效应因子中𝑺�+�的计算,使用开盘至10:00前的非主动小单净流入为更优的选择12 图17:相比于原始散户羊群效应,改进散户羊群效应10分组多空对冲从2.51提升至3.0113 图18:改进散户羊群效应的10分组分层绩效较为优异13 图19:大小单综合资金流因子的10分组多空对冲信息比率达4.8214 图20:大小单综合因子提纯后的10分组多空信息比率3.8315 图21:日内散户羊群效应全A中位数为负值16 表1:资金流净流入强度因子的标准化方法5 表2:改进散户羊群效应与改进大/小单残差相关性较低13 表3:大小单综合因子在其他样本空间依然具有一定选股能力14 表4:大小单综合因子与传统Barra因子相关性不高14 资金流行为通过逐笔成交数据计算得到,反映了股票的微观供求信息。按照通常习惯,资金流向被依据挂单金额的大小,分为四种类型进行统计:超大单(>100万元)、大单(20-100万元)、中单(4-20万元)和小单(<4万元)。资金净流入意味着该类资金持有的筹码增多,资金净流出则意味着持有的筹码减少。对于大小单资金流的研究而言,在之前系列报告中,我们分别从资金流强度以及相关性结构两个角度出发,挖掘出了大小单残差以及散户羊群效应因子,具体结论陈列如下: (1)在《大单与小单资金流的alpha能力》中,我们发现:大单资金流强度与涨跌幅显著呈同步正相关,且存在正向预测作用;相反,小单资金流强度与涨跌幅显著呈同步负相关,且存在负向预测作用;进一步,我们构造了剥离“反转缠绕效应”的大单和小单资金流强度,选股能力大幅提升。 (2)在《新型因子:资金流动力学与散户羊群效应》中,我们首次从小单资金流的角度来定义散户羊群效应,具体为:针对某只股票而言,计算当前交易日收益 率𝑅�与下个交易日小单净流入𝑆𝑡+1之间的秩相关系数,该因子选股效果较好且有独立信息增量。 对于大小单残差和散户羊群效应而言,样本内外的绩效皆较为优异,但是我们发现其还有进一步改进的空间,主要的改进维度有如下两点:1、变量的精筛;2、数据的高频化。 1、大小单残差因子的再思考 1.1、原始大小单残差因子样本内外绩效皆较为优异 对于原始大小单残差而言,其本质为:剥离收益率缠绕的资金流强度。就alpha的理解,我们以大单为例,给出其切分示意(图1)。大单资金流强度因子具有正向alpha,我们可以将整体alpha切分为正向alpha和负向alpha两部分。我们假设大单资金流强度因子的多头组合对应大单的净流入,而大单净流入往往伴随股价上涨,因此组合会负向暴露反转因子贡献负向alpha;另外,由于大单本身具有正向预见性,这一部分贡献正向alpha,也即剥离涨跌幅影响后的大单残差资金流强度因子。 在2013/01/01-2022/10/31期间,以全体A股为研究样本(剔除ST、停牌以及上市不足60个交易日的次新股),市值行业中性化后进行10分组回测(后续回测若无明确说明,皆为市值行业中性化)。原始大单残差的RankIC均值6.71%,RankICIR3.44,10分组多空对冲年化收益率26.62%,信息比率3.48,胜率79.49%,最大回撤4.21%。原始小单残差的RankIC均值-5.56%,RankICIR-2.90,10分组多空对冲年化收益率23.04%,信息比率3.02,胜率82.91%,最大回撤3.38%。 从回测绩效来看,原始大单残差和原始小单残差的多空信息比率都达到了3以 上,而且从图2可以看出,二者样本外的表现依旧较为稳健,其中原始大单残差的效果会更加优异一些。 图1:以大单为例:原始大单残差alpha来源的解释图2:原始大小单残差因子选股效果皆较为优异 资料来源:开源证券研究所数据来源:Wind、开源证券研究所 1.2、原始大单残差因子的改进:变量精筛 针对4类资金流超大、大、中、小单而言,主动与非主动的区分是否会对资金 流属性:“与收益率相关性”产生影响?为了找到这一答案,每月底回看过去20天, 我们将4类资金流按照主动/非主动拆分开,计算这8类资金流净流入强度。由于考虑到不同股票净流入量级的差别,在计算时需要对其进行标准化,这里沿用之前报告《大单与小单资金流的alpha能力》里的方式,如表1所示。最后,对于每类资金流,我们分别计算与20天累积收益率的相关性,结果如图3所示。 标准化方法标准化方法公式标准化方法含义 表1:资金流净流入强度因子的标准化方法 ∑� 𝑏𝑢𝑦�−𝑆𝑒𝑙𝑙� 分母是过去T个交易日个股的大单净流入金 ∑ 净流入金额绝对值𝑆3=𝑡−� 资料来源:开源证券研究所 � 𝑡−� |𝑏𝑢𝑦�−𝑆𝑒𝑙𝑙𝑡| 额绝对值之和进行标准化 图3:除了超大,其他三类资金流主动和非主动净流入强度与收益率相关性差别较大 数据来源:Wind、开源证券研究所 从图3我们可以发现,除了超大单的主动和非主动净流入强度与收益率的相关 性方向和幅度差不多,其它三类资金流差别皆较大。大单的非主动净流入强度与收益率基本无相关性;中单的主动和非主动净流入强度与收益率的相关性是反向的;小单主动与非主动净流入强度与收益率相关性虽然都是负向的,但主动净流入强度与收益率的相关性较弱。 对于原始大单残差,其使用的方式为大单资金流回归收益率,但是其中的非主动大单强度与收益率明显不相关,我们改进的方式可以为:计算主动大单残差以及非