您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开源证券]:市场微观结构研究系列(26):资金流与交易行为:因子失效的原因与讨论 - 发现报告
当前位置:首页/其他报告/报告详情/

市场微观结构研究系列(26):资金流与交易行为:因子失效的原因与讨论

2024-12-31魏建榕、苏良开源证券D***
市场微观结构研究系列(26):资金流与交易行为:因子失效的原因与讨论

金融工程专题 2024年12月31日 金融工程研究团队 资金流与交易行为:因子失效的原因与讨论 ——市场微观结构研究系列(26) 魏建榕(首席分析师) 魏建榕(分析师)苏良(分析师) 证书编号:S0790519120001 张翔(分析师) weijianrong@kysec.cn 证书编号:S0790519120001 suliang@kysec.cn 证书编号:S0790523060004 证书编号:S0790520110001 傅开波(分析师) 证书编号:S0790520090003 高鹏(分析师) 证书编号:S0790520090002 苏俊豪(分析师) 证书编号:S0790522020001 胡亮勇(分析师) 证书编号:S0790522030001 王志豪(分析师) 证书编号:S0790522070003 盛少成(分析师) 证书编号:S0790523060003 苏良(分析师) 证书编号:S0790523060004 何申昊(分析师) 证书编号:S0790524070009 陈威(研究员) 证书编号:S0790123070027 蒋韬(研究员) 证书编号:S0790123070037 相关研究报告 《大小单重定标与资金流因子改进—市场微观结构研究系列(16)》 -2022.09.04 《订单流系列:关于市场微观结构变迁的故事—市场微观结构研究系列 (21)》-2023.09.19 《订单流系列:撤单行为规律初探—市场微观结构研究系列(22)》 -2024.01.24 我们《大小单重定标与资金流因子改进》的报告中,利用逐笔成交数据重新切分 大小单资金流并构造CNIR因子,但是在实际使用过程中发现效果并不理想。 资金流因子失效不应归结于策略同质化 1、资金流因子失效不应归结于策略同质化 CNIR因子在不同预测周期长度下的IC变化趋势,2016年以前的峰值大约出现 在第15个交易日,2016年以后峰值似乎已经消失并且均值水平出现明显下滑。这说明即便是在若干个组合内共同使用资金流策略,也不至于出现的因子衰减。2、以CNIR因子的构造为例,具体分析: 其一,合并资金流:将超大单、大单和中单合并为广义主力资金; 其二,剥离反转效应:逐日计算资金流指标(IMB)对涨跌幅的截面回归残差值,作为修正后的Alpha因子。 上述两步骤在分组的多空收益、多头超额等均有不错的收益增强,我们着重从这两个方面着手讨论。 关于回归方式的讨论 由于买卖行为促使价格发生变动会导致资金流因子暴露反转特征,我们在原始报告中通过截面回归的方式,剥离反转的负向IC,从而得到正向的资金流Alpha。考虑到改进的可能性,我们使用备用的回归方法构造CNIR因子。 1、此对比时序回归和截面回归而言,极端考虑个股差异同样不是可选项,因为这容易在截面上丧失同一分布假设的显著性,因子IC会降低; 2、资金流因子的核心定价逻辑主要背靠机构的优秀的选股能力。在A股市场,机构交易者往往是以市值由大到小的方向覆盖其选股范围,在大市值股票中的选股效果会更加稳定,在小市值范围的排序能力较弱; 3、资金流Alpha对于非稳定的市场环境的适应性会更弱一些,CNIR因子在沪深 300指数成分股内的分组多空收益出现了较大回撤,小市值影响更甚。 关于大小单识别标准的讨论 行情软件中提供的超大单、大单、中单和小单的四类划分方法并不适合2015年以后的订单分布,我们讨论了如何更好地重新界定大单与小单的边界。 1、绝对阈值:设定某个金额作为统一的划分阈值,将大于该金额的订单识别为大单; 2、相对阈值:逐日统计所有个股的逐笔成交订单的委托金额,设定其由小到大的百分位r对应的金额作为阈值; 3、动态阈值:回溯过去N个交易日,将区间内所有股票的逐笔成交订单视作整体,将其委托金额由小到大的百分位r对应数值作为统一标准。 主力资金识别难的问题并不能通过单纯调节大小单划分阈值来解决。划分标准的普适性减弱,拆单行为是最直接的影响因素,并且这一变化在流动性上分布不均。 风险提示:模型基于历史数据测试,未来市场可能发生变化。 金融工程研究 金融工程专题 开源证券 证券研究报 告 目录 1、资金流Alpha减弱不应归结于策略拥挤3 2、构造方式不合理,截面回归容易忽视大小市值的差异4 3、大小单的识别方法缺乏适应性7 4、风险提示9 图表目录 图1:广义主力净流入率(CNIR)因子在全市场中的超额衰减明显3 图2:资金流相关的报告数量2021年以来大幅增加4 图3:CNIR因子最优的预测区间长度没有变短4 图4:资金流与涨跌幅相关4 图5:剥离反转还是很有必要的,否则Alpha很难凸显4 图6:沪深300指数成分股分组效果较优6 图7:中证500指数成分股分组效果最优6 图8:中证1000指数成分股分组效果最差6 图9:国证2000指数成分股分组效果较差6 图10:中证1000指数成分股最优参数变化较大7 图11:最优参数的逐年统计结果并不稳定7 图12:市场微观结构变化致使委托金额分布漂移8 图13:主力资金表现目前相对弱势8 图14:三种不同分类阈值的因子多空收益对比9 图15:相对阈值和动态阈值的最优参数接近9 图16:逐年的最优参数变化不大9 表1:广义主力资金净流入率(CNIR)因子样本外表现变差3 表2:剥离反转效应的五种备用方案5 表3:大小单划分标准1.0衍生出两种划分方法8 我们曾利用逐笔成交数据重新切分大小单资金流并构造CNIR因子,但是在实际使用过程中发现效果并不理想。关于资金流失效原因及如何应对的讨论较多,本篇报告将着重讨论CNIR构造的两个关键问题,进一步探讨研究的可能性。 图1:广义主力净流入率(CNIR)因子在全市场中的超额衰减明显 数据来源:Wind、开源证券研究所 表1统计了CNIR因子分年度测试的结果,2021年以来,该因子出现了较为明显的衰减。截至2024年底,因子并未出现明显的回调和改善的迹象。 ) 表1:广义主力资金净流入率(CNIR)因子样本外表现变差 统计区间 IC RankIC 多空收益(%) 多空最大回撤(% 回撤区间 2018 0.030 0.034 10.3 2.0 20180206_20180306 2019 0.056 0.061 19.1 2.2 20190131_20190307 2020 0.061 0.063 30.0 1.2 20200207_20200221 2021 0.031 0.025 17.7 1.9 20210830_20210914 2022 0.022 0.015 8.5 2.3 20220810_20220921 2023 0.000 -0.008 2.8 4.2 20230619_20230828 2024 -0.010 -0.013 -6.6 10.7 20240207_20241031 数据来源:Wind、开源证券研究所,统计区间:20180102-20241223 笔者根据因子的实际使用以及收到的反馈情况,分成三部分展开讨论:第一节主要分析资金流策略的拥挤情况;第二节则讨论了CNIR因子构造过程中使用的截面回归方法;第三节侧重于大小单划分标准的重新设定。 1、资金流Alpha减弱不应归结于策略拥挤 我们首先需要回答的问题是:因子失效是因为策略同质化导致的交易拥挤?有一组比较有意思的数据,券商发布的涉及资金流的报告数量,自2021年开始大幅度增加,这说明资金流的确已经被市场广泛认知和使用。 图2:资金流相关的报告数量2021年以来大幅增加图3:CNIR因子最优的预测区间长度没有变短 数据来源:Wind、开源证券研究所数据来源:Wind、开源证券研究所 我们很自然地会认为是策略被关注了引起交易上拥挤,从而导致Alpha出现衰减和因子失效的情况。然而,报告带来的关注度上升并不足以引起同质化交易。图3展示了CNIR因子在不同预测周期长度下的IC变化趋势,2016年以前的峰值大约出现在第15个交易日,2016年以后峰值似乎已经消失并且均值水平出现明显下滑。这说明即便是在若干个组合内共同使用资金流策略,也不至于出现的因子衰减。 矛盾并非千篇一律,关键是具体问题具体分析。以CNIR因子为例,其构造过程主要有两步处理,分别是(1)合并资金流:将超大单、大单和中单合并为广义主力资金;(2)剥离反转效应:逐日计算资金流指标(IMB)对涨跌幅的截面回归残差值,作为修正后的Alpha因子。上述两步骤在分组的多空收益、多头超额等均有不错的收益增强,我们将着重从这两个方面着手讨论。 2、构造方式不合理,截面回归容易忽视大小市值的差异 股票的资金流向反映了微观供求信息,投资者根据这一信息能够对个股的市场关注及偏好程度有一定程度的了解,从而对投资决策的制定提供帮助。但是,买卖行为促使价格发生变动会导致资金流因子暴露反转特征(图4)。我们以前的做法是通过截面回归的方式,剥离反转的负向IC,从而得到正向的资金流Alpha。 图4:资金流与涨跌幅相关图5:剥离反转还是很有必要的,否则Alpha很难凸显 数据来源:Wind、开源证券研究所数据来源:Wind、开源证券研究所,抽取20241223的统计结果 从结果来看,虽然截面回归模型要求样本应服从同一分布,这与实际情况可能 存在些许出入,但至少截面回归能够给最终因子带来稳定的收益改善(图5)。 我们剥离涨跌幅的目的是对因子进行反转中性化。回归模型的估计结果描述了股票价格冲击的一致性规律,因截面选取的大部分样本属于中小市值股票,Beta不能较好地反映大票的流动性冲击影响,通常会导致大市值股票的主力资金净流入被错误估计,从而会在分组收益中凸显小市值的阶段性表现。 𝑙𝑛(𝐵⁄𝑆)=�+�×𝑅𝑒�+� 从表达式中不难看出,回归系数�反映了个股对于资金净流入的敏感程度。流动性好的大市值股票订单簿的厚度更厚,因大额交易产生的冲击较小,但从回归结果来看,似乎市值的影响关系并非是通过订单簿深度来传导的。为了检验市值对于回归模型剥离翻转效应的效果是否会产生明显干扰,笔者在表2中罗列了5种可能的回归方式,并分别构造和测试对应因子相对CNIR因子的改进效果。 回归方法步骤说明 表2:剥离反转效应的五种备用方案 分组回归-市值 第一步,将当日的所有股票按照市值由大到小分成N组(例如,N=3);第二步,根据不同市值组别生成N-1组哑变量V1、V2; 第三步,构造下列回归模型,输入当日全部股票的样本数据进行估计,得到模型的残差项,作为当日修正后的资金净流入𝜀; 𝑙𝑛(𝐵⁄𝑆)=�+𝛽1×𝑅𝑒�+𝛽2×𝑉1+𝛽3×𝑉2+� 第四步,月底回溯过往20个交易日求�的均值作为因子。 分组回归-行业步骤同上,行业类别作为分组标签,生成对应的哑变量用以构造回归模型。第一步,补充股票的市值作为解释变量,将原来的回归表达式修改为如下: 𝑙𝑛(𝐵⁄𝑆)=�+𝛽1×𝑅𝑒�+𝛽2×𝑀�+� 其中,𝑀�为截面全部个股的对数市值。 补充市值变量 第二步,输入当日全部股票的样本数据,估计模型取得残差项作为当日修正的资金净流入𝜀; 第三步,月底回溯过往20个交易日求�的均值作为因子。 补充流动性变量步骤同上,添加的流动性指标为股票当日的换手率。 第一步,逐个统计每只股票的过去120个交易日的资金流和涨跌幅数据;第二步,构造下列回归模型,输入股票i的历史数据,如买入金额B、卖出 时间序列回归 金额S以及涨跌幅ret,估计模型并得到残差项e; 𝑙𝑛(𝐵⁄𝑆)=�+�×𝑅𝑒�+� 第三步,将过往20个交易日的e求均值作为股票i当日的因子暴露。 资料来源:开源证券研究所 通过分组回归-市值、分组回归-行业、补充市值变量、补充流动性变量和时序回归五种方法构造的因子分别记作CNIR_G1、CNIR_G2、CNIR_MV、CNIR_LQ和CNIR_TS。我们用这五个因子以及原始