您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开源证券]:市场微观结构研究系列(16):大小单重定标与资金流因子改进 - 发现报告
当前位置:首页/其他报告/报告详情/

市场微观结构研究系列(16):大小单重定标与资金流因子改进

2022-09-04魏建榕、苏良开源证券变***
市场微观结构研究系列(16):大小单重定标与资金流因子改进

金融工程专题 2022年09月04日 大小单重定标与资金流因子改进 金融工程研究团队 ——市场微观结构研究系列(16) 魏建榕(首席分析师) 魏建榕(分析师)苏良(联系人) 证书编号:S0790519120001 weijianrong@kysec.cn 证书编号:S0790519120001 suliang@kysec.cn 证书编号:S0790121070008 张翔(分析师) 证书编号:S0790520110001 傅开波(分析师) 证书编号:S0790520090003 高鹏(分析师) 证书编号:S0790520090002 苏俊豪(分析师) 证书编号:S0790522020001 胡亮勇(分析师) 证书编号:S0790522030001 王志豪(分析师) 证书编号:S0790522070003 盛少成(研究员) 证书编号:S0790121070009 苏良(研究员) 证书编号:S079012107000 相关研究报告 《高频因子:分钟单笔金额序列中的主力行为刻画--市场微观结构研究系列》-2022.6.12 《新型因子:资金流动力学与散户羊群效应--市场微观结构研究系列》 -2022.6.2 《理想反转因子的4年总结:依旧理想--市场微观结构研究系列》-2022.5.2 资金流因子的两个关键点:识别与修正 大、小单重定标:逐笔数据包含每笔订单的挂单金额、挂单数量等信息,可用以 还原成交订单的挂单信息。我们利用逐笔数据,通过设定44个金额阈值重新划定深市的大、小单来捕捉资金流中的主力行为信息。 MOD修正法:从资金流动力学的角度理解,大单资金流与涨跌幅呈正相关缘自 主力资金买卖的不平衡,本文选取买入卖出金额比作为代理变量(IMB),通过截面回归的方法,剥离反转因素的影响以提纯资金流的Alpha信息。NIR_MOD 因子相比NIR因子选股能力明显提升,IR由2.63提升至4.76。 资金流的微观结构分解:小单提供流动性支持 (1)我们测试不同金额阈值下NIR_MOD因子的选股表现,结果表明:随着划 分大单的金额阈值降低,因子的有效性逐渐减弱,最优的划分阈值并非是20万元,而是更小,例如2万元。低阈值下,NIR_MOD因子在十分组下的多空对冲收益由26.13%提升至32.16%,而多空净值的回撤幅度进一步减小至6.02%。 (2)区分大单和小单的Alpha,本文分别测试大单NIR_MOD和小单NIR_MOD 的表现,大单的多空收益可以达到年化25%以上,相比小单收益多出4%左右,资金流的Alpha更多来源自主力资金的信息优势而不是小单流动性映射。 (3)主动与非主动标签并未贡献明显的增量信息。依据逐笔数据的Type、Side等字段划定主动与非主动交易,我们测试后发现基于主动买卖数据构造的大单NIR_MOD因子选股效果并未获得改进。 分域测试:小票表现更好,大票主力划定阈值较高 在大票为主的沪深300和中证500指数成分股中,主力资金的最优划分阈值是不 明确的,并且划分金额相对更高,而在中证1000以及全市场范围内因子的有效性曲线会更“光滑”。笔者认为这可能与机构拆单行为有关: (1)机构在大票上交易更多。根据最新的公募持仓明细,截止20220630,公募 在中证800上的持仓集中度达到了78.27%; (2)小票上的委托单拆分金额更小。由于小票的流动性不足,主力资金通常会把大额的委托单拆得更细,而在大票上拆分的颗粒度则会更大一些。 基于大、小单重标结论的资金流因子改进 由参数敏感性测试得知,基于小金额标准(例如,2万元)识别的主力资金因子表现更好,仅在深市范围内测试,低阈值的NIR_MOD因子多头年化收益达到31.4%,多空IR为4.61,多空净值的整体回撤幅度较小,仅为3.28%。 为了更便捷地利用上述结论,我们将Wind的超大单、大单和中单合并,定义为 有定价权的“广义主力资金”,进而在NIR_MOD的基础上构造CNIR因子。在全市场上,CNIR因子的多头年化收益率达到27.86%,IR也提升至4.91;从分域测试效果来看,因子在中证1000上表现要优于沪深300和中证500。 风险提示:模型基于历史数据统计,未来市场可能发生变化。 金融工程 研究 金融工程 专题 开源证券 证券研究报 告 目录 1、资金流因子的两个关键点:识别与修正4 1.1、大、小单的重定标:绝对金额法与相对金额法4 1.2、资金流与涨跌幅的相关性处理:MOD修正法6 2、资金流因子的微观结构10 2.1、主力资金的泛定义:20万元的大单标准并非最优10 2.2、资金流Alpha来自主力资金而非小单12 2.3、大、小单博弈与资金流相关性:小单提供流动性支持13 2.4、主力资金阈值的分域差异:小票显著低于大票14 2.5、主动买卖划分:未发现有额外的信息增益16 3、基于大、小单重定标的资金流因子改进17 3.1、逐笔信息的低频化应用:从NIR_MOD到CNIR17 3.2、因子收益特征:呈现“二月魔咒”,小票上表现更好18 3.3、因子相关性分析:与常见因子关联度低20 3.4、持仓分析与复盘21 4、风险提示22 图表目录 图1:挂单金额金字塔与分位值变化趋势:小幅变动,整体相对稳定5 图2:重新标定大、小单资金流的示意图6 图3:不同阈值的累计成交金额分布较为均衡6 图4:沪深300的数据覆盖度最高、中证500次之6 图5:大单资金流因子具备较为稳定的选股能力7 图6:大单IMB与涨跌幅呈正相关8 图7:小单IMB与涨跌幅呈负相关8 图8:大单IMB指标与N日涨跌幅的秩相关系数矩阵:低阈值、短周期相关性更高8 图9:修正后资金流因子的选股能力显著提升9 图10:NIR_MOD因子十分组超额单调性更好10 图11:NIR_MOD因子的多空对冲效果有明显提升10 图12:NIR_MOD因子的参数敏感性测试:最优阈值为2万元11 图13:NIR_MOD因子在2万元标准下表现更好11 图14:多空对冲测试结论同样支持更低的划分阈值11 图15:NI因子:最优阈值为2.5万元12 图16:NIPCT因子:最优阈值为2万元12 图17:大单NIR_MOD比小单NIR_MOD因子选股能力更强12 图18:净流入因子的Alpha呈“两极分化”状13 图19:成交金额因子的Alpha分布比较均匀13 图20:大单的交易对手方集中在3万元以下的小单14 图21:不同选股域内测试:沪深300、中证500的最优阈值取值相对模糊,并且水平整体偏高15 图22:资金流Alpha拆解示意图16 图23:基于主动买卖金额构造资金流因子并未有正超额17 图24:CNIR因子月度RankIC相对稳定18 图25:全市场五分组表现:多头收益显著18 图26:叠加两步改进,CNIR因子收益明显增厚18 图27:CNIR因子多头收益进一步提升18 图28:CNIR因子的对冲收益统计:整体收益分布相对均衡,存在一定的月度差异19 图29:CNIR因子的多空对冲净值曲线:全市场对冲收益最高19 图30:CNIR因子与Barra风格因子相关性偏低20 图31:CNIR因子与交易行为因子解释能力重叠度低20 图32:剥离风格因子、交易行为因子收益后,CNIR因子多头仍然有效20 图33:中证800多头组合板块配置情况:2021年6月以来超配大金融板块21 图34:主力净流入与公募基金持仓变动正相关21 图35:主力净流入与公募基金持仓变动相关性较高21 图36:CNIR因子换手率整体偏低22 表1:大单资金流因子常见的几种定义方式7 表2:CNIR因子的计算步骤17 表3:不同选股域内的五分组表现:CNIR因子在小票上表现更好19 如何高效率识别市场上的交易主体?围绕该问题我们曾展开多方位的探索:从交易行为的维度,我们针对单笔成交金额从分布特征、时序相关性、反转效 应三个方面出发,提炼有效的价量因子。例如,我们从“相对大单”中挖掘QUA因子,其选股逻辑来自主力资金的关注度差异:关注度越高,未来股价表现越好。详情参考:《高频因子:分钟单笔金额序列中的主力行为刻画》,2022-06-12。 从另类数据的维度,低频股东户数变化因子具有选股能力,而互动易平台实时披露的数据是定期报告披露的有益补充。我们纳入高频股东数据的合成股东变化因子具有收益增强的能力,但增益幅度与所选取的股票池相关。详情参考:《高频股东数据的隐含信息量》,2020-12-31。 从资金流向的维度,大单资金往往呈现正向Alpha能力,其源自大单资金的“预见性”。我们通过分析资金流与同期涨跌幅的关系发现,大单资金流强度与同期涨跌 幅呈正相关关系,剥离掉涨跌幅因素后因子选股效果有显著提升。详情参考:《大单与小单资金流的alpha能力》,2021-06-02。 本文尝试利用逐笔数据重新划分买卖委托单,识别出真正具有显著选股能力的主力资金,主要内容为三部分:一是介绍资金流的处理方法,如何捕捉纯净的主力资金交易行为?二是拆分资金流的内部微观结构,探寻资金流因子的生效逻辑;三是改进资金流因子并测试其选股效果,因子经过改进后Alpha收益显著提升。 1、资金流因子的两个关键点:识别与修正 1.1、大、小单的重定标:绝对金额法与相对金额法 上交所和深交所在2013年推出的Level-2行情数据包含了个股每笔成交的详细信息,通过分析每笔订单的委托价格和数量,揣摩背后投资人的交易意图,我们可以从中挖掘出有效的Alpha信息。 例如,委托单的挂单金额大小在一定程度上反映了投资人的资金实力,而大额委托单的背后对应着的是资金实力更强的投资者,往往具备更多的信息优势从而能够在股市的博弈中占据主导地位,即所谓的“大单投资者”或“主力资金”。 市场上关于资金流向策略的研究大多基于绝对金额的划分标准,即所有的成交委托单根据挂单金额划分为四类:超大单、大单、中单和小单。 (1)超大单:挂单金额大于100万元,定义为“机构”; (2)大单:挂单金额介于20万元至100万元之间,定义为“主力”; (3)中单:挂单金额介于4万元至20万元之间,定义为“大户”; (4)小单:挂单金额小于4万元,定义为“散户”。 常规的划分标准应用并不表示其合理性,我们最早在探索逐笔数据信息时发现了其中存在的问题,在该划分体系下的资金流向数据主要有两点缺陷: (1)划分阈值不合理。该标准共设立了三个阈值,分别为4万元、20万元及 100万元。结合挂单金额金字塔(图1)不难看出,“散户”的挂单金额上限实际可能 会比4万元更少,而部分股票缺少超大单成交并不能说明机构没有参与交易,有可能 是采取了拆单等更为隐蔽的交易方式; (2)划分体系过于复杂。四种类型委托单的划分方法既不能帮助我们识别出所有交易主体,也不能明确各自所代表的不同对象,容易让人陷入到诸如“某类委托单是否属于机构行为”的无意义论证当中,失去了特征识别模型的简洁和优雅。 图1:挂单金额金字塔与分位值变化趋势:小幅变动,整体相对稳定 数据来源:Wind、开源证券研究所 挂单金额金字塔:我们统计了每个交易日在不同挂单金额的买、卖单数量,如图1右侧所示。横轴的双侧箭头分别表示卖单笔数和买单笔数,纵轴则表示挂单金额 的大小。从形状上来看这比较像是一个畸形的金字塔,底座部分极宽(通常右侧买单会更宽一些),顶部则十分的狭长。统计结论是,大部分订单的挂单金额离4万元都 很遥远,中位数大概在1万元,而4万元在80%分位以上,挂单金额在100万元以上的超大单则更是稀少。 根据逐笔数据重新定义大、小单资金是否可行? 逐笔数据中包含了每笔订单的挂单金额、挂单数量等信息,可以还原所有成交订单的挂单信息。目前,划分大、小单的方法主要有两类:绝对金额法与相对金额法。绝对金额法设定某个金额阈值作为统一标准,适用于全市场的所有股票,而相对金额法则是针对不同股票分别设定各自适用的分立标准。 两种方法各有优缺点,我们考虑到相对金额法会面临更多的质