量化专题报告“量价淘金”选股因子系列研究(八)逐笔买卖差异中的选股信息 ——条件成交不平衡因子 证券研究报告|金融工程 2024年10月09日 前言:本文为国盛金工《“量价淘金”选股因子系列研究》的第八篇报告,基于逐笔成交数据的主买、主卖信息,构建有效的选股因子。 成交不平衡因子初探:计算每日的净买单强弱程度,初步构建成交不平衡因子。该因子的表现不佳,其中一项重要原因在于:若当月的净买单数量较多,通常情况下会造成股票的当月涨跌幅较高;而当月涨跌幅与未来涨跌幅呈现显著的负相关性,因此会削弱成交不平衡因子对未来收益的正向预测能力。基于上述分析,将成交不平衡因子对同期涨跌幅进行正交化处理,得到反转残差成交不平衡因子,稳定性可显著提升。 孤立与非孤立成交单的划分:对于每一笔成交单,根据其成交时间点附近是否还存在其他的成交单,将其定义为孤立或者非孤立的成交。通常情况 下,非孤立成交对应的市场信息更为丰富。 反转残差非孤立成交不平衡因子:对逐笔成交数据进行筛选,提取其中的非孤立成交单、计算买卖单不平衡指标,同样对同期涨跌幅做正交化处理,构建反转残差非孤立成交不平衡因子。回测期2017/01/01-2024/08/31 内,在全体A股中,该因子的月度IC均值为0.048,年化ICIR为2.71;10分组多空对冲的年化收益为21.54%,信息比率为2.71,月度胜率为 81.11%,最大回撤为6.88%。在剔除了市场常用风格和行业的影响后,纯净因子的稳定性可进一步提升,年化ICIR达到3.26,全市场10分组多空对冲的信息比率提升至3.05。 图表1:反转残差非孤立成交不平衡因子10分组及多空对冲净值 作者 分析师沈芷琦 执业证书编号:S0680521120005邮箱:shenzhiqi@gszq.com 分析师刘富兵 执业证书编号:S0680518030007邮箱:liufubing@gszq.com 研究助理阮俊烨 执业证书编号:S0680124070019邮箱:ruanjunye@gszq.com 相关研究 1、《“量价淘金”选股因子系列研究(一):如何将隔夜涨跌变为有效的选股因子?——基于对知情交易者信息优势的刻画》2022-04-26 2、《“量价淘金”选股因子系列研究(二):不同交易者结构下的动量与反转》2022-10-24 3、《“量价淘金”选股因子系列研究(三):如何基于RSI 技术指标构建有效的选股因子》2023-03-06 4、《“量价淘金”选股因子系列研究(四):高/低位放量:从事件驱动到选股因子》2023-12-18 5、《“量价淘金”选股因子系列研究(🖂):基于趋势资金日内交易行为的选股因子》2024-05-28 6、《“量价淘金”选股因子系列研究(六):创新高股票中的Alpha》2024-06-26 7、《“量价淘金”选股因子系列研究(七):盲目追随趋势资金的极端交易行为分析——羊群效应的识别与因子构建》2024-08-06 8、《量化分析报告:择时雷达六面图:流动性恢复情绪面弱化》2024-10-06 9、《量化周报:各大规模指数全部确认日线级别上涨 2024-10-07 10、《量化点报报告:月月置建建::12个择时指标怎么看A股》2024-10-07 资料来源:Wind,通联数据,国盛证券研究所 风险提示:以上结论均基于历史数据和统计模型的测算,如果未来市场环境发生明显改变,不排除模型失效的可能性。 请仔细阅读本报告末页声明 内容目录 一、前言3 二、因子初探:成交不平衡因子4 2.1成交不平衡因子的构建4 2.2剔除同期涨跌幅的影响:反转残差成交不平衡因子5 三、因子增强:条件成交不平衡因子7 3.1订单划分:孤立与非孤立成交7 3.2孤立与非孤立成交不平衡因子的构建8 3.3剔除同期涨跌幅的影响:反转残差非孤立成交不平衡因子9 四、其他重要讨论11 4.1纯净反转残差非孤立成交不平衡因子11 4.2参数敏感性测试12 4.3其他样本空间的表现13 �、总结15 图表目录 图表1:反转残差非孤立成交不平衡因子10分组及多空对冲净值1 图表2:平安银行(000001.SZ)20240830逐笔成交数据片段3 图表3:成交不平衡因子10分组及多空对冲净值4 图表4:反转因子对成交不平衡因子效果的削弱5 图表5:反转残差成交不平衡因子10分组及多空对冲净值6 图表6:成交不平衡因子、反转残差成交不平衡因子的IC及多空绩效6 图表7:孤立与非孤立成交单示意图7 图表8:非孤立成交单占比的日内变化趋势8 图表9:孤立成交不平衡因子10分组及多空对冲净值9 图表10:非孤立成交不平衡因子10分组及多空对冲净值9 图表11:成交不平衡、孤立成交不平衡、非孤立成交不平衡因子的IC及多空绩效9 图表12:反转残差孤立成交不平衡因子10分组及多空对冲净值10 图表13:反转残差非孤立成交不平衡因子10分组及多空对冲净值10 图表14:反转残差成交不平衡、反转残差孤立/非孤立成交不平衡因子的IC及多空绩效10 图表15:反转残差非孤立成交不平衡因子分年度表现10 图表16:反转残差非孤立成交不平衡因子与Barra风格因子相关系数11 图表17:纯净反转残差非孤立成交不平衡因子10分组及多空对冲净值11 图表18:反转残差非孤立成交不平衡因子分年度表现12 图表19:不同�邻域取值下反转残差非孤立成交不平衡因子的IC及多空绩效12 图表20:月底不同回看天数下反转残差非孤立成交不平衡因子的IC及多空绩效13 图表21:不同样本空间中反转残差非孤立成交不平衡因子的IC及多空绩效13 图表22:不同样本空间中纯净反转残差非孤立成交不平衡因子的IC及多空绩效14 一、前言 逐笔成交数据,即投资者在交易平台上实际成交的买卖订单数据,它们按照成交的时间顺序排列,并显示成交的价格、数量、方向等信息。该数据反映了每笔交易的具体细节,时间精度可达毫秒级别,可以帮助投资者更加深入地了解市场的微观结构。 图表2展示了平安银行(000001.SZ)在2024年8月30日的逐笔成交数据片段,其中有一列“方向”数据,列明了每一笔成交的买卖方向,标签为“B”代表这一笔成交为主动买入单,即对应着在这一笔成交中,买单是主动吃单方,卖单是挂单方、等待成交;标签为“S”则代表该笔成交为主动卖出单,即买单是挂单方、等待成交,而卖单是主动吃单方。这一“主买”或“主卖”的方向差异,在一定程度上反应了交易双方的激进程度以及对市场未来走势的预期差异,可以作为一项重要的观测指标。 图表2:平安银行(000001.SZ)20240830逐笔成交数据片段 时间戳 成交价格 成交量 成交状态 方向 买单ID 卖单ID 成交ID 10:08:00:560 10.16 100 1 B 12145278 12143550 12145290 10:08:00:560 10.16 200 1 B 12145278 12143611 12145291 10:08:00:560 10.16 100 1 B 12145278 12143843 12145292 10:08:00:630 10.17 600 1 B 12145353 11513896 12145354 10:08:00:860 10.16 1700 1 S 12145278 12145819 12145820 10:08:02:050 10.16 200 1 S 12145278 12149488 12149489 10:08:02:050 10.16 100 1 S 12145278 12149504 12149505 10:08:02:050 10.16 400 1 S 12145278 12149506 12149507 10:08:02:050 10.16 200 1 S 12145278 12149508 12149509 10:08:02:090 10.16 300 1 S 12145549 12149510 12149511 10:08:03:130 10.15 1100 1 S 4581621 12153063 12153064 10:08:03:530 10.16 100 1 B 12154146 12149510 12154147 10:08:04:020 10.16 100 1 B 12155727 12149510 12155728 10:08:04:020 10.16 300 1 B 12155727 12149514 12155729 10:08:04:020 10.16 200 1 B 12155727 12149527 12155730 10:08:05:010 10.16 200 1 B 12158627 12149527 12158628 资料来源:Wind,通联数据,国盛证券研究所 本文为国盛金工《“量价淘金”选股因子系列研究》的第八篇报告,将从逐笔成交数据入手,探索其中的投资者交易行为。具体地,我们聚焦上述提供主动买入、主动卖出信息的“方向”数据,基于逐笔成交的买卖差异,构建有效的选股因子。 二、因子初探:成交不平衡因子 2.1成交不平衡因子的构建 我们猜测,若股票过去一段时间的(主买单数量-主卖单数量)较多,则说明整体来看买方占据主动成交的优势,将导致股票未来收益也较高。基于此,构建初步的成交不平衡因子: (1)每个交易日,统计每只股票当日所有逐笔成交中主动买入和主动卖出的成交单数,计算(主买成交单数-主卖成交单数)/(主买成交单数+主卖成交单数),得到每日的成交单不平衡指标,用于衡量当日的净买单强弱程度; (2)月底回看过去20个交易日,计算20日成交单不平衡指标的平均值,做横截面市值中性化处理,得到成交不平衡因子。 以2017/01/01-2024/08/31为回测时间段,以全体A股(剔除其中的ST股、停牌股、上市未满60个交易日的次新股)为研究样本,成交不平衡因子的月度IC均值为0.029,年化ICIR为1.46,月度RankIC均值为0.028,年化RankICIR为1.13。 图表3展示了成交不平衡因子的10分组及多空对冲净值走势。该因子具有一定的有效性,但整体表现一般,尤其是最近几年的波动和回撤明显增大。整体来看,成交不平衡因子10分组多空对冲的年化收益为14.16%,年化波动为9.07%,信息比率为1.56,月度胜率为75.56%,最大回撤为7.06%。 图表3:成交不平衡因子10分组及多空对冲净值 资料来源:Wind,通联数据,国盛证券研究所 2.2剔除同期涨跌幅的影响:反转残差成交不平衡因子 我们认为,成交不平衡因子表现不佳的一项重要原因在于:若当月的(主买单数量-主卖单数量)较高,影响的不仅仅是股票的未来表现,必定已经对其当下表现产生影响,推动当期股票上涨。因此,我们直觉上猜测,买卖单强弱程度与同时段的涨跌幅存在相关性。经过测算发现,成交不平衡因子与同期反转因子(20日的累计涨跌幅)的横截面相关系数为17.59%,秩相关系数为32.19%,两者确实存在一定的正相关性。 更进一步,由于成交不平衡因子的IC为正,而反转因子的IC为负,但两者又呈正相关,因此反转因子会削弱成交不平衡因子对股票未来收益的正向预测能力,导致其效果不佳。 图表4:反转因子对成交不平衡因子效果的削弱 资料来源:国盛证券研究所整理 基于上述分析,我们剔除同期涨跌幅对成交不平衡因子的影响: (1)每个交易日,统计每只股票当日所有逐笔成交中主动买入和主动卖出的成交单数,计算(主买成交单数-主卖成交单数)/(主买成交单数+主卖成交单数),得到每日的成交单不平衡指标; (2)月底回看过去20个交易日,计算20日成交单不平衡指标的平均值,做横截面市值中性化处理,得到成交不平衡因子; (3)将成交不平衡因子,对过去20个交易日的累计涨跌幅进行正交化处理,得到反转残差成交不平衡因子。 图表5展示了反转残差成交单不平衡因子的10分