您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:金融工程专题研究:基于主动买卖特征的高频订单因子改进 - 发现报告
当前位置:首页/其他报告/报告详情/

金融工程专题研究:基于主动买卖特征的高频订单因子改进

2024-08-16张欣慰、张宇国信证券x***
金融工程专题研究:基于主动买卖特征的高频订单因子改进

证券研究报告|2024年08月16日 金融工程专题研究 基于主动买卖特征的高频订单因子改进 核心观点金融工程专题报告 高频订单主动买卖特征蕴含的Alpha信息 考察高频订单的几个维度:在过往研究中,我们从订单大小、成交时长、成交时间、出价高低等多个维度对高频订单数据蕴含的Alpha信息进行了考察。本文我们聚焦订单特征的另一个重要维度——主动买卖特征。 主动买卖特征:每一笔交易都是由其背后的投资者交易而成,而每笔交易往往带有着强烈的交易倾向。促成买卖双方成交的一笔订单究竟是由买方主动促成,还是由卖方主动促成?不同订单主动成交方向对股价未来的影响方向是否存在显著的差异?这些问题都在引领着我们对每笔成交的主动买卖特征进行划分,探析促成每笔成交的买卖倾向给因子有效性带来的差异。 主动买卖特征划分方法梳理及比较 当前学术界和业界中,基于逐笔数据进行主动买卖特征划分的方法主要有基于委托时间(TimeBased)和基于成交价格(PriceBased)两类。 二者在某些特殊情形下的主动买卖特征划分均存在值得商榷的地方,因此本文提出一种结合成交价格及委托时间的主动买卖特征划分法。 引入主动买卖特征对构成大单交易占比因子的子因子进行拆分,均有良好的区分效果,能够分离出选股能力更强、稳定性更好的指标。 引入主动买卖特征的改进大单因子 因子表现:引入主动买卖特征的改进大单因子月度RankIC均值9.09%,年化RankICIR为4.27,月胜率89.01%。多头月均超额0.84%,空头月均超额-1.73%。 引入主动买卖特征的成交量占比因子统一框架 成交量占比因子统一框架:我们根据委托单的“大单属性”将订单分为大单、非大单两类,根据委托单的“漫长属性”将订单分为漫长订单和非漫长订单两类,根据订单的“主动买卖特征属性”将一笔成交划分为主买和主卖两类,对订单类型进行划分。 精选复合因子:我们提出一种基于因子有效性的“迭代分裂法”,基于订单大小、成交时长及主动买卖特征筛选有效维度构建精选复合因子。具体来讲,若引入主动买卖特征后因子有效性区分明显,则保留子因子;否则,沿用父因子,构建复合精选因子。 精选复合因子表现:月频调仓下精选复合因子月度RankIC均值为8.93%,年化RankICIR为5.21,月胜率93.41%。多头月均超额0.99%,空头月均超额-1.56%。周频调仓下精选复合因子的周度RankIC均值为5.59%,年化RankICIR为6.85,周胜率83.72%,在不同的宽基指数及风格股票池中均展现出较强的选股效果。 因子特征:精选复合因子更倾向于低估值、大市值、低波动、低换手股票。在剥离掉传统选股因子后,纯净因子仍展现出稳健的选股能力。 风险提示:市场环境变动风险,本报告基于客观数据,不构成投资建议。 金融工程·数量化投资 证券分析师:张欣慰证券分析师:张宇 021-60933159021-60875169 zhangxinwei1@guosen.com.cnzhangyu15@guosen.com.cn S0980520060001S0980520080004 相关研究报告 《超预期投资全攻略》——2020-09-30 《基于优秀基金持仓的业绩增强策略》——2020-11-15 《基于分析师认可度的成长股投资策略》——2021-05-12 《基于分析师推荐视角的港股投资策略》——2021-05-17 《券商金股全解析——数据、建模与实践》——2022-02-18 《战胜机构投资者——再论主动股基业绩增强策略》 ——2022-12-07 《超额图谱视角下的成长股投资策略》——2023-06-07 《北向因子能否长期有效?——来自亚太地区的实证》 ——2021-05-17 《基于风险预算的中证500指数增强策略》——2021-10-20 《动量类因子全解析》——2021-12-13 《寻找业绩与估值的错配:非理性估值溢价因子》—2021-12-15 《聚焦小盘股——如何构建小市值股票投资策略》—2022-04-05 《反转因子全解析》——2022-06-14 《价量类风险因子挖掘初探》——2022-06-20 《隐式框架下的特质类因子改进》——2022-08-17 《风险溢价视角下的动量反转统一框架》——2022-12-07 《寻找关键时刻的领头羊——时点动量全解析》——2023-05-17 《高频订单成交数据蕴含的Alpha信息》——2024-01-08 《个股与行业的共振——联合动量因子》——2024-01-09 《红利投资全攻略》——2024-06-24 《探寻股价回报的源动力——基于ROE的高质量选股策略》 ——2024-07-30 请务必阅读正文之后的免责声明及其项下所有内容 内容目录 探寻高频订单成交数据蕴含的Alpha信息5 深入高频:从订单数据到行情数据的演变5 逐笔成交数据介绍6 逐笔成交记录的特征属性与成交类型7 基于成交类型构建成交量占比因子8 高频订单成交数据考察维度9 高频订单主动买卖特征蕴含的Alpha信息10 基于委托时间的主动买卖特征划分法12 基于委托时间(TimeBased)的主动买卖特征划分法12 基于委托时间的主动买卖特征划分法不足13 基于成交价格的主动买卖特征划分法14 基于成交价格(PriceBased)的主动买卖特征划分法14 基于成交价格的主动买卖特征划分法不足15 结合成交价格及委托时间的主动买卖特征划分法16 结合成交价格及委托时间(Price-TimeBased)的主动买卖特征划分法16 结合成交价格及委托时间的主动买卖特征划分法在大单上的应用18 引入主动买卖特征的大单因子改进19 引入主动买卖特征的改进大单因子构建及表现19 引入主动买卖特征的改进大单因子VS原始改进大单因子20 引入主动买卖特征的成交量占比因子统一框架21 引入主动买卖特征的成交量占比因子统一框架21 精选复合因子在不同样本空间中的表现25 周频调仓精选复合因子表现27 精选复合因子与常见选股因子相关性28 总结30 风险提示31 图表目录 图1:从订单数据到行情数据的演变5 图2:基于成交类型构建成交量占比因子示意图8 图3:高频订单成交数据考察维度9 图4:传统大单交易占比因子拆解10 图5:基于逐笔成交数据的订单主动买卖特征划分方式11 图6:大单推动股价涨停情况下的价格盘口示意图13 图7:结合成交价格及委托时间的主动买卖特征划分示意图16 图8:结合成交价格及委托时间对初始主动买卖特征修正案例17 图9:引入主动买卖特征的改进大单因子RankIC走势19 图10:引入主动买卖特征的改进大单因子分组月均超额19 图11:引入主动买卖特征的改进大单多头相对基准净值20 图12:引入主动买卖特征的改进大单因子分年度超额20 图13:引入主动买卖特征改进大单残差因子RankIC走势20 图14:传统改进大单残差因子RankIC走势20 图15:基于因子有效性的迭代分裂法24 图16:精选复合因子RankIC走势25 图17:精选复合因子分组月均超额收益25 图18:精选复合因子多头相对基准净值走势25 图19:精选复合因子多空分年度超额收益25 图20:不同风格型股票池样本数量变化26 图21:精选复合因子在不同样本空间中的多空净值走势27 图22:周频调仓精选复合因子RankIC走势28 图23:周频调仓精选复合因子分组周度平均超额收益28 图24:周频调仓精选复合因子多头相对基准净值走势28 图25:周频调仓精选复合因子多空分年度超额收益28 图26:精选复合因子与常见选股因子相关系数29 图27:纯净因子RankIC走势29 图28:纯净因子分组月均超额收益29 表1:逐笔成交数据的数据条目及说明6 表2:逐笔成交数据示例6 表3:订单大小特征与成交类型划分案例7 表4:基于委买单及委卖单的“大单属性”构造的子因子回测结果11 表5:基于委托时间划分主动买卖特征示例12 表6:大单推动股价涨停情况下,基于委托时间划分主动买卖特征存在不合理之处14 表7:基于成交价格划分主动买卖特征示例15 表8:价格冲高回落时,基于成交价格的主动买卖特征划分不足16 表9:结合成交价格及委托时间划分主动买卖特征的大单子因子回测结果18 表10:引入主动买卖特征的改进大单因子和原始改进大单交易占比因子绩效对比19 表11:基于大单属性、漫长属性及主动买卖特征对成交类型进行划分22 表12:不同订单类型成交量占比因子表现23 表13:精选复合因子在不同样本空间中的表现27 近年来,市场对量价数据的探索在颗粒度上不断深入,从最开始的日度行情数据到分钟级、秒级别数据再到逐笔成交数据,数据频率的提升帮助研究者们捕捉到股票更多量与价的细节。如果将市场比作深海,那么订单数据像是推动潮涨潮落周期变化的海水,而行情数据则更像是随着海浪潮汐高低涌动的帆船。股价行情的波动是由投资者交易出来的结果,探寻每个投资者下单背后的逻辑及其信息优势,对了解股价背后的资金博弈程度及未来可能的走势具有极强的指导意义。 在逐笔成交数据中,我们可以根据不同的特征属性将每一笔成交记录划分为不同类型,不同类型的成交记录代表着不同类型投资者博弈之后的结果,其对股票未来预期收益的影响可能存在显著的区别。在国信金工团队2024年1月8日发布的专题研究报告《高频订单成交数据蕴含的Alpha信息》中,我们以逐笔成交数据为研究对象,从订单大小、成交时长、成交时间、出价高低等多个特征对高频订单成交数据蕴含的Alpha信息进行了深入探索,并提出一套基于成交类型的成交量占比因子构建的统一框架。 本文,我们继续考察订单特征的另一重要维度——主动买卖特征。我们对基于逐笔成交数据的主动买卖特征划分方法进行梳理,介绍多种划分方式及其在特定应用情景下的优势和不足。随后,我们提出一种“结合成交价格及委托时间的主动买卖特征划分法”,将该特征引入到统一框架并提出一种基于因子有效性的“迭代分裂法”筛选有效因子,最终结合订单大小、成交时长、主动买卖特征等多个特征构建精选复合因子。精选复合因子在全市场中月度RankIC均值达到8.93%,年化RankICIR达到5.21,月胜率93.41%,多头月均超额0.99%,空头月均超额-1.56%,在不同宽基指数及风格股票池中都展现出较好的选股效果。 探寻高频订单成交数据蕴含的Alpha信息 深入高频:从订单数据到行情数据的演变 近年来,市场对量价数据的探索在颗粒度上不断深入,从最开始的日度行情数据到分钟级、秒级别数据再到逐笔成交数据,数据频率的提升帮助研究者们捕捉到股票更多量与价的细节,进而抽丝剥茧地了解股票行情数据形成背后的交易者结构特征及其交易意图。 图1:从订单数据到行情数据的演变 资料来源:国信证券经济研究所绘制 图1展示了从订单数据到行情数据的演变,其中订单数据(由委买单和委卖单构成)作为行情数据的源头,代表着不同交易者对股票当前公允价值的看法;随后,委买单和委卖单参与成交,二者共同促成一笔交易,形成逐笔成交数据;最后,我们对同一个时间区间内的逐笔成交记录进行汇总,形成秒级、分钟级行情数据。 逐笔成交数据介绍 逐笔成交数据,作为颗粒度最细的数据,记录了集合竞价和连续竞价撮合成功的每一笔成交记录,是一切行情数据产生的源头。逐笔成交数据主要记录了每笔成交的数量、价格、时间信息以及本次成交涉及的买卖双方的订单数量、价格信息。如表1所示,本文使用的逐笔成交数据主要包含以下12个条目,其中对于同一只股票而言,其交易流水号是每一笔成交记录的唯一标识,因此所有交易流水号不重复。 表1:逐笔成交数据的数据条目及说明 数据条目说明 股票代码股票代码 成交时间该笔交易成交的时间 交易流水号逐笔交易的流水号,所有号码不重复 成交价格该笔交易成交的价格 成交量该笔交易成交的股票数量(单位:股) 委卖量委托卖出单的下单股票总数量(单位:股) 成交类型该笔交易为主动买入(B)还是主动