【专题报告】 算法交易中的“隐形成本”破局:基于机器学习的冲击模型与实证 ❖研究冲击成本对实盘交易具有重要的意义 华创证券研究所 随着高频和算法交易的普及,交易行为对股价的“价格冲击”成为影响交易成本的重要因素。冲击成本作为隐性成本,受流动性、交易规模、市场环境等多重因素影响,传统方法难以精准量化,制约了投资收益和策略执行效果。 证券分析师:陈燕文电话:010-63214677邮箱:chenyanwen@hcyjs.com执业编号:S0360524120002 ❖华创证券创新性地引入了人工智能模型对冲击成本进行建模 华创证券基于订单数据,构建了瞬时冲击、临时冲击和永久冲击三类标签,并引入LightGBM模型进行训练。模型在测试集中R方达到0.4418,准确率84.67%,相关性0.6017,优于传统模型。 相关研究报告 《算法交易——投资交易的利器》2025-03-04 ❖特征与因子重要性分析 瞬时冲击:与股票价格负相关,与盘口价差、流动性正相关,重要因子为股票价格、区间市占比、算法类型。 临时冲击:与市占比正相关,重要因子为区间市占比、盘口价差、股票价格。永久冲击:与市占比高度正相关,重要因子为全天市占比、交易时间、成交活跃性。 ❖进一步优化模型,增强其在实践中的适用性 为解决机器学习模型在极端样本下的预测失真问题,本文提出了“LightGBM+显式回归”的混合建模方法,确保模型在合理区间内稳定、可解释,并支持IS算法和交易计划的优化。 ❖风险提示 基于历史结果计算,不代表未来收益。 目录 一、引言:隐形成本的现实挑战.............................................................................................4 二、经典模型回顾:从理论基石到实践框架.........................................................................4 (一)本土探索:国内研究进展与贡献.........................................................................5(二)国际前沿:经典理论与最新动态.........................................................................5 三、创新突破:基于机器学习的冲击建模实践.....................................................................8 (一)因变量构建.............................................................................................................8(二)特征工程.................................................................................................................91、瞬时冲击:价格越低,冲击越大.........................................................................102、临时冲击:市占比主导的流动性消耗.................................................................103、永久冲击:市占比的长期价格影响.....................................................................11(三)模型构建:LightGBM的训练与表现.................................................................121、瞬时冲击的关键驱动因子.....................................................................................132、临时冲击的主导变量.............................................................................................133、永久冲击的核心因素.............................................................................................14(四)模型优化:显式回归与可解释性校正...............................................................14 四、结论...................................................................................................................................15 五、风险提示...........................................................................................................................15 六、参考文献...........................................................................................................................15 图表目录 图表1模型参数表.................................................................................................................4图表2成本计算逻辑.............................................................................................................9图表3冲击成本计算方法.....................................................................................................9图表4特征列表...................................................................................................................10图表5瞬时冲击成本与特征相关性...................................................................................10图表6临时冲击成本与特征相关性...................................................................................11图表7永久冲击成本与特征相关性...................................................................................12图表8模型训练结果...........................................................................................................12图表9瞬时冲击模型因子的重要度...................................................................................13图表10临时冲击模型因子的重要度.................................................................................13图表11永久冲击模型因子的重要度.................................................................................14 一、引言:隐形成本的现实挑战 随着我国资本市场的不断成熟,高频交易、算法交易已成为市场交易的重要组成部分,交易行为的复杂性与时效性显著提升,市场参与者对交易成本的敏感度也日益提高。在实际交易过程中,无论是机构投资者的大额下单,还是中小投资者的批量交易,都会对股票价格产生一定的冲击——即价格冲击,这种冲击会导致实际交易价格偏离理论价格,进而产生额外的交易成本,即冲击成本。冲击成本作为隐性交易成本的核心组成部分,与显性交易成本的交易佣金、印花税不同,其大小受市场流动性、交易规模、指令类型、市场环境等多种因素影响,具有较强的不确定性,难以通过传统统计方法精准量化,已成为制约投资收益提升、影响交易策略执行效果的重要瓶颈。 从市场微观结构视角来看,价格冲击的本质是交易行为对市场供需平衡的打破,而冲击成本则是这种打破所带来的收益损耗。当前,学术界与实业界对价格冲击的研究多集中于单一因素的影响分析,对冲击成本的量化与预测仍存在诸多不足:一方面,现有研究对市场冲击指标的界定不够全面,未能充分结合我国资本市场的交易特点,整合指令流、大单交易、指令爆发等多维度市场行为指标。 参考相关实证研究成果可知,价格冲击不仅与市场深度、指令流不平衡等因素密切相关,还受到指令爆发、大单交易与撤单行为的显著影响,且这种影响在不同交易时段、不同股票之间存在明显差异。此外,冲击成本的高低还会影响算法交易的有效性,部分低流动性股票的高冲击成本会导致因子IC值出现剧烈波动,进而影响算法交易的效果。在此背景下,系统研究价格冲击的形成机制、冲击成本的量化方法与预测模型,分析其对市场交易行为及算法交易的影响,具有重要的理论与实践意义。 本次研究报告,我们创新性地引入了人工智能模型对冲击成本进行建模,因为在样本量足够大,覆盖场景足够广的情况下,机器学习模型能够有效建立特征与冲击成本之间的关系。 二、经典模型回顾:从理论基石到实践框架 当前,国内外学者对价格冲击与冲击成本的研究已取得一定成果。下表给出了一般冲击模型涉及的相关变量定义: (一)本土探索:国内研究进展与贡献 王若昕与马锋(2021)针对中国股市日内高频数据的可预测性问题进行了研究。该研究构建了基于日内跳跃(Intraday Jumps)与动量(Momentum)的分析框架,用以检验日内价格变动的非随机性特征。通过识别高频价格序列中的跳跃成分,并结合时间序列模型分析动量效应对未来收益的影响,研究发现跳跃信息在价格发现过程中具有重要作用,并能够与日内动量共同影响短期收益率。然而,该研究在模型构建上仍主要依赖线性预测框架,未能充分纳入订单簿深度变化等微观结构信息,对指令流爆发所带来的瞬时价格冲击刻画仍较为有限。 杨世超等(2021)从市场质量视角出发,系统分析了投资者交易频率对市场流动性与价格波动的动态影响。文章通过构建交易频率与市场微观结构指标(如买卖价差、市场深度)之间的关联模型,探讨不同交易频率行为对市场均衡的影响机制。研