期货研究报告|量化专题报告2024-12-03 高频因子在股指期货上的低频化应用 研究院量化组 研究员 高天越 0755-23887993 gaotianyue@htfc.com从业资格号:F3055799投资咨询号:Z0016156 李逸资 0755-23887993 liyizi@htfc.com 从业资格号:F03105861投资咨询号:Z0021365 李光庭 0755-23887993 liguangting@htfc.com从业资格号:F03108562投资咨询号:Z0021506 联系人 黄煦然 0755-23887993 huangxuran@htfc.com从业资格号:F03130959 投资咨询业务资格: 证监许可【2011】1289号 摘要 在《高频收益如何及何时可预测》系列报告中,我们展示了高频多因子模型在国内商品期货市场上的实证结果。我们也将该方法应用到股指期货上,验证其在金融期货品种上的有效性。经测试发现,由于股指期货交易数据的特征与商品期货不同,导致股指期货预测效果不及商品期货。由于股指期货日内交易的手续费比较昂贵,在收益率预测效果不及预期的情况下,高频策略的收益无法很好地覆盖交易产生的成本。考虑到今年股指期货的波动较大,我们将高频因子进行降频化处理并构建相应的策略,以赚取波段收益。 核心观点 1)由于股指期货交易数据的特征与商品期货不同,导致高频多因子模型在股指期货收益的预测效果不及商品期货。 2)股指高频因子低频化后,能够覆盖成交滑点与手续费,在今年股指波动加大的市场环境下,相关低频化策略表现优秀。 目录 摘要1 核心观点1 高频因子在股指期货上的低频化应用4 ■高频多因子模型结果4 ■更多降频方式12 ■其它品种回测效果12 ■总结14 ■风险提示14 图表 图1:多因子模型样本外R方|单位:%4 图2:多因子模型样本外方向准确性丨单位:%4 图3:股指期货与商品盘口差异丨单位:无5 图4:降频后数据示意丨单位:无5 图5:高频因子低频化流程图丨单位:无6 图6:1MIN频率因子排名前5累计净值|单位:无6 图7:10MIN频率因子排名前5累计净值|单位:无7 图8:30MIN频率因子排名前5累计净值|单位:无7 图9:1DAY频率因子排名前4累计净值|单位:无8 表1:1MIN频率因子排名前5策略效果丨单位:无6 表2:10MIN频率因子排名前5策略效果丨单位:无7 表3:30MIN频率因子排名前5策略效果丨单位:无7 表4:1DAY频率因子排名前4策略效果丨单位:无8 表5:1MIN频率单笔收益统计丨单位:无8 表6:10MIN频率单笔收益统计丨单位:无8 表7:30MIN频率单笔收益统计丨单位:无9 表8:1DAY频率单笔收益统计丨单位:无9 表9:30MIN频率因子值分布丨单位:无9 表10:30MIN频率因子阈值夏普排名前5丨单位:%10 表11:30MIN频率因子阈值夏普排名后5丨单位:%10 表12:30MIN频率合成因子策略效果丨单位:无11 表13:IM-30MIN频率优选因子策略效果丨单位:无12 表14:IC-30MIN频率优选因子策略效果丨单位:无13 表15:IF-30MIN频率优选因子策略效果丨单位:无13 表16:IH-30MIN频率优选因子策略效果丨单位:无13 高频因子在股指期货上的低频化应用 ■高频多因子模型结果 在《高频收益如何及何时可预测》系列报告中,我们展示了高频多因子模型在商品期货上的实证结果。我们也尝试将高频因子收益率预测模型应用在股指期货上,但发现预测效果不如模型在商品上的预测效果。 图1:多因子模型样本外R方|单位:%图2:多因子模型样本外方向准确性丨单位:% 数据来源:天软华泰期货研究院数据来源:天软华泰期货研究院 经过观察发现,股指期货的盘口买卖价差大于商品,挂单量显著少于商品。与商品窄且厚的盘口相比,股指期货盘口展示�了宽且薄的特征。盘口薄可能导致因子值变动过于频繁,使得因子有效性减弱,股指期货的日内手续费加收也会导致超高频策略失效。另外股指期货更多受标的指数变动的影响,仅考虑股指期货盘口量价因子可能不够全面,使得收益率预测效果不如商品。 由于股指期货日内交易的手续费比较昂贵,在收益率预测效果不及预期的情况下,高频策略的收益无法很好地覆盖交易产生的成本。考虑到今年股指期货的波动较大,我们对高频因子进行降频化处理并构建相应的策略,以赚取波段收益。 图3:股指期货与商品盘口差异丨单位:无 数据来源:天软,华泰期货研究院 我们首先选取2023年1月至2024年10月的IM主力合约进行测试。为构建更低频率的策略,我们先将tick级别的数据降低至相应的频率,这里选取了1分钟、10分钟、半小时、以及一天进行测试。因子层面,我们采取计算该因子在相应时间段中均值的方法进行降频。收益率层面,我们用每个时间段第一个tick的价格以及最后一个tick的价格来计算收益率。其次,我们对单因子进行因子有效性测试,计算每一期的因子值以及下一期的收益率的相关系数,筛选�相关性强的因子构建单因子策略。然后,我们将这些因子进行择优合成,并构建合成因子策略。 图4:降频后数据示意丨单位:无 数据来源:天软,华泰期货研究院 在构建单因子策略时,我们根据因子特性来决定开仓方向以及阈值。如因子值在0附近震荡,则设多空阈值x和y为0,如因子值都大于0或都小于0,则设多空阈值x和y为其平均值。 策略构建 因子合成 单因子测试 降频均值 高频因子 图5:高频因子低频化流程图丨单位:无 数据来源:华泰期货研究院 当期因子值a与下期收益率r呈正相关时,a>x时做多,a<y时做空;a与r呈负相关时,a<y时做多,a>x时做空;y≤a≤x时空仓。 首先展示的是各频率上效果排名靠前的因子。以下测算结果均尚未考虑交易成本。 图6:1min频率因子排名前5累计净值|单位:无表1:1min频率因子排名前5策略效果丨单位:无 因子 年化收益 最大回撤 夏普比率 trendratio 87.08% -4.43% 6.09 deriv_ap_1 91.51% -5.77% 5.57 deriv_bp_1 86.46% -7.33% 5.05 windowreturn 58.03% -11.71% 3.59 order_flow_imb 58.95% -8.39% 3.39 数据来源:天软,华泰期货研究院数据来源:天软,华泰期货研究院 图7:10min频率因子排名前5累计净值|单位:无表2:10min频率因子排名前5策略效果丨单位:无 因子 年化收益 最大回撤 夏普比率 order_flow_imb 38.44% -8.29% 2.47 trade_imb2 30.51% -9.31% 2.04 rsi 30.02% -8.93% 1.91 oi_return 26.59% -8.51% 1.60 quoted_spread 19.16% -12.74% 1.28 数据来源:天软,华泰期货研究院数据来源:天软,华泰期货研究院 图8:30min频率因子排名前5累计净值|单位:无表3:30min频率因子排名前5策略效果丨单位:无 因子 年化收益 最大回撤 夏普比率 order_flow_imb 43.52% -5.57% 3.16 deriv_bp_1 35.44% -9.36% 2.51 trendratio 32.91% -8.22% 2.32 deriv_ap_1 32.71% -8.00% 2.28 trade_imb2 28.29% -6.65% 2.08 数据来源:天软,华泰期货研究院数据来源:天软,华泰期货研究院 图9:1day频率因子排名前4累计净值|单位:无表4:1day频率因子排名前4策略效果丨单位:无 因子 年化收益 最大回撤 夏普比率 deriv_av_1 25.66% -16.50% 1.35 deriv_bv_1 4.76% -25.82% 0.33 lob_imb 1.96% -26.82% 0.20 windowreturn 0.33% -26.26% 0.12 数据来源:天软,华泰期货研究院数据来源:天软,华泰期货研究院 不同频率下表现最优的因子有所差异,有些因子如:基于挂单变化的因子order_flow_imb,盘口处价格相关的因子driv_ap_1、trendratio在不同频率上都有不错的表现。总体来看,大部分高频因子降至日频后效果不佳,综合最大回撤、夏普比率、交易成本等来看,30min在回测的4个频率中表现较好。 其次我们对各因子策略的交易次数及单笔收益进行了统计。 表5:1min频率单笔收益统计丨单位:无 因子 累计收益(点)交易次数单笔收益(点) 单笔跳价倍数 trendratio 12045.21007500.12 0.60 deriv_ap_1 127951059260.12 0.60 deriv_bp_1 11942.21057640.11 0.56 windowreturn 7445.8918820.08 0.41 order_flow_imb 7582.4945700.08 0.40 数据来源:天软华泰期货研究院 表6:10min频率单笔收益统计丨单位:无 因子 累计收益(点) 交易次数 单笔收益(点) 单笔跳价倍数 order_flow_imb 4656.2 8486 0.55 2.74 trade_imb2 3678 8634 0.43 2.13 rsi 3613.4 8716 0.41 2.07 oi_return 3100 8824 0.35 1.76 quoted_spread2237.830540.733.66 数据来源:天软华泰期货研究院 表7:30min频率单笔收益统计丨单位:无 order_flow_imb 5479.2 2606 2.10 10.51 因子累计收益(点)交易次数单笔收益(点)单笔跳价倍数 deriv_bp_14367.229361.497.44 trendratio 4028.4 2874 1.40 7.01 trade_imb2 3421 2676 1.28 6.39 deriv_ap_14001.829401.366.81 数据来源:天软华泰期货研究院 表8:1day频率单笔收益统计丨单位:无 deriv_av_1 3052 402 7.59 37.96 因子累计收益(点)交易次数单笔收益(点)单笔跳价倍数 lob_imb 211.2 396 0.53 2.67 deriv_bv_1534.63951.356.77 windowreturn40.43820.110.53 数据来源:天软华泰期货研究院 结合总收益以及单笔收益统计来看,日内的3个频率中,30min下的因子表现较优。排名前5的因子单次交易可以承受6倍以上的最小跳价。日频策略中,只有deriv_av_1的表现较好。 接下来我们选取30min频率进行进一步的策略构建。我们将阈值x和y设为不同的数值,并采取前述开仓方式。 表9:30min频率因子值分布丨单位:无 因子 mean std min 25% 50% 75% max order_flow_imb -0.0105 0.1275 -1.0386 -0.0828 -0.0111 0.0581 0.6989 deriv_bp_1 -0.0002 0.0152 -0.0908 -0.0076 -0.0006 0.0063 0.1283 trendratio -0.0012 0.0128 -0.0475 -0.0092 -0.0014 0.0064 0.0469 数据来源:天软华泰期货研究院 我们分别设置3个因子的阈值如下: order_flow_imb:x:[0,0.01,0.02,0.03];y:[0,-0.01,-0.02,-0.03] deri