基于量价信息的利率择时探讨 ——宏观固收量化研究系列之(八) 研究结论 本文探讨了通过挖掘利率市场量价信息来进行择时的可能性,不同于传统技术分析的做法,本文尝试寻求好的量价因子,构建因子池,并最终将各因子的信号通过等权法或回归法合成最终信号,并在10年期国债期货主力合约、10年国开活跃券和长短久期指数轮动上进行回测。 本文以2020年底之前作为样本内区间,回测了成交量、价格动量、价格波动、期限利差水平、期限利差动量、税收利差水平、税收利差动量、期现价差、资金面水平、资金面波动10个大类,共计578个时序因子,然后根据因子样本内表现的定量 金融工程|专题报告 报告发布日期2022年12月13日 王星星021-63325888*6108 wangxingxing@orientsec.com.cn 执业证书编号:S0860517100001 宋之辰songzhichen@orientsec.com.cn 标题日期 指标筛选出较好的因子构成因子池。 对于因子池中的因子,我们尝试用等权法和回归法来合成最终信号。经回测,等权法合成因子表现较好,并且在样本外仍然有不错的超额收益: 对于国债期货标的,全样本年化收益达到4.25%,收益风险比达1.41,平均交易天数为7.69天/次; 对于10年期国开活跃券利率标的,全样本年化赚得收益率达到71.1bps,收益风险比达1.54,平均交易天数为7.96天/次; 对于长短久期轮动组合,全样本年化收益达到6.36%,收益风险比达3.1。 本文还尝试了使用滚动和扩展的方式定期更新因子池的做法,结果表明,扩展方式下的回归法合成效果较好,对于10年期国开活跃券利率标的,2016年以来的回测结果显示,年化赚得收益率达到42.4bps,收益风险比达0.96。 最后,本文还根据这578个时序因子在不同波段行情下的表现,筛选出具有反转特征的因子,分别为5Y国债_近10日标准差_近3Y历史分位数、2Y国开_近5日标准差_近5Y历史分位数、10Y国开_近5日标准差_近1Y历史分位数、R007_近5日标准差_近1Y历史分位数、DR007成交额_水平值_近5Y历史分位数、R001_近5日标准差_近1Y历史分位数,供投资者参考。 随着利率债市场的波动不断加大,定量化策略和量价因子可以从统计分析、回溯历史等角度给投资者提供参考意见,为投资决策提供补充的信息和思路。 风险提示 量化模型失效的风险 市场极端环境的冲击 债券的风险模型研究:——宏观固收量化研究系列之(七) 活跃券的均线择时:——宏观固收量化研究系列之(六) 基于机器学习模型的债券流动性预测:— —宏观固收量化研究系列之(五) DFQ市场化国债&国开利率曲线:——宏观固收量化研究系列之(四) 2022-09-03 2022-03-25 2021-11-23 2021-06-05 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、概要4 二、策略设计4 三、因子构建6 四、单因子回测与筛选8 五、合成信号回测13 5.110年期国债期货主力合约回测15 5.210年国开活跃券利率17 5.3中债7-10年国开债指数与1年以下国开债指数轮动18 5.4滚动或者扩展窗口筛选因子20 六、反转因子探讨22 七、结论27 风险提示27 附录28 参考文献29 图表目录 图1:以国开期限利差为例的各种数据加工方式展示7 图2:以“R007_5日移动平均_近1Y历史分位数”为例的因子值、因子生成的信号和该因子的回测净值曲线9 图3:筛选出的单因子净值曲线(回测标的:10年期国债期货主力合约)12 图4:筛选出的单因子累计赚得收益率(回测标的:10年期国开活跃券利率)13 图5:显著因子数量(标的:10年期国债期货主力合约)13 图6:显著因子数量(标的:10年期国开活跃券利率)13 图7:等权法今年以来信号(标的:10年期国债期货主力合约)14 图8:等权法今年以来信号(标的:10年期国开活跃券利率)14 图9:回归法今年以来信号(标的:10年期国债期货主力合约)14 图10:回归法今年以来信号(标的:10年期国开活跃券利率)14 图11:合成信号表现(回测标的:10年期国债期货主力合约)15 图12:合成信号表现(回测标的:10年国开活跃券利率)17 图13:合成信号表现(回测标的:长短久期指数)19 图14:合成信号表现(回测标的:10Y国开活跃券利率)21 图15:合成信号表现(回测标的:长短久期指数)22 图16:牛熊波段划分(序列:10年期国开到期收益率)23 图17:各反转因子的信号分布(红色方框代表成功预测行情的末尾)25 图18:所有用到的因子列表28 表1:回测品种与回测设计6 表2:回归与单因子回测设计9 表3:部分单因子回测结果展示(回测标的:10年期国债期货主力合约)11 表4:部分单因子回测结果展示(回测标的:10年期国开活跃券利率)11 表5:筛选出的单因子(回测标的:10年期国债期货主力合约)12 表6:筛选出的单因子(回测标的:10年期国开活跃券利率)12 表7:合成信号表现(回测标的:10年期国债期货主力合约)15 表8:合成信号表现(回测标的:10年国开活跃券利率)17 表9:合成信号表现(回测标的:长短久期指数轮动)19 表10:定期更新因子池策略表现(回测标的:10Y国开活跃券利率)21 表11:定期更新因子池策略表现(回测标的:长短久期指数)21 表12:反转因子的历次表现(1代表判断出行情的尾声)24 一、概要 近几年中国利率债市场发展较为迅速,以国债期货、各期限利率债活跃券等品种开始逐渐产生较多量价数据,这为量化择时策略提供了一定的基础。传统的利率择时策略更加侧重于从主观上对宏观基本面形成判断,而中短期的价格行为能否具有一定预测性,或者能否可以形成有稳健收益的中短期量化信号,仍然有待投资者去深入挖掘。 在前期的报告《活跃券的均线择时:——宏观固收量化研究系列之(六)》中,我们发现,无论是日频均线还是日内均线,简单的均线策略在10Y国开活跃券和10Y国债活跃券择时上具有一定效果。但是传统的技术指标仍有以下几个缺陷: 被动地应对行情,并未对市场进行预测和验证,因此胜率较低; 本质上是趋势跟踪,在拐点来到时反应较为迟钝; 如果是日频级别的技术分析,则极度依赖于市场状态,尤其在震荡市信号变换频率较大,会出现来回亏损的情况。 基于此出发点,本文尝试对利率择时策略进行更加细致的探索。本文寻找一些具有预测能力的时序特征(后文统称为时序因子1),并且使用线性回归的方法,对未来短期的利率市场形成预测,从而形成日频的策略信号,在此基础上对历史数据加以回测。 二、策略设计 前期的报告《活跃券的均线择时:——宏观固收量化研究系列之(六)》显示,基于价格信息能够在一定程度上捕捉到国开利率的动量效应,并有较好的回测效果,这说明过去的历史价格信息可以被利用于预测利率债市场。因此,通过分析市场历史的量价数据,对未来利率市场做出预测存在一定的可能。 在股票量化领域,学界和业界往往尝试寻找截面上的股票特征(因子),并最终对因子池进行合成(因子打分),从而挑选出具有较好预期收益的股票。本文尝试在样本内空间寻找时序上的有预测能力的因子,构建有效因子池,合成最终信号,并在样本内和样本外分别回测,评估信号效果。 本文的基本步骤为: 1)基于量价逻辑,构建较大的因子库; 2)每月末,对每个因子,往前取一段时间长度为L的样本以及对应的未来N日的收益率涨跌 (或未来N日的国债期货涨跌幅),做1次滚动线性回归预测: 以T时刻为例,我们得到因变量序列[𝑌𝑇−𝐿,𝑌𝑇−𝐿+1,…,𝑌𝑇−1,𝑌�]和自变量序列 [𝑋𝑇−𝐿−𝑁,𝑋𝑇−𝐿−𝑁+1,…,𝑋𝑇−𝑁−1,𝑋𝑇−𝑁],做如下回归 𝑌�=𝛽0+𝛽1𝑋𝑡−� 下一个月的每个收盘后,时刻记为𝑇̃,根据回归系数𝛽̂1和对未来N日的Y的预测值𝑌̂𝑇̃+�=𝛽̂0+ 𝛽̂1𝑋𝑇̃,做如下判定: 1注意,这里的因子并非是股票多因子模型中的截面特征,而是时间序列维度上的特征。 若𝛽̂1不显著,则生成空仓信号 若𝛽̂1显著且𝑌̂𝑇̃+�>0,则意味着当前X预测未来利率上行,则生成看空信号(若Y是未来N日的国债期货涨跌幅,则生成看多信号) 若𝛽̂1显著且𝑌̂𝑇̃+�>0,则意味着当前X预测未来利率下行,则生成看多信号(若Y是未来N日的国债期货涨跌幅,则生成看空信号) 按照这样的逻辑,我们最终可以得到样本内区间所有因子每天的信号; 3)根据生成的多空信号,在样本内区间生成每个因子的净值曲线,具体回测设置见下文,并计算各评价指标; 4)选出样本内区间表现较好的因子,并做简单降维,剔除相关性高的因子,形成最终的因子池; 5)根据不同的方式对因子池中的因子合成信号,并在样本内和样本外区间测试合成信号的回测效果。 在线性回归估计步骤,一般使用OLS模型,因为在符合一定的假设条件下,OLS是最优线性无偏估计量(BLUE)。其中,有两个重要假设需要满足: 自变量X是外生的 自变量X是平稳时间序列 而在做时间序列回归时,尤其是金融变量的时间序列回归中,自变量往往不符合这些假定,从而导致估计出的参数偏误较大,且不稳定,因此本文参考Kostakisetal.(2015),采用IVX回归的来估计因子和未来收益率变化的关系。 Kostakisetal.(2015)扩展了Phillips(2009)使用工具变量(InstrumentalVariable)的参数估计方法(IVX),可以应对回归中的内生性问题,适用于几种常见持续性强度的时间序列(平稳序列、协整序列、近似协整序列、近似平稳序列),并且可以便捷的使用Wald统计量做假设检验。这种借用工具变量的回归方法在金融时间序列预测中普适性非常强,但代价是会降低估计量收敛于真实值的速度,作者通过Monte-Carlo模拟设定了工具变量的最优参数,使得收敛速度的下降仅从OLS估计量的𝑜(𝑛)降为𝑜(𝑛(1+0.95)/2),影响非常有限。在有限样本数量下,统计检验犯第一类错误的概率接近预先设置的置信度水平。 此外,由于在金融时序应用中,常常会遇到样本重叠的问题,比如用日频的自变量对未来N日的收益做回归,则相邻2天所用到样本的因变量会有N-1日的数据重叠,在回归过程中会出现对方差估计的偏误,影响回归的显著性和一致性,而IVX方法也修正了统计量的这种偏误,因此本文统一使用IVX方法来做单变量和多变量的回归与预测。 在单因子和最终合成的信号中,我们分别采用10年期国债期货主力合约、10Y国开活跃券利率和中债7-10年国开债指数作为回测标的,具体回测的设定如下图所示,数据均来自于Wind资讯: 表1:回测品种与回测设计 回测品种 10年期国债期货主力合约 10Y国开活跃券 中债7-10年国开债指数与1年以下国开债指数轮动 切券(切合约) 换仓日卖出老合约,买入新合约 换券日卖出老券,买入新券 无 交易价格 次日开盘15分钟的VWAP 次日收盘中债YTM 次日指数中债估值 回测结果 净值曲线 累计赚得收益率(bps) 净值曲线 回测逻辑 初始资金100万,每次开1手,统计盈亏 每次做1手活跃券,统计累计赚得收益率 每日计算策略return,累计成净值曲线 交易成本 万分之1.5(3tick) 0.25BP 万二 信号对应的交易 看多做多,看空做空 看多做多,看空做空 看多做多,看空配短债指数 基准 多头,按时切换合约 多头,按时切券 等权持有2个指数 资料来源:东方证券研究所&Wind资讯 三、因子构建 本文的因子均来源于利率市场和国债期货市场的日度数据,以价格、利差、波动和成交量为主。在构建因子时,为了避免数据挖掘