债券研究/2025.04.05 债市择时多因子模型设计:从线性模型到深度学习唐元懋(分析师) 021-38676666 债券研 究 专题研 究 证券研究报 告 债市量化系列之四 本报告导读: 基于模块化思路,本文关注量化模型设计,利用0-1框架预测债市涨跌,实验了多种线性和非线性模型的预测效力,GRU和MCMC模型表现较佳。 投资要点: 多因子模型是债市量化的重要手段,其中多因子的组合方法、模型选择和配套策略是决定模型有效性的主要因素。当前,随着机器学习技术的发展,数理模型可以高效的捕捉和挖掘经济金融数据之间的复杂关系,用模型预测补充主观增厚固收类资产收益。我们的研究采取模块化的思路,构建了如下模块流程:基于因子挖掘(基于 T合约价格的“四碗面”构建高频因子数据库)→模型设计(本文 重点)→持仓分配的多因子模型搭建框架(将分类模型预测的概率值映射到多空仓位上)。 本文主要关注模型设计,我们考虑对国债期货涨跌的相对预测而非绝对点位预测,即量化框架使用0-1分类模型对国债期货的涨跌方向进行预测。根据优化思路和参数估计方式的不同,我们尝试了多 种线性-非线性的模型进行预测。Logistic模型为基准,尝试了不同的参数估计和模型结构衍生出的其他的解决方案:对于参数估计,我们尝试了最小二乘估计和贝叶斯的估计方法;对于线性模型,我们探索了Logistic基准模型和MCMC-Logistic模型,对于非线性模型,我们探索了随机森林和多种深度学习模型(包括MLP、RNN和GRU)进行实验,分类研究模型效率和表现。 从测试结果看,GRU以79.13%的整体胜率领先,同时其多头胜率 (83.10%)和空头胜率(74.39%)均为最高。MCMC作为一种贝叶斯方法,在整体胜率(68.62%)和多头胜率(71.54%)上表现仅次于GRU;模型多头胜率普遍比空头胜率高,例如Logistics的多头胜率68.15%,空头胜率仅为57.41%,这可能跟测试期长期内具 有一定的上涨偏向性有关(在样本期类利率整体上是震荡下行的);搭配多空全仓策略,从年化收益来看,GRU(19.07%)依旧排名第一,MLP(14.60%)和MCMC(15.26%)紧随其后,说明深度学习模型(GRU、MLP)和贝叶斯方法(MCMC)在金融市场中能够更有效地提取市场信号并转化为收益。从回撤、夏普比率和卡玛比率来看,GRU、MLP和MCMC在收益与风险控制之间的平衡性较好:回撤方面,MLP(0.75%)和MCMC(0.93%)的最大回撤最低,夏普比率方面,MLP(19.41)和GRU(18.63)的夏普比率最高,说明它们在风险调整后的收益表现最佳。 测试的模型呈现两类分布态势,但都类似“V”形形态,极致信号的胜率较高。从胜率分布看,大部分模型给出的预测信号与预测胜率的关系也呈“V”字型,即预测给出的信号越极致胜率通常较高,仅 有SVM模型的胜率较为平均。故如果想提高胜率,可以考虑提高交易信号触发的门槛值,基于极致的概率条件进行决策,减少交易频率。也可以通过搭配atanh之类的策略使用反双曲正切函数来分配仓位,使得在信号极致时分配的仓位增量更多,提升策略盈亏比 风险提示:历史数据的分布与未来不同,量化模型效率衰减,极端 行情波动 登记编号S0880524040002 目录 1.前期因子准备和筛选4 2.多因子模型设计:二值选择为基础,从线性开始4 2.1.分类模型概述4 2.2.基准形式:Logistic回归5 2.3.引入马尔科夫链:MCMC-Logistic回归6 3.模型扩展:机器学习和非线性方法7 3.1.支持向量机模型7 3.2.随机森林模型7 3.3.MLP模型8 3.4.RNN和GRU模型9 4.模型结果:非线性模型最佳,信号和胜率发出分布呈“V”形10 4.1.模型胜率:GRU和MCMC表现较佳10 4.2.模型信号和胜率分布:多呈“V”形态10 4.3.搭配多空全仓策略回测:GRU、MLP和MCMC平衡性较佳11 5.风险提示12 多因子模型是债市量化的重要手段,其中多因子的组合方法、模型选择和配套策略是决定模型有效性的主要因素。当前,随着机器学习技术的发展,数理模型可以高效的捕捉和挖掘经济金融数据之间的复杂关系,用模型补 充主观决策增厚固收类资产收益。 基于此,本框架报告采取模块化的思路,我们构建了基于如下流程的择时流程:因子挖掘(基于T合约价格的“四碗面”构建高频因子数据库)→模型设计(本文重点)→持仓分配的多因子模型搭建框架(将分类模型预测的概率值映射到多空仓位上)。 本报告主要关注因子的组合,而底层因子的挖掘和处理,以及持仓分配可参考《让技术因子更有效:“场景化”与精准适配》等系列报告。不同类型因子和配套持仓策略皆可以应用本文中的多因子组合方法。 本文主要关注模型设计,我们考虑对国债期货涨跌的相对预测而非绝对点位预测,即量化框架使用0-1分类模型对国债期货的涨跌方向进行预测。根据优化思路和参数估计方式的不同,我们尝试了多种线性-非线性的模型进行预测。以Logistic模型为基准,尝试了不同的参数估计和模型结构衍生出的其他的解决方案:对于参数估计,我们尝试了最小二乘估计和贝叶斯的估 计方法;对于线性模型,我们探索了Logistic基准模型和MCMC-Logistic模型,对于非线性模型,我们探索了随机森林和多种深度学习模型(包括MLP、RNN和GRU)进行实验,分类研究模型效率和表现。 资产特征数据 T合约涨跌 数据预处理 1.因子数据集 线性框架 非线性框架 预测 T合约价格 2.模型 影响因素 LogisticsRegression SVM RF MCMC-Logistics MLP GRU 技术面因子池 基本面因子池 资金面因子池 情绪面因子池 技术指标利差图谱宏观经济资金预期市场情绪机构行为因子池因子池因子池因子池因子池因子池 预测概率 通过相关系数在每个因子 池挑选15个因子 单一策略 聚合策略 通过胜率和IC值在每个新因子池挑选5个因子 线性 Sigmoid 滚动收益动量加权 3.策略 正态 Atanh 均值方差优化加权 回测评估 图1:模块化的多因子指标的构建思路 数据来源:国泰海通证券研究 从测试结果看,GRU以79.13%的整体胜率领先,同时其多头胜率(83.10%)和空头胜率(74.39%)均为最高。MCMC作为一种贝叶斯方法,在整体胜率(68.62%)和多头胜率(71.54%)上表现仅次于GRU;模型多头胜率普 遍比空头胜率高,例如Logistics的多头胜率68.15%,空头胜率仅为57.41%,这可能跟测试期长期内具有一定的上涨偏向性有关(在样本期类利率整体 上是震荡下行的)。 搭配多空全仓策略,从年化收益来看,GRU(19.07%)依旧排名第一,MLP (14.60%)和MCMC(15.26%)紧随其后,说明深度学习模型(GRU、MLP)和贝叶斯方法(MCMC)在金融市场中能够更有效地提取市场信号并转化为收益。从回撤、夏普比率和卡玛比率来看,GRU、MLP和MCMC在收益与风险控制之间的平衡性较好:回撤方面,MLP(0.75%)和MCMC(0.93%)的最大回撤最低,卡玛比率方面,MLP(19.41)和GRU(18.63)的卡玛比率最高,说明它们在风险调整后的收益表现最佳。 测试的模型呈现两类分布态势,但都类似“V”形形态。从胜率分布看,大部分模型给出的预测信号与预测胜率的关系也呈“V”字型,即预测给出的信号越极致胜率通常较高,仅有SVM模型的胜率较为平均。故如果想提高胜率,可以考虑提高交易信号触发的门槛值,基于极致的概率条件进行决策, 减少交易频率。也可以通过搭配atanh之类的策略使用反双曲正切函数来分配仓位,使得在信号极致时分配的仓位增量更多,提升策略盈亏比。 1.前期因子准备和筛选 因子来源和挖掘时间区间:本部分仅为简单的示例,未根据因子特征做深度筛选。考虑经济显著性和统计显著性的有机统一,我们从T合约价格的“四碗面”出发,扩充为六个大类数据库(即技术指标、利差图谱、宏观经 济、资金预期、市场情绪、机构行为)搜集数据进行汇总,分别有118、234、20、221、28、121个指标。数据时间区间为2020年1月2日至2023年12 月31日,其中训练集:2020年1月2日至2022年10月16日;验证集: 2022年10月17日至2023年5月27日;测试集:2024年5月28日至2023 年12月31日。 因子筛选和指标合成流程:第一步是将大类因子池中的高频因子与T合约价格进行相关性分析,分别筛选出15个高频因子,并确定相关性符号和高 频因子信号;第二步是将每5个高频因子等权构建出一个待选指标,然后在 每个大类内迭代出6个待选指标进入该大类的待选指标池;第三步是将6个 大类待选指标池中的6个待选指标进行联合迭代,以每个大类中在共同预测 时二级排序最优的待选指标作为对应的大类指标,最终将得到的6个大类指标等权组合得到高频预测指标。 细节处理和要点:以简单实用为主要目标,在指标选择时,考虑常见的债市“四碗面”框架,理论基础较充足;在大类内及大类间进行两步优选,节省算力;样本内切分验证集,有效仿制过拟合;构建了稳健性测试,增加指标 评估及选择的手段;样本内外效果相关性高,数据集可靠性强。 2.多因子模型设计:二值选择为基础,从线性开始 2.1.分类模型概述 实践中多因子模型一般对价格、收益率的点位预测误差较大,而对0-1涨跌 预测的精度更高,我们的量化框架使用0-1分类模型对国债期货的涨跌进行预测。根据优化思路和参数估计方式的不同,我们尝试了多种线性-非线性 的模型进行预测,其中GRU模型胜率最高,2022-2024年累积胜率达到79%。 在实验设计中,我们采用滚动预测的思路,将前120天的多因子数据套入模型预测下一期的买卖信号。这种方式可以确保模型实时更新,以适应市场变 化,提高预测的准确性和有效性。滚动预测使得模型能动态捕捉因子间的关系,优化交易信号的及时性和可靠性,有助于提升策略的稳定性。 图2:模型数据的滚动窗口示意 数据来源:国泰海通证券研究 对于国债期货的价格涨跌方向预测,可以简单联想为对国债期货的未来价格进行线性回归预测,当预测价格高于当期价格为上涨,反之为下跌。但是这样的线性预测目标值的值域为(−∞,+∞),胜率表现和后续决策都不尽如 人意,因此我们倾向于将线性模型代入sigmoid函数进行映射求解,更精确的模拟价格涨跌的概率: 1 𝑠𝑖𝑔𝑚𝑜𝑖�=1+𝑒−� 其中,我们以最经典的分类模型——Logistic模型为基准,尝试了不同的参数估计和模型结构衍生出的其他的解决方案:对于参数估计,我们尝试了最小二乘估计和贝叶斯的估计方法;对于线性模型,我们探索了Logistic基准模型和MCMC-Logistic模型,对于非线性模型,我们探索了随机森林和多种深度学习模型(包括MLP、RNN和GRU)进行实验。分类研究模型效率和表现。 2.2.基准形式:Logistic回归 最经典的分类模型为逻辑回归模型,即使用线性回归模型代入sigmoid模型进行拟合预测,将国债期货的价格预测转化为价格涨跌的概率预测。模型构造先来自线性部分: �=𝑤0+𝑤1𝑥1+𝑤2𝑥2+⋯+𝑤�𝑥� 其中:𝑤0为截距项(Intercept),𝑤1,𝑤2,…,𝑤�为多因子𝑥1,𝑥2,…,𝑥�对应的权重系数,该方程为国债期货的价格预测表达式。 逻辑函数与分类方式:将价格预测的输出值输入到缩放函数中,可以将没有 界限的值域缩放到概率空间中: 1 ℎ(𝑧)=1+𝑒−� 该函数将线性输出�映射到(0,1)的区间,即将价格转化为涨跌概率。 1 𝑃(�=1|𝑋)=ℎ(𝑧)=1+𝑒−(𝑤0+𝑤1𝑥1+⋯+𝑤𝑛𝑥𝑛) 其中𝑃(�=1|𝑋)代表给定输入因子�时,国债期货上涨的概率。 ̂1,𝑃(�=1