期货研究 二〇二四年度 国泰君安期货研究所 2024年9月18日 因子与指数投资揭秘系列二十:构建规则型基本面择时因子 虞堪投资咨询从业资格号:Z0002804yukan010359@gtjas.com 高宇飞(联系人)从业资格号:F03124155gaoyufei028920@gtjas.com 报告导读: 在量化投资中,规则型的量价因子使用及其广泛。规则型因子是通过一定的数学模型和算法,根据历史数据人为设定的交易规则或策略,从而帮助投资者进行决策。它的优点在于使用相对灵活,可以将投资者的择时想法充分融入因子中。 本文首先介绍了几种常见的规则型因子,如移动平均线(MA)、双均线策略、通道信号策略和其他一些技术指标因子。我们总结归类了它们构造的原理及一般性步骤。然后,文章探讨了如何仿照构建规则型的基本面因子。首先是构造规则型的单因子,它的构造方式较为简单直接,可以直接套用规则型量价因子的构造方式,仅将数据源替换成对应的基本面数据。我们举例分别用布林带和分位数的计算方法构建了库存因子。 接下来,本文分析了如何构造更为复杂的基本面因子,以增强择时能力。一个复杂的规则型基本面因子可以看成由多个单因子,经过一些规则组合而成。它既可以从基本面上下游链条的传导逻辑进行解释,也可以从量化分析中因子组合的角度进行解释。 最后,本文分别以PTA的库存-利润因子组合和纯碱的库存-基差因子组合为例,展示了规则型基本面因子的实际应用。组合后的规则型因子较单因子有更强的择时能力。我们同时对比了它们的开仓点位分布,组合后的规则型因子对于开仓要求更苛刻,空仓的时间段增加,在出现较大波动的行情时风险控制做的更好。总的来说,构造规则型基本面量化因子可以更好地将基本面择时的逻辑体现出来,但也需要注意避免参数选择较为随意而产生过拟合的风险。 风险提示:注意政策、地缘政治、突发事件等非量化因素的扰动。因子的构建基于历史数据和统计规律,在未来可能会有失效风险。 (正文) 1.CTA策略中常见规则型因子综述 在量化投资中,不管是权益还是商品市场,规则型因子都是较为常见使用的因子类型。它是通过一定的数学模型和算法,根据历史数据设定的交易规则或策略。这种因子可以对市场的走势进行预测,帮助投资者进行决策。由于择时点或进场的规则是人为设定的,因此使用上较为灵活,也往往可以带来一定的超额收益。我们接下来介绍几种常见的规则型因子: 1.1移动平均线(MA) 移动平均线是构造最为基础的因子之一。它的计算方式是求某一个价格序列在过去N个周期的平均值,这里N个周期可以是过去N日,也可以是过去N分钟。我们也可以认为它是一种加权平均,过去N个值每个权重都是1/N。在此基础上,可以赋予过去N个值不同的权重,使得近期的数据权重更大,例如指数移动平均线(EMA)。这些不同的移动平均线,反映了价格在过去一段时间的趋势,是趋势策略的重要组成部分。 图1:纯碱合约收盘价和60日移动平均线,移动均线反映了其过去3个月的大致走势 资料来源:国泰君安期货研究、同花顺 1.2双均线策略 在移动均线的基础上,我们可以构造简单的双均线突破的择时策略。规则设定如下: 1.分别计算一条短周期均线值,和一条长周期均线值。 2.当短周期均线向上穿过长周期均线,是择时买入的信号(也称“黄金交叉”) 3.当短周期均线向下穿过长周期均线,是择时卖出的信号(也称“死亡交叉”) 短周期可以选如3日、5日、10日等,长周期可选稍长一点的参数,例如20日,60日等,这样我们就构造了一个简单的双均线择时的因子。 图2:纯碱合约收盘价和10日,60日移动平均线,有多个择时点 资料来源:国泰君安期货研究、同花顺 异同移动平均线(MACD)指标可以看作双均线策略的一个简单应用。它的主要构造方式是构造一条短周期的指数移动平均线(EMA,周期通常为12),以及一条长周期的指数移动平均线(周期通常为26)。二者的差值称为离差值(DIF),我们最后再计算DIF的指数移动平均线(周期通常为9),称为DEA值。其择时原则是: 1.DIF、DEA均为正,DIF向上突破DEA,是做多信号。 2.DIF、DEA均为负,DIF向下跌破DEA,是做空信号。 1.3通道信号策略 常见的通道策略通常由上下两根轨道组成。分别称之为价格的压力位和支撑位。当中间线突破上轨道,则认为是买入择时的信号,而当中间线突破下轨道,则认为是卖出择时的信号。例如常见的布林带通道,其构造和择时方式可以分为以下几个步骤: 1.计算中间线为N日价格的移动平均线。 2.计算上下轨分别为中间线加(减)a倍N日移动平均价的标准差(a通常取2)。 3.择时信号为,当中间线向上穿过上轨,则代表择时买入(做多)信号;当中间线向下穿过下轨,则代表卖出(做空)信号。 图3:纯碱20日移动均线与布林带通道上中下轨 资料来源:国泰君安期货研究、同花顺 唐奇安通道是另一种常见的通道信号策略,它的计算也相对简单,择时信号直观清晰。具体的构造方式如下: 1.计算上轨道为过去N日最高价的最大值,即过去N日成交价格的最大值。 2.计算下轨道为过去N日最低价的最小值,即过去N日成交价格的最大值。 3.择时信号为,当价格线向上穿过上轨,则代表择时买入(做多)信号;当价格线向下穿过下轨,则代表卖出(做空)信号。 唐奇安通道在设置止损策略时也非常简单,当在突破上轨做多时,止损点可以设置在下轨处;在突破下轨做空时,止损点可以设置在上轨处。 图4:纯碱每日收盘价与唐奇安通道 资料来源:国泰君安期货研究、同花顺 1.4其他技术指标因子 以上介绍的规则型因子,不少也可以归类为技术指标类因子。我们再来看其他一些经常使用的技术指标因子,例如相对强弱指标(RSI)。它是通过比较一段时期内的平均收盘涨幅和平均收盘跌幅来分析市场多空头的意向和实力。计算出的RSI值,在0-100之间,高于50为强势市场,反之为弱势市场。当RSI值在80以上时,代表有超买现象,超过90时,代表超买现象严重,未来可能出现反转下跌,此时对应做空操作。相对应地,当RSI值在20以下时,代表有超卖现象,低于10时,代表超卖现象严重,未来可能出现反弹上涨,此时对应做多操作。 同时,长短周期的RSI指标也可以像双均线一样,构造择时突破策略。当短周期的RSI线向上突破长周期RSI线时,是择时做多的信号(黄金交叉);当短周期RSI线向下跌穿长周期RSI线时,是择时做空的信号(死亡交叉)。类似的用于分析市场超买(超卖)情况的指标还有威廉指标(WR)。 关于技术指标的因子还有很多,我们在《因子与指数投资揭秘系列七:常见技术指标在商品指数上的择时效果》一文已经有较为详细的介绍了。由于并不是本文讨论的重点,故不在此进行一一列举。我们重点讨论在商品期货的基本面量化中,如何借鉴这些规则型因子的构造方式,进行择时操作。 2.规则型基本面因子的构建 在前文中,我们介绍了一些常见的量价规则型因子的构造方式。对于他们的择时方式,我们可以简单将其总结成以下几点: 1.若信号满足条件A,则进行做多(买入)操作; 2.若信号满足条件B,则进行做空(卖出)操作; 3.在其他情况下,继续持有之前的仓位,或空仓操作。 关于条件A和B的构建方式,主要有1.均线或其他价格线的上穿、下跌;2.构造压力位和支撑位的通道信号策略;3.计算指标的具体数值,看其所在区间(例如RSI指标)等方式。 我们仿照量价规则型因子的构造方式,亦可以构造规则型的基本面因子。例如库存作为最为重要的基本面数据,一般认为,当商品累库时,价格可能承压下跌;当商品库存连续去化时,价格可能反弹。基于此,我们可以构造库存的布林带因子,其择时规则如下: 1.以库存的N日均线作为中轨,N日均线加减a个标准差为上下轨。这里a和N根据不同的商品品种可以有不同的选择,也可以经过调参后,根据开仓频率选择合适的a。 2.当库存值突破上轨,此时认为累库较多,适合开仓做空;反之如果库存值跌破下轨,此时认为去库较多,适合开仓做多。 3.当库存值处在两轨之间,我们认为库存在合理范围,无明显驱动,空仓或平已有仓位。对于像基差、仓单等逻辑较为清晰的基本面因子,也可以采用如上的构造方式。 另一种方式是仿照RSI因子的构建方式,将库存数值转化为0-100的数值,看其目前所处的位置。例如库存所处的分位数,具体择时思路如下: 1.选择过去N日为考察时间窗口,求出当前库存值所处的分位数。 2.当库存值超过某个值a(例如90分位数),认为目前累库较多,适合开仓做空;反之如果库存值跌破某个分位数b(例如10分位数),认为目前去库较多,适合开仓做多。这里参数a、b和N可以根据不同的商品品种有不同的选择,也可以经过调参后,根据开仓频率选择合适的值。 3.当库存分位数处在a和b之间,我们认为库存在合理的范围,无明显驱动,空仓或平已有仓位。 除了以上的两种构建方式,还有其他的基本面规则型因子的构造方式,投资者可以根据自己喜好设置不同的开平仓判断方式和条件,构造方式较为灵活。 3.规则型基本面因子的组合,以两因子为例 3.1因子构建的逻辑分析 在现实中,使用单因子进行择时往往效果不佳。以库存为例,我们建模时通常简单地认为库存对于价格是负向的影响,但其实它也会受到各种其他因素的影响。如果我们同时考虑利润,从逻辑上进行分析,当下游产品利润足够大,对于原材料的需求较为旺盛,此时库存是正常去化的一个过程,因此下游利润大,库存减少,价格升高。另一方面,若下游产品的利润较小,上游原材料的生产商也可能被动去库存,此时因下游利润不足,价格承压。 需要注意的一点是,上中游产品的加工利润和下游的加工利润逻辑往往相反,当上中游产品的加工利润较大,此时供给增加,价格承压;反之当上中游产品的加工利润较小时,此时供给减少,价格有可能反弹。 我们再来看基差的大小对于库存因子的影响。当基差过大,此时现货价格远高于期货价格,边际库存去化,抛出更多的现货,有助于基差收敛,现货承压而期货价格看涨。反过来,若现货价格远低于期货价格,此时累库,流通的现货商品变少,则现货价格反弹而期货价格承压。 综上所述,我们不难发现,可以按照如下的逻辑来构造规则型基本面的两因子: 1.按照第二节所述的规则型单因子构建的方式,分别明确因子a和因子b的做多或做空条件(阈值),且在此条件下回测有一定的择时效果。 2.当a和b同时满足其开仓做多的条件时,我们择时做多;当a和b同时满足其开仓做空的条件时,我们择时做空。 3.在其余条件下均保持空仓或平已有仓位。 4.组合后的规则型多因子,应该比单因子有更强的择时能力。 上面是从基本面逻辑的分析角度出发,对于构造规则型基本面两因子进行的分析。事实上,我们也可以从量化的角度进行分析。可以把这个两因子模型视为多因子打分模型的简化版,我们在之前的系列报告中也介绍过这类模型。在这类模型中,只有超过一半的单因子给出做多(或做空)的信号时,我们才选择开仓做多(或做空)。对于只有两个因子的模型来说,只有它们都给出做多(做空)信号时,我们才会去做多(或做空),其他时间处于空仓状态。 3.2库存-利润因子组合示例,以PTA为例 我们以PTA的工厂库存和加工利润因子为例,分别测算其单因子的绩效,然后再测算按上述组合方法的组合因子的绩效。可以发现,组合后因子的绩效较单因子均有所提升。 图5:聚酯工厂PTA库存与价格走势图6:库存单因子回测效果,2019年至今夏普0.85,卡 玛0.7 资料来源:国泰君安期货研究、忠朴资料来源:国泰君安期货研究、忠朴 图7:PTA加工利润与价格走势图8:加工利润单因子回测结果,2019年至今夏普0.92,卡玛0.79 资料来源:国泰君安期货研究资料来源:国泰君安期货研究 图9:库存-加工利润合成规则型因子,2019年至今夏普1.2,卡玛1.07 资料来源:国泰君安期货研究 我们再来看择时点分布的情况。单一因子择时开仓频率相对较高,跟踪误差较