深度报告-金融工程 市场广度指标在股指择时与轮动中的线性与非线性应用 报告日期:2023年5月15日 ★主要思路和结论: 本文使用成分股技术指标构建了宽基指数的市场广度指标,尝试基于市场广度指标构建单指数择时和双指数轮动的策略。以2016-2020年作为训练集、2021年至今作为测试集,分 王冬黎金融工程首席分析师 从业资格号:F3032817投资咨询号:Z0014348 Tel:8621-63325888-3975 Email:dongli.wang@orientfutures.com 别基于F检验和Logistic模型、互信息和决策树模型构建了单指标线性和非线性的策略,结果表明,市场广度指标的线性预 联系人:常海晴 金融工程分析师 测能力有限,但非线性检验和模型则在样本内外表现较好;在单指数涨跌预测问题上,市场广度指标+决策树预测在样本外明显失效,但是对于判断两指数的相对强弱,样本外依然有效。 金★回测结果: 融在2021年至今的测试集上,等权配置训练集上的有效指标,工500-300指数多空轮动策略取得年化收益12.5%,夏普比2.78,程1000-50指数多空轮动策略取得年化收益13.3%,夏普比1.37, 500-300指数多空轮动策略取得年化收益13.2%,夏普比1.88,IC、IF跨品种套利上取得了年化收益13.6%、夏普2.90,IC、IH跨品种套利上取得了年化收益14.6%、夏普1.99。 ★不足与展望:. 在多指标合成问题上,本文对单指标的结果进行了等权合成,未考虑模型合成的方法,后续将考虑模型合成的问题,可以更多的利用变量间的交互信息;本文的目标变量设定仅考虑了二分类变量,后续将考虑比较目标变量设为分类变量、收益率的预测效果差异;另外策略的换手率较高,后续考虑使用更严谨的回测框架对策略表现进行检验。 ★风险提示 模型基于历史数据构建,未来市场规律的变动可能使模型失 从业资格号:F03087441 Tel:8621-63325888-4191 Email:haiqing.chang@orientfutures.com 效。 重要事项:本报告版权归上海东证期货有限公司所有。未获得东证期货书面授权,任何人不得对本报告进行任何形式的发布、复制。本报告的信息均来源于公开资料,我公司对这些信息的准确性和完整性不作任何保证,也不保证所包含的信息和建议不会发生任何变更。我们已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,报告中的信息或意见并不构成交易建议,投资者据此做出的任何投资决策与本公司和作者无关。 有关分析师承诺,见本报告最后部分。并请阅读报告最后一页的免责声明。 目录 1、研究背景6 1.1、市场广度指标6 1.2、技术指标6 2、市场广度指标应用思路与回测结果9 2.1、F检验11 2.2、Logistic回归13 2.3、互信息16 2.4、决策树18 3、总结与展望28 4、风险提示28 5、附录:技术指标计算方法汇总29 2期货研究报告 图表目录 图表1:1988-2004年95篇技术分析有效性研究汇总7 图表2:上证50指数经典反转指标回测净值7 图表3:上证50指数经典趋势指标回测净值7 图表4:沪深300指数经典反转指标回测净值8 图表5:沪深300指数经典趋势指标回测净值8 图表6:中证500指数经典反转指标回测净值8 图表7:中证500指数经典趋势指标回测净值8 图表8:中证1000指数经典反转指标回测净值8 图表9:中证1000指数经典趋势指标回测净值8 图表10:市场广度指标的计算流程与两个应用场景(日频数据)9 图表11:时序交叉验证窗口划分示意图10 图表12:两指数收益差F检验p值分布(自由流通市值加权)12 图表13:单指数涨跌F检验p值分布(自由流通市值加权)12 图表14:两指数收益差F检验p值分布(等权)12 图表15:单指数涨跌F检验p值分布(等权)12 图表16:训练集p值对应的训练集Logistic回测夏普均值14 图表17:训练集p值对应的测试集Logistic回测夏普均值14 图表18:上证50最优指标MESA_Adaptive_0.5_0.0514 图表19:沪深300最优指标STDS_40_14014 图表20:中证500最优指标ER_315 图表21:中证1000指数最优指标Quantile_(250,0.6)15 图表22:上证50指数最优指标MESA_Adaptive15 图表23:沪深300指数最优指标STDS_40_14015 图表24:500-300最优指标Chaikin_(50,60)15 图表25:500-50最优指标TRIX_(100,200,1)15 图表26:1000-50最优指标Chaikin_(10,80)16 图表27:信息熵图示16 图表28:两指数收益差(自由流通市值加权)17 图表29:单指数涨跌(自由流通市值加权)17 图表30:两指数收益差(等权)17 图表31:单指数涨跌(等权)17 图表32:训练集互信息对应的训练集决策树回测夏普均值19 图表33:训练集互信息对应的测试集决策树回测夏普均值19 图表34:两指数多空轮动训练集与测试集夏普比19 图表35:单指数择时训练集与测试集夏普比19 图表36:两指数多空轮动回测结果20 图表37:单指数择时回测结果20 图表38:上证50指数最优指标(多空)20 图表39:上证50指数最优指标(仅做多)20 图表40:沪深300指数最优指标(多空)20 图表41:沪深300指数最优指标(仅做多)20 图表42:中证500指数最优指标(多空)21 图表43:中证500指数最优指标(仅做多)21 图表44:中证1000指数最优指标(多空)21 图表45:中证1000指数最优指标(仅做多)21 图表46:500-300指数最优指标(多空)21 图表47:500-300指数最优指标(仅做多)21 图表48:500-50指数最优指标(多空)22 图表49:500-50指数最优指标(仅做多)22 图表50:1000-50指数最优指标(多空)22 图表51:1000-50指数最优指标(仅做多)22 图表52:上证50指数有效指标平均净值(多空)23 图表53:上证50指数有效指标平均净值(仅做多)23 图表54:沪深300指数有效指标平均净值(多空)23 图表55:沪深300指数有效指标平均净值(仅做多)23 图表56:中证500指数有效指标平均净值(多空)23 图表57:中证500指数有效指标平均净值(仅做多)23 图表58:中证1000指数有效指标平均净值(多空)24 图表59:中证1000指数有效指标平均净值(仅做多)24 图表60:500-300指数有效指标平均净值(多空)24 图表61:500-300指数有效指标平均净值(仅做多)24 图表62:500-50指数有效指标平均净值(多空)24 图表63:500-50指数有效指标平均净值(仅做多)24 图表64:1000-50指数有效指标平均净值(多空)25 图表65:1000-50指数有效指标平均净值(仅做多)25 图表66:两指数多空轮动策略回测结果25 图表67:IH有效指标平均净值(多空)26 图表68:IH有效指标平均净值(仅做多)26 图表69:IF有效指标平均净值(多空)26 图表70:IF有效指标平均净值(仅做多)26 图表71:IC有效指标平均净值(多空)26 图表72:IC有效指标平均净值(仅做多)26 图表73:IC-IF有效指标平均净值(多空)27 图表74:IC-IF有效指标平均净值(仅做多)27 图表75:IC-IH有效指标平均净值(多空)27 图表76:IC-IH有效指标平均净值(仅做多)27 1、研究背景 1.1、市场广度指标 市场广度指标(MarketBreath)又译为市场宽度指标、扩散指标等,通过计算处于上涨趋势和下跌趋势股票数量的差额,来衡量股票指数的趋势强度。市场广度指标被广泛运用于宽基指数的技术分析以及市场情绪分析中。常见的市场广度指标包括腾落指标ADL (上涨股票数量减去下跌股票数量)、高低差指标(创新高股票数量除以创新低股票数量)等。对于宽基指数而言,其走势是由成分股共同驱动的,直接计算宽基指数的技术指标并不能直接反映背后的交易情绪,而市场广度指标采用成分股的趋势合成计算,一方面可以提升度量宽基指数趋势的精细度,另一方面可以起到对收益率“降噪”的效果。本文的主要目的是探索宽基指数的市场广度指标在单指数择时和双指数轮动中的运用。 成分股的趋势度量可以用技术指标实现,因此市场广度指标可以与成分股的技术指标结合,从而衍生出无穷多指标。与成分股技术指标相结合后,市场广度指标一方面可以作为市场趋势性的衡量,另一方面与反转技术指标结合后也能够构成反转指标。市场广度指标并没有一个通用的定义,本文采用一个技术指标对应一个市场广度指标的计算方式,定义市场广度指标的计算方法如下: 1、对于👉�个技术指标,首先计算👉�个成分股在该技术指标的规则下的多空信号,包括1、-1和0三种; 2、计算所有成分股信号的加权平均作为市场广度指标。尝试两种加权方法:等权法和自由流通市值加权(等同于指数编制的成分股权重): ∑���∙����𝑎�� �𝑟�𝑎�ℎ�=�=1 � ∑�� �=1 其中,对于等权法,��=1;对于自由流通市值加权法,��等同于该成分股在指数编制中的权重。 1.2、技术指标 技术分析是使用过去的量价指标预测未来价格变动的分析方法,技术分析的有效性建立在市场无效性的基础上,而市场的有效性与技术指标的有效性均是备受争议的问题。虽然饱受争议,但技术指标不仅在业界有广泛运用,在学界亦有广泛讨论。ParkandIrwin(2004)对95篇有关技术指标的经典文献做了总结,其中有56篇表明技术分析有效, 20篇认为技术分析无效,19篇得出了中立结论;作者更近一步的指出,相比文献得出的结论,技术指标有效性的检验过程是尤其需要重视的,包括数据窥探偏差(DataSnooping)、对交易成本的估计等等。 图表1:1988-2004年95篇技术分析有效性研究汇总 研究方法类别 研究数量 代表性研究 标准 区别性特征 交易成本 风险调整 交易规则优化 样本外测试 统计检验 数据窥探解决 标准模型 24 Lukac等(1988) √ √ √ √ √ 进行参数优化和样本外测试 基于模型的bootstrap 21 Brock等(1992) √ √ 使用基于模型的bootstrapmethods进行统计测试。没有进行参数优化或样本外测试 真实性检验 3 Sullivan等(1999) √ √ √ √ √ 使用White(2000)的现实检验bootstrap方法进行交易规则优化和统计测试 遗传算法 11 Allen和Kaejalainen(1999) √ √ √ √ √ √ 利用遗传算法优化交易规则 非线性 9 Gencay(1998a) √ √ √ √ √ 使用最近邻和/或前馈网络回归生成交易 资料来源:ParkandIrwin(2004),东证衍生品研究院 技术指标有效性的检验和应用方法十分多元,90年代开始学界便开始了对遗传算法、非线性模型运用的讨论。科学严谨的检验回测框架是我们进行研究的基础,而创新性的运用是挖掘有效指标的关键。 总体上而言市场有效程度越高,技术分析的有效性越低。以国内A股为例,我们挑选了几个较为经典的趋势和反转指标在四个宽基指数上进行回测,回测得到的净值曲线如图2-9所示。趋势指标包括简单动量、双均线、MACD,反转指标包括布林带、连续涨跌天数、分位数。首先,技术指标择时可以跑赢原始指数的比例并不低,但是技术指标对参数的选择普遍较为敏感,不同参数下表现有较大差异,不同指数适用的最优参数也有显著差异;其次,2015年是许多技术指标失效的拐点,譬如布林带在2015年之前是一个表现比较好的策略,但2015年之后几乎完全失效,普