专题报告-基本面量化 从因果涌现的视角挖掘择时模型 报告日期:2023年9月13日 章顺资深分析师(金融工程) 从业资格号:F0301166 投资咨询号:Z0011689 Tel:8621-63325888-3902 ★摘要: 在《多元资产之间的因果分析》等报告中,我们通过因果关系的变化来构建量化模型。为了捕捉系统状态的变化,研究的重点转向因果涌现,因果涌现发生时,系统在宏观尺度能够展现出比它的微观尺度更强的因果特性,利用这一特性,我们分别构建了上证指数、中债10年国债、布伦特原油、黄金和美元指数的择时模型,具体实证的情况如下: 1)日度级别的时间序列通过粗粒化实现微观尺度到宏观尺度的转变,粗粒化后生成网络图,依据网络图计算有效信息(EI)指标以及资产价格的均线序列,设定进出场规则; 2)复杂网络的一般研究方法是分析动力学拓扑性质,我们选取平均最短路径长度这个指标安排对照测试,对比因果涌现建模的结果,EI指标整体表现优于复杂网络分析方法中的平均最短路径长度这一指标; 3)上证指数在EI择时模型的测试中均获得了正收益且测试胜率最高达53%,中债10年国债的EI择时模型在斜率参数为144时皆获得了累计正收益且胜率达到67%,布伦特原油的EI择时模型在斜率参数为89时胜率最高达56%且累计盈利超过其他情形,黄金的EI择时模型在斜率参数为89时累计正收益高于其他的情形且最高胜率可达57%,美元指数的基于平均最短路径长度的择时模型在斜率参数为144时净值表现明显优于EI模型且最高胜率达64%。 我们在测试的过程中尝试了一些新的方法,比如粗粒化的方法将时间序列符号化,以及生成网络图,这些方法在复杂系统的研究中很常见,但在金融领域应用较少。在金融市场是个复杂系统的假设前提下,我们将继续借鉴复杂系统的方法论探究金融市场中的典型问题。 Email:shun.zhang@orientfutures.com 期货综合 重要事项:本报告版权归上海东证期货有限公司所有。未获得东证期货书面授权,任何人不得对本报告进行任何形式的发布、复制。本报告的信息均来源于公开资料,我公司对这些信息的准确性和完整性不作任何保证,也不保证所包含的信息和建议不会发生任何变更。我们已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,报告中的信息或意见并不构成交易建议,投资者据此做出的任何投资决策与本公司和作者无关。 有关分析师承诺,见本报告最后部分。并请阅读报告最后一页的免责声明。 目录 1、什么是因果涌现5 2、网络图的相关原理5 2.1、数据的粗粒化5 2.2、有效信息6 2.3、因果涌现8 2.4、网络的动力学拓扑性质9 3、基于涌现视角的择时模型实证9 3.1、数据及其粗粒化9 3.2、测试的流程及参数说明11 3.3、上证指数的实证测试结果11 3.4、中债10年期国债的实证测试结果15 3.5、布伦特原油主连的实证测试结果20 3.6、黄金的实证测试结果24 3.7、美元指数的实证测试结果28 4、结论及展望32 5、参考文献33 2期货研究报告 图表目录 图表1:数据明细10 图表2:数据粗粒化明细10 图表3:上证指数网络图局部10 图表4:上证指数的测试结果(EI参数144,斜率参数89)11 图表5:上证指数EI择时变盘点(指数交易,斜率89)12 图表6:上证指数EI择时累计盈亏(指数交易,斜率89)12 图表7:上证指数的测试结果(EI参数144,斜率参数144)12 图表8:上证指数EI择时变盘点(指数交易,斜率144)13 图表9:上证指数EI择时累计盈亏(指数交易,斜率144)13 图表10:上证指数的测试结果(拓扑参数144,斜率参数89)13 图表11:上证指数拓扑择时变盘点(指数交易,斜率89)14 图表12:上证指数拓扑择时累计盈亏(指数交易,斜率89)14 图表13:上证指数的测试结果(拓扑参数144,斜率参数144)14 图表14:上证指数拓扑择时变盘点(指数交易,斜率144)15 图表15:上证指数拓扑择时累计盈亏(指数交易,斜率144)15 图表16:中债10年国债的测试结果(EI参数144,斜率参数89)16 图表17:国债EI择时变盘点(资本利得,斜率89)16 图表18:国债EI择时累计盈亏(资本利得,斜率89)16 图表19:中债10年国债的测试结果(EI参数144,斜率参数144)17 图表20:国债EI择时变盘点(资本利得,斜率144)17 图表21:国债EI择时累计盈亏(资本利得,斜率144)17 图表22:中债10年国债的测试结果(拓扑参数144,斜率参数89)18 图表23:国债拓扑择时变盘点(资本利得,斜率89)18 图表24:国债拓扑择时累计盈亏(资本利得,斜率89)18 图表25:中债10年国债的测试结果(拓扑参数144,斜率参数144)19 图表26:国债拓扑择时变盘点(资本利得,斜率144)19 图表27:国债拓扑择时累计盈亏(资本利得,斜率144)19 图表28:布伦特原油主连的测试结果(EI参数144,斜率参数89)20 图表29:布伦特原油主连EI择时变盘点(指数交易,斜率89)20 图表30:布伦特原油主连EI择时累计盈亏(指数交易,斜率89)21 图表31:布伦特原油主连的测试结果(EI参数144,斜率参数144)21 图表32:布伦特原油主连EI择时变盘点(指数交易,斜率144)21 图表33:布伦特原油主连EI择时累计盈亏(指数交易,斜率144)22 图表34:布伦特原油主连的测试结果(拓扑参数144,斜率参数89)22 图表35:布伦特原油主连拓扑择时变盘点(指数交易,斜率89)22 图表36:布伦特原油主连拓扑择时累计盈亏(指数交易,斜率89)23 图表37:布伦特原油主连的测试结果(拓扑参数144,斜率参数144)23 图表38:布伦特原油主连拓扑择时变盘点(指数交易,斜率144)23 图表39:布伦特原油主连拓扑择时累计盈亏(指数交易,斜率144)24 图表40:黄金的测试结果(EI参数144,斜率参数89)24 图表41:黄金EI择时变盘点(指数交易,斜率89)25 图表42:黄金EI择时累计盈亏(指数交易,斜率89)25 图表43:黄金的测试结果(EI参数144,斜率参数144)25 图表44:黄金EI择时变盘点(指数交易,斜率144)26 图表45:黄金EI择时累计盈亏(指数交易,斜率144)26 图表46:黄金的测试结果(拓扑参数144,斜率参数89)26 图表47:黄金拓扑择时变盘点(指数交易,斜率89)27 图表48:黄金拓扑择时累计盈亏(指数交易,斜率89)27 图表49:黄金的测试结果(拓扑参数144,斜率参数144)27 图表50:黄金拓扑择时变盘点(指数交易,斜率144)28 图表51:黄金拓扑择时累计盈亏(指数交易,斜率144)28 图表52:美元指数的测试结果(EI参数144,斜率参数89)28 图表53:美元指数EI择时变盘点(指数交易,斜率89)29 图表54:美元指数EI择时累计盈亏(指数交易,斜率89)29 图表55:美元指数的测试结果(EI参数144,斜率参数144)29 图表56:美元指数EI择时变盘点(指数交易,斜率144)30 图表57:美元指数EI择时累计盈亏(指数交易,斜率144)30 图表58:美元指数的测试结果(拓扑参数144,斜率参数89)30 图表59:美元指数拓扑择时变盘点(指数交易,斜率89)31 图表60:美元指数拓扑择时累计盈亏(指数交易,斜率89)31 图表61:美元指数的测试结果(拓扑参数144,斜率参数144)31 图表62:美元指数拓扑择时变盘点(指数交易,斜率144)32 图表63:美元指数拓扑择时累计盈亏(指数交易,斜率144)32 1、什么是因果涌现 涌现的概念至少在亚里士多德时代就已经存在了。许多科学家和哲学家写过关于这个概念的文章,其中包括约翰·斯图尔特·密尔和朱利安·赫胥黎。从蚁群、蜂群到人类社会的行为,涌现是普遍的。涌现是在宏观尺度下出现的一种模式,正如由云朵、水汽构成的图形,这些图形是一个新型的整体并具有新的特性,而这种特性我们无法从小水滴和水汽尺度上得到,只有当我们将其看成一个整体时才能出现。 1999年,经济学家杰弗里戈尔茨坦在《Emergence》杂志上提出了现有的对“涌现”的 定义。戈尔茨坦最初将涌现定义为“:在复杂系统自组织过程中产生的新颖而连贯的结构、 模式和性质”。2002年,系统科学家彼得·康宁更详细地描述了戈尔茨坦的定义,共同的特征有:(1)根本的新颖性;(2)连贯性或相关性;(3)全局或宏观的“层次”;(4)它是动力学过程的产物;(5)可以被感知。 克拉奇菲尔德认为任何系统的复杂性和组织性都是由观察者主观所决定的。彼得·康宁认为:“难道协同作用必须被感知或者观察,才能像某些理论家所说的那样,被称为涌现效应吗?很明显不是。与涌现相关的协同效应是真实的、可衡量的,即使没有人在那里观察它们。”目前还不清楚是什么使一些系统成为真正的涌现系统,大多数赞成涌现的论点都是定性的。 ErikHoel提出“因果涌现”的概念,在微观和宏观时空尺度上构建系统的因果模型,并使用一般的因果关系度量来衡量其因果有效性。当一个系统在宏观尺度能够展现出比它的微观尺度更强的因果特性,那么,这就发生了因果涌现(CausalEmergence)。 自然界中,对事物的尺度进行宏观和微观划分是很常见,金融市场中宏观和微观是高频词汇,因果涌现在金融市场上也是普遍的,比如市场逻辑的变化,特别是宏观趋势的变化。在《从因果关系探究期股联动的模式》中,实证测试部分可以观察到期货和股票因果关系的变化,这种因果关系的变化可能就是因果涌现的表现。借鉴ErikHoel的因果涌现理论,宏观尺度的因果特性更强,我们接下来将利用粗粒化后的数据表征宏观特性,通过有效信息捕捉涌现的时点,以涌现的时点来确定变盘点,测试择时的效果。 2、网络图的相关原理 我们在《多元资产之间的因果分析》和《基于因果模型发现领先与同步关系》等报告中针对因果模型进行大量的实证研究,因果模型离不开网络图,网络图可以为复杂网络的分析提供便利,相关的算法层出不穷,这里主要介绍因果涌现以及网络拓扑的相关原理。 2.1、数据的粗粒化 传统的因果发现往往只在一个层级,用数据驱动的方式去发现不同主体、不同节点、不同变量之间的因果关系,而有了粗粒化操作后,我们便可以在宏观态下发现因果联系,从而实现不同尺度乃至跨尺度的因果发现。 郝柏林在《复杂性的刻画与“复杂性科学”》中提出可以通过符号动力学建立运动轨道和形式语言的联系,然后借助语法复杂性理论来刻画复杂性,其核心内容就是符号动力学与时间序列的粗粒化,不同程度的粗粒化,舍去更小尺度上的细节,使它们在所关注的尺度中表现出本质的特征。利用复杂网络来研究经济系统、气候系统等复杂系统已经有相关的研究。 对复杂性的描述经常伴随着对系统的粗粒化。例如,构成DNA核苷酸分子用四种符号来表示,对事物进行评价时会区分“优秀”、“良好”、“一般”、“不合格”。粗粒化常用的方法是对系统区间进行同质划分,将整个区间平均分成有限个子区间。如果对划分后的每个子区间赋予一个符号,则整个系统区间就转换为一个符号序列。由于粗粒化过程舍去了小尺度上的细节,宏观属性增强。 我们在粗粒化的过程主要针对单一时间序列,粗粒化之后的时间序列可以构建一个网络图。资产价格的序列直接粗粒化并不适宜,资产的涨跌幅是进行粗粒化的良好对象。 令资产价格的序列为P,资产涨跌幅的序列为Pct,当涨跌幅Pct大于或等于0记为“U”,反之记为“D”。我们在后面的实证部分针对各类资产的粗粒化操作皆是如此。除了资产涨跌幅的符号化处理,要形成网络图,还需要确定网络节点,网络节点与时间尺度有关,选择五个交易日作为一个窗口,那么节点可以根据五个交易日的涨跌幅状态确定,如“UUUDDU”就是五个交易日形成的网络节点。网络节点