请仔细阅读在本报告尾部的重要法律声明 证券研究报告|金融工程专题报告 组合配置新思路 ——博弈论视角的风格与行业轮动 金融工程高级分析师:张立宁SACNO:S1120520070006金融工程首席分析师:杨国平SACNO:S1120520070002 2023年3月5日 1 博弈论基本概念 2 目录 非合作博弈与纳什均衡 3 合作博弈与Shapley值 4 实践—风格与行业轮动 1博弈论基本概念 •博弈论使用数学模型研究博弈参与者(或称决策者)之间的竞争与合作,博弈论可以应用于政治、经济、社会、生物等诸多领域。博弈论的研究目标是帮助参与者理性决策,以找到决策的最优解、达到收益最大化。 •每个博弈中要求至少有2个参与者,每个参与者至少有2个决策选项,参与者既可以是单个个体,也可以是单个个体形成的联盟。 •本文的研究对象不是投资者之间的博弈,因为投资者行为无法定量刻画;本文研究对象是证券之间、证券和市场之间的博弈,例如特定证券和组合希望在博弈中战胜市场。通过计算博弈参与者使用各种策略的概率,相应就得到了组合中的资产权重。 •接下来我们结合大盘成长、大盘价值、小盘成长、小盘价值4个风格轮动的具体投资问题,对博弈论基本概念做进一步说明。 博弈论基本概念 基本概念 解释 以风格轮动投资为例 参与者(player) 博弈的决策主体 合作博弈中,大盘风格、小盘风格是两个参与者,它们通过协作提升联盟的收益非合作博弈中,大盘风格与市场基准博弈,大盘风格希望战胜市场基准;同理小盘风格也会与市场基准进行博弈 策略(strategy) 参与者的行动规则 大盘风格和小盘风格各有两个策略:成长或价值,例如大盘风格可以使用大盘成长和大盘价值两种策略市场基准有三个策略:牛市、熊市、震荡市 信息(information) 参与者在博弈中的知识,特别是有关其他参与者的 如果市场基准知道大盘风格选择的策略,那么市场基准(有关大盘风格)的信息就是[成长]或[价值] 支付函数(payoff) 参与者从博弈中获得的收益或效用水平 假设大盘风格选择成长策略,市场基准选择牛市策略,此时大盘风格相对市场基准的超额收益/效用/其他度量 结果(outcome) 博弈参与者在某种策略组合下产生的结果 假设大盘风格选择成长,市场基准选择牛市,此时大盘风格的收益为1,市场基准的收益为-1,则(1,-1)就是一个结果 均衡 (equilibrium) 博弈达到的稳定状态,没有参与者愿意单独改变策略 具体可见下文对纳什均衡的介绍 合作博弈是指参与者结成联盟,争取联盟效用最大化,并在联盟内部进行分配。合作博 弈一般是非零和博弈。 根据不同的分类标准,可以将博弈论研究的博弈分为以下几个类型: •零和博弈(ZeroSumGame)VS非零和博弈(Non-ZeroSumGame) 零和博弈是指一个参与者的收益与其他参与者的损失(负收益)相等;而在非零和博弈中 ,全部参与者的收益之和并不等于0。 •静态博弈(SimultaneousGame)VS动态博弈(SequentialGame) 静态博弈是指各个参与者同时行动,事先不知道其他参与者的策略;动态博弈是指参与者采取的策略有先后顺序,可以事先知道其他参与者的行动。 •非合作博弈(Non-CooperativeGame)VS合作博弈(CooperativeGame) 非合作博弈是指参与者之间存在竞争关系,每个参与者独自决策,使得自身收益最大化 ,参与者相关之间没有达成协议(contract);通常所说的博弈一般是指非合作博弈。 博弈类型 按行动顺序 静态博弈 动态博弈 按收益来源 零和博弈 非零和博弈 博弈分类 按合作协议 合作博弈 非合作博弈 资料来源:华西证券研究所 •之所以能用博弈论解决投资组合问题,是因为两者有相似之处: 投资者希望自己选择的证券能够战胜市场基准。 在非合作博弈中,也可以将每个具体证券、市场基准看做参与者,证券希望在博弈中战胜市场基准,可将超额收益视为博弈的支付,这与相对收益投资相似。 投资者需要根据投资组合中各证券的贡献分配权重,以实现收益最大化。在合作博弈中,将多个具体证券看做参与者,证券之间结成联盟后,根据参与者贡献分配权重,以实现联盟的最大利益,这与绝对收益投资相似。 在非合作博弈的混合策略纳什均衡中,参与者选择具体策略的概率,与投 资中对具体证券权重的确定也有相似性。 2非合作博弈与纳什均衡 •纳什均衡 纳什均衡是非合作博弈中的核心概念。一个博弈中,如果在其他参与者策略确定的情况下,每一位参与者当前的策略都是最优的,参与者没有动机改变当前策略,这个策略组合就被称为纳什均衡(NashEquilibrium)。 •纳什均衡定义 对于�名参与者的博弈𝐺,记策略空间为𝑆1,𝑆2……,𝑆𝑛,参与者�的任一策略𝑠�∈𝑆𝑖,参与者�在博弈中的收益为𝑢�。则在博弈�=[𝑆1,𝑆2……,𝑆𝑛;𝑢1,𝑢2……,𝑢𝑛]中,由各个参与者 的各一个策略组成的某个策略组合 𝑠∗,…𝑠∗ 1 𝑖−1𝑖+1 ,𝑠∗ ,…𝑠∗ � 参与者策略组合 中,任意一名参与者�的策略都是对其余 𝑠∗,……𝑠∗ 1 � 的最佳对策,也即 𝒔∗,…,𝒔∗ � 𝒊−��𝒊+� ,𝒔∗,𝒔∗ ,…,𝒔∗ � 𝒖� ≥𝒖� (1) 𝒔∗,…,𝒔∗ � 𝒊−� ,�,𝒔∗ � 𝒊+� ,…,𝒔∗ � 𝑠∗,……𝑠∗ 1 � 对任意𝑠�∈𝑆�和任意参与者�都成立,则称 •纳什均衡的特点 为�的一个纳什均衡。 1.参与者知道对手的策略空间;2.纳什均衡仅说明参与者在他所掌握的信息下的最佳选 •纯策略纳什均衡 如果博弈的参与者只能选择一种策略,称为纯策略(PureStrategy),达到的纳什均衡就是纯策略纳什均衡。纯策略纳什均衡并不一定存在。 � 在式(1)中,当𝒔∗和𝒔�只表示单一策略时,就是纯策略纳什均衡。 •混合策略纳什均衡 如果博弈的参与者可以以某种概率分布随机地选择多个策略,称为混合策略(MixedStrategy),达到的纳什均衡就是混合策略纳什均衡。 𝒔∗,…,𝒔∗ � 𝒊−��𝒊+� ,𝒔∗,𝒔∗ ,…,𝒔∗ � 𝒔∗,…,𝒔∗ � 𝒊−� ,𝒔𝒊,𝒔∗ 𝒊+� ,…,𝒔∗ � 在式(1)中,如果参与者�不再只能选择单一策略𝑠�∈𝑆𝑖,而是可以在策略空间𝑆�中以概率分布σ�选择多个策略,并且 𝐸𝑠~�[𝒖� ]≥𝐸𝑠~𝜎[𝒖� ](2) � �表示数学期望,对任意𝑠�∈𝑆�和任意参与者�都成立,就是混合策略纳什均衡。此时𝒔∗ 和𝒔�不再表示单一策略,而是以概率分布同时出现的多个策略。 •在一个博弈中,有2个参与者:[𝑎,𝑏],策略空间为:[坦白,抗拒]。 •参与者𝑎,�的收益矩阵为如下, 参与者 参与者� 策略 坦白 抗拒 坦白 (3,3) (0,5) 抗拒 (5,0) (1,1) •这个博弈存在纯策略纳什均衡,纳什均衡点为𝑎,�均坦白,双方收益均为3。 •使用nashpy计算纳什均衡 rps=nashpy.Game(np.array([[-3,0],[-5,-1]]),np.array([[-3,-5],[0,-1]]))eqs=list(rps.support_enumeration()) 混合策略纳什均衡点计算结果:[[1,0],[1,0]] 纳什均衡状态下的两个参与者收益=rps[eqs[0][0],eqs[0][1]],结果:[-3,-3] •在一个博弈中,有2个参与者:[𝑎,𝑏],策略空间为:[石头,剪刀,布]。 •参与者�的收益矩阵为如下,记为A,参与者�的收益矩阵为-A 参与者 参与者� 策略 石头 剪刀 布 石头 0 1 -1 剪刀 -1 0 1 布 1 -1 0 •这个博弈不存在纯策略纳什均衡,因为收益为-1的一方总是能够改变策略以提高收益。但是这个博弈存在混合策略纳什均衡:参与者以各1/3的概率使用三种策略。 •使用nashpy计算纳什均衡 rps=nashpy.Game(np.array[[0,1,-1],[-1,0,1],[1,-1,0]]));eqs=list(rps.support_enumeration()) 混合策略纳什均衡点计算结果:[[0.3333,0.3333,0.3333],[0.3333,0.3333,0.3333]] •达到混合策略纳什均衡时,每个参与者自身选择的不同策略具有相同的期望收益。 •在石头-剪刀-布博弈中,假定参与者A使用石头、剪刀、布策略的概率分别为�、�、1− �−𝑦,参与者B使用石头、剪刀、布策略的概率分别为�、�、1−�−�。 策略概率 参与者� � � 1−�−� 参与者� 策略 石头 剪刀 布 � 石头 0 1 -1 � 剪刀 -1 0 1 1−�−� 布 1 -1 0 •参与者A选择策略石头、剪刀、布的期望收益如下,且�石头=�剪刀=�布,有: �石头=0∙�+1∙�−1∙1−�−� �剪刀=−1∙�+0∙�+1∙(1−�−𝑞) �布=1∙�−1∙�+0∙(1−�−𝑞) •可以得到�=1/3,�=1/3;同理得到�=1/3,�=1/3。即参与者以各1/3的概率使用三 3合作博弈与Shapley值 •合作博弈是指若干参与者结成联盟,共同合作争取联盟效用最大化,并在联盟内部进行分配。当联盟成立后,组成联盟的参与者不再关心自己的利益,而是为整个联盟的最大利益而努力。 •我们使用(𝑁,𝑣(𝑆))来定义一个合作博弈,博弈中共有𝑁=[1,2,……,𝑛]个参与者,参与者的子集(包括空集和全集)可以任意结成联盟𝑆,�共有2�种组合。𝑣(𝑆):𝟐�∈ℝ是联盟�的收益 ,也被称为特征函数(CharacteristicFunction)。 •特征函数的性质 ∅ 空集的特征函数为0,即�=0 𝑆1 联盟规模越大,特征函数(联盟收益)越高,这一性质被称为超可加性(Superadditivity) 𝑆1+𝑆2 。即对任意𝑆1⊆N,𝑆2⊆N,𝑆1∩𝑆2=∅,有� ≥� +𝑣(𝑆2)。 以本文风格轮动投资为例,[大盘成长,小盘价值]投资组合可以组成一 个联盟,这个投资组合的效用(可以是收益率或其他度量指标)就是它们的特征函数。 16 •合作博弈最大的一个特点是在联盟的收益形成后,需要通过协议在参与者之间分配。我们接下来重点介绍收益的分配,因为在证券投资问题中,分配规则也决定了如何确定证券的权重,而权重分配是投资策略的最终落脚点。 𝑁,�� •对于合作博弈 ,�= ,对每个参与者�∈𝑁,收益分配结果为实数𝑥𝑖, 1,2,…,� � 形成的�维向量为�=(𝑥1,……,𝑥𝑁),如果�满足: � σ𝑖∈�𝑥�=� ,𝑥�≥� (3) 则称�是联盟的一个分配(Allocation)。 •式(3)表明分配有两个特征:①所有参与者的收益分配之和不能超过全集的收益;②每 个参与者通过联盟获得分配的收益不能低于他自身参与博弈应得的收益,即合作的收益 不能小于非合作的收益。 •如果一个分配�=(𝑥1,……,𝑥𝑁),对于全集�的任意子集�⊆N,都有 � σ𝑖∈�𝑥�≥� 则称�是分配的核心(allocationinthecore)。 (4) •分配的核心的含义是:对于结成的每个联盟,分配方案应该使得联盟所有参与者的收益之和,不低于他们形成的联盟的收益。 •分配的核心——例A 某合作博弈有[1,2,3]共3个参与者,特征函数值(联盟收益)如下表所示: 联盟 �∅ 𝒗(𝟏) 𝒗(𝟐) 𝒗(𝟑) 𝒗(𝟏,𝟐) 𝒗(𝟏,