金融工程报告 研究背景 被动管理基金通常密切复制跟踪指数的投资组合。完全复制指数策略在很多情况下由于指数权重变化产生的股票交易成本,以及较小权重股票的流动性成本,导致成本高昂。部分指数复制的方法能够极大降低交易和流动性成本,因此在实践中被普遍使用。 部分复制指数方法介绍 简单选择:根据特定选择标准对成分股排名,选择排名最高固定数量的成分股构建组合,缺点是可能无法完全复制指数。优化选择:通过解决具有条件约束的优化问题来选择跟踪投资组合中的资产,缺点是模型复杂并且计算量很大,可能包含冗余资产。覆盖指数结构:通过分层抽样和分层聚类等方法选择资产来模拟指数结构,缺点是面临决定资产数量及指数跨期跟踪风险。 Follow-the-Leader:主导跟随方法 主导跟随方法通过追踪驱动指数回报的因子,选择一组完全捕捉标的指数因子结构的资产来实现指数跟踪。实现步骤:首先估计跟踪指数回报的系统性因子的数量,其次通过主成分方法估计因子载荷,最后通过迭代过程选择主导个股集构建跟踪组合。主导跟随方法计算简单,能够完全代表指数的因子空间。蒙特卡洛模拟结果显示,相较于其它方法,Follow-the-Leader方法在模拟测试中表现更好,跟踪误差低,并且参数灵敏度较低。 实证研究 跟踪标准普尔500等权重指数:时间区间为2015年至2016年,使用滚动窗口进行样本外分析,样本期为1年,样本外为1个月,选取整个样本期间始终保留在指数中421只成分股。通过主导跟随方法计算得到主导个股组合,使用CM-2006和简单选择方法作为对比,主导跟随方法平均选择28只主导个股,跟踪误差、换手率及其他跟踪效果指标也好于对照组。 接下来通过将第一期的17只个股作为整个样本期的基础投资组合进行改进,改进后的方法换手率从3.18降低到1.11,平均持股个数减少到23只。 跟踪MSCI美国小盘股指数:时间区间为2016年至2019年,每期样本区间为2年,样本外为1个月,指数成分股数量为1391只,远多于标普500指数,并且流动性更低。结果显示主导跟随方法平均使用38只主导个股。与CM-2006相比,主导跟随方法的MSE降低了大约20%,换手率大约降低40%。 结论 本文提出了一种新的基于因子的主导跟随方法,用于构建跟踪指数的成分股组合。该方法易于执行并且计算相对简单,通过选择较少的成分股选择构建投资组合,能够以非常小的跟踪误差跟踪基础指数,并且选定的主导个股随着时间的推移是稳定的。主导跟随方法由于复制指数所需的换手率更低,指数基金使用该方法可以极大地节省交易成本。 风险提示:本报告基于相关文献,不构成投资建议。 文献来源 文献来源:XIN ZHANG, LANWU and ZHIXUE CHEN,“Follow the leader:Index tracking with factor models(Nov,2021)”,Journal of Empirical Finance. 文献亮点: 基于因子模型的新进展,本文提出了一种新的方法—主导跟随方法—来选择部分成分股来复制指数的投资组合。本文的方法基于因子模型,并采用了一个独立的资产选择过程,该过程可以得到一个稳定的代表指数因子空间的资产子集。 此外,本文构建的方法可以很容易地用于合成复制指数,其中不属于该指数的资产(比如期权或期货)可以加入到复制投资组合中。 摘要 本文构建的模型选择了一组主导股票,这些股票组合完全代表了要复制的指数的因子结构。蒙特卡洛实验表明,因子模型构造的指数副本能够以非常小的跟踪误差跟踪基础指数。实证研究中,本文通过跟踪标准普尔500等权指数和摩根士丹利资本国际美国小盘股指数的样本外表现,展示了该方法的适用性。本文构造的方法可以很容易地适用于综合指数复制,并纳入流动性或交易成本的控制措施。 1.介绍 被动管理基金通常密切复制跟踪指数的投资组合。例如,交易型开放式指数基金(ETF)可以低成本复制跟踪指数投资组合,并且可以像股票一样交易。最简单的指数跟踪策略是完全复制指数策略,该策略构建包含指数中所有成分股的投资组合。然而,由于指数权重变化产生的股票交易成本,以及较小权重股票的流动性成本,这种复制指数的成本高昂(Beasley等人,2003年)。另一种策略是部分复制指数,即仅使用指数中的有限数量的成分股构建复制投资组合。 部分指数复制的方法能够极大降低交易和流动性成本,因此在实践中被普遍使用。例如,跟踪CRSP美国总市场指数表现的Vanguard Total Stock MarketETF(股票代码VTI)仅使用约3600种资产来复制基准指数中的约7000种资产。 同样,由于固定收益ETF的基准指数通常持有数以千计的债券,其中许多债券几乎没有交易活动,因此大多数固定收益ETF使用部分复制的方法。 在本文中,我们提出了一种新方法,该方法选择部分指数成分股来复制指数。 我们方法的基本前提是追踪推动指数回报的系统性因子,而不是追踪指数本身。 具体而言,该方法是基于选择一组完全捕捉标的指数因子结构的资产。我们将这组资产称为主导资产,将我们的方法称为“主导跟随”(Follow-the-Leader)法。本文的主要贡献是基于对多维度因子模型的最新研究,提出了一种一致的方法来选择主导资产集。 本文构造的方法只需要估计资产收益协方差矩阵的特征值和特征向量,因此计算简单。首先估计解释指数回报的系统性因子的数量。通过Bai和Ng(2002年)、Hallin和Liška(2007年)、Onatski(2009年,2010年)或Ahn和Horenstein(2013年)提出的方法,可以稳定地计算出这一步的结果。接下来,本文使用Bai和Ng (2002)和Bai(2003)的主成分方法估计因子大小(或因子载荷)。最后,对于前两步得到的估计因子,本文通过一个迭代过程,通过公因子在指数成分股样本空间内选择资产集。 迭代结果表明,当样本数据的维度很大时,Follow-the-Leader方法会得到一组资产,这些资产始终能够跨越样本空间来解释指数(即𝑁,𝑇∞)。这样的一致性结果得益于Parker and Sul (2016)的公因子识别方法。此外,本文的蒙特卡罗模拟结果表明,与其它方法相比,Follow-the-Leader方法在有限样本中表现良好,跟踪误差低,并且参数灵敏度也低得多。 为了验证本文提出的方法在实际中的有效性,接下来本文进行了一项复制S&P500等权重指数的实证研究。实证研究结果表明,与其它资产选择方法相比,Follow-the-Leader方法的结果相对较好。构建的跟踪指数投资组合最多包含27只主导股票,可以以非常低的均方误差跟踪标准普尔500等权重指数。 此外,与其它方法相比,Follow-the-Leader方法具有相对较低的投资组合换手率,因此可以有效地降低交易成本。MSCI美国小盘股指数包括更多的资产,平均流动性低于标准普尔500指数,当使用这个方法跟踪MSCI美国小盘股指数时,得到了类似的结果。 Follow-the-Leader方法的另一个优势是它可以很容易地用于合成复制指数,其中不属于该指数的资产(比如期权或期货)可以加入到复制投资组合中。此外,该方法可以将流动性或交易成本纳入到组合的衡量标准中,以便确保所选资产是交易成本最低的资产。 本文并不是首个研究指数部分复制问题的文章。一般来说,由于计算简单,指数跟踪问题分为两个步骤:第一是选择要包含在跟踪投资组合中的资产集,第二是估计跟踪投资组合中的资产权重。但是,试图联合解决这两个问题的方法计算很繁琐,甚至往往无法得到可行的解决方案。之前的大多数文献只关注第二个问题,而对资产选择的关注相对较少,Corielli和Marcellino(2006年)(下文的CM-2006)做了关于资产选择方法的最新研究。CM-2006提出了将资产包含在复制投资组合中的选择标准,该标准取决于这些资产的价格与估计的潜在因子的相关性。此过程通过特定的相关性阈值水平来选择哪些资产应该包含在复制组合中。本文的方法基于因子模型,这是受到了CM-2006的启发。但是,本文采用了一个独立的资产选择过程,该过程可以得到一个稳定跨越指数因子空间的资产子集。与CM-2006方法相比,本文的蒙特卡洛模拟和实证研究结果证明了本文提出的独立资产选择过程的重要性。 本文的其余部分组织如下:在第2节中,简要回顾了有关指数跟踪的文献,然后介绍构造的方法并研究其大样本特性,在第3节中,通过蒙特卡洛模拟总结了该方法的有限样本特性,第4节介绍了实证研究,第5节是总结。 2.指数追踪方法 2.1指数跟踪问题 在本节中,我们将指数跟踪问题形式化。时间𝑡的指数价格定义如下: 𝑉= 𝜔𝑃 𝑡 𝑡 其中𝑃和𝜔分别是股票价格和指数权重的𝑁 ∗ 1和1 ∗ 𝑁向量,时间𝑡=1,…,𝑇。在 𝑡 本文中,假设权重在时间𝑡是已知的。市场上可用的大多数基准指数都报告了成分股的权重或构建方法,也可以放宽这一假设而不影响本文的理论结果。本文专注于通过使用𝑄 ∗ 1资产价格向量𝑞来复制𝑉的问题,它是𝑃的子集;因此,𝑄<𝑁。这个问题也被称为抽样复制,通过使用包含较少数量的指数资产的跟踪投资组合来复制指数。在交易成本成为一个重要问题的情况下,基金经理将考虑对那些非常大的、流动性差或国际市场指数使用抽样复制。 𝑡 𝑡 𝑡 跟踪组合定义如下: 𝑉̂= 𝜔𝑞 𝑡 𝑡 其中𝜔是一个1 ∗ 𝑄的跟踪投资组合权重向量。 一般来说,由于计算简单,指数跟踪问题分为两部分:第一,选择要包含在跟踪投资组合中的资产集(估计𝑞);第二,估计跟踪投资组合的资产权重(即估计𝜔)。 𝑡 试图联合解决这两个问题的方法计算很繁琐,甚至往往无法得到可行的解决方案。之前的大多数文献只关注第二个问题,而对资产选择的关注相对较少,即估计跟踪的投资组合的资产权重,该投资组合为指数投资组合的资产子集。权重是通过优化跟踪质量的度量来估计的,最常用的方法是最小化跟踪误差。以前的研究提出了基于简单启发式算法的最小化跟踪误差方法,如等权重、市值加权、或价格加权,(例如Beasley等人,2003年;Li等人,2014年),但也可以通过更复杂的数学方法,包括分级非凸方法(例如Coleman等人,2006年)和基于聚类的方法(例如Focardi和Fabozzi,2004年)。 资产选择问题的关注相对较少,该问题涉及确定跟踪投资组合中应包含多少资产和哪些资产。Karlow (2012)回顾了相关工作,将选择方法分为三类:第一是简单选择标准,第二是优化选择,第三是覆盖指数结构的方法。在“简单选择标准”方法下,根据给定的选择标准对资产进行排名,选择排名最高的资产纳入跟踪投资组合中。常见的选择标准是指数中的资产权重、市值(例如van Montfort等人,2008年)、业绩(例如Larsen和Resnick,1998年)、与指数的相关性或协整程度(例如van Montfort等人,2008年)、交易量(Rey和Seiler,2001年)和市场贝塔系数(van Montfort等人,2008年)等。这些启发式方法易于应用,但它们存在三个主要缺点:对资产数量的任意决定、包含过多具有重复信息的资产的风险以及无法捕获所有系统风险的可能性。 “优化选择”方法通过解决具有条件约束的优化问题来选择跟踪投资组合中的资产。优化问题尝试根据某种相似性度量对资产进行分组,然后仅选择一组具有代表性的资产。这些方法通常很复杂并且计算量很大。此外,由于跟踪投资组合在设计上将包含与指数非常相似并且可能是多余的资产,这些方法可能会产生缺乏多样化代表水平的复制投资组合。 “覆盖指数结构”方法旨在通过使用分层抽样(Maginn等人,2007年)和分层聚类(Focardi和Fabozzi,2004年;Dose和Cincotti,2005年)等方法选择资产来模拟指