金融工程 专题报告 运用少量ETF可以复制主动基金的业绩吗? ——“学海拾珠”系列之一百�十 报告日期:2023-07-19 主要观点: 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 联系人:钱静闲 执业证书号:S0010522090002邮箱:qianjx@hazq.com 相关报告 1.《chatGPT交易策略15个月收益500%+——“学海拾珠”系列之一百四十二》 2.《模糊因子与资产配置——“学海拾珠”系列之一百四十三》 3.《动量、反转和基金经理过度自信 ——“学海拾珠”系列之一百四十四》 4.《股票因子个性化:基于股票嵌入的因子优化——“学海拾珠”系列之一百四十�》 5.《盈余公告披露的现象、方法和目的——“学海拾珠”系列之一百四十六》 6.《基金抛售资产时的选择性偏差— —“学海拾珠”系列之一百四十七》 7.《投资者情绪能预测规模溢价吗? ——“学海拾珠”系列之一百四十八》 8.《基于强化学习和障碍函数的自适应风险管理在组合优化中的应用——“学海拾珠”系列之一百四十九》 本篇是“学海拾珠”系列第一百�十篇,文献使用交易型开放式指数基金(ETF)作为基准,而不是风险因子,来研究美国主动型共同基金的业绩分布,发现ETF有作为基准进行基金业绩评价的潜力,得出结论:3到5个ETF的组合可以复制大多数主动基金的业绩,也提出了如何选择特定的ETF集合来描述基金业绩,在此方法估计下,有约95%的主动管理基金无法为投资者创造价值。回到国内基金市场,近些年ETF尤其是行业主题ETF规模增长非常迅速,在评估基金业绩时考虑是否能用少量ETF进行业绩复刻可以帮助我们选出真正有能力的主动权益基金。 基金的基准选择:风险因子vsETF 使用传统的风险因子来描述基金的Alpha对基金而言更具挑战性, 因为风险因子中不包含交易成本,而ETF的收益已经包含了交易成本。使用ETF组合,与使用风险因子相比,使用ETF计算得到的基金Alpha较高,两者的差异与投资于风险因子组合所需的交易成本类似。 FalseDiscoveryRate(FDR)方法 评估基金Alpha的显著性时,即测试基金样本中正Alpha、零 Alpha、负Alpha基金的比例时,参考Barras等人(2010)提出的 FalseDiscoveryRate(FDR)方法,即调整了零Alpha基金样本中由于运气被统计量错误地识别为正Alpha或负Alpha的基金。 使用ETF组合模拟基金业绩 采用四种方法分析ETF作为基准描述基金业绩的潜力:1、随机 ETF选择;2、特定ETF选择,目标是最小化总体中正Alpha基金的比例,并使解释基金收益变动性的能力(平均adjusted-R^2)尽可能 高。3、风险因子的Lasso选择,基于lasso使用ETF来解释风险因子收益。4、风险因子的正向选择法,为第三种方法的替代法。发现ETF可以用作评估基金业绩的基准,且最佳的ETF组合应在3到5个数量范围内。 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建 议。 敬请参阅末页重要声明及评级说明证券研究报告 正文目录 1简介4 2研究方法4 2.1FDR方法用于估计有投资能力基金比例5 2.1.1对𝝅�的计算过程6 2.1.2模拟示例6 2.2随机ETF选择7 2.3特定ETF选择8 2.4风险因子的LASSO选择9 2.5关于风险因子的正向选择法9 3数据10 4结果12 4.1ETF是否有可能作为基金的基准12 4.2ETF选择15 4.2.1基于基金业绩的ETF选择16 4.2.2基于风险因子的ETF选择17 5总结19 风险提示:20 图表目录 图表1𝑯𝒊𝟎:𝜶�=�下模拟数据集的估计P值6 图表2𝑯𝒊𝟎:𝜶�=�下模拟数据集的T统计量分布7 图表3在模拟数据集中使用FDR方法得出的有投资能力基金的比例9 图表41980年1月到2019年12月的每月基金数量10 图表5BLOOMBERG数据集中ETF基金的数量11 图表61994年1月至2019年12月期间的ETF资产净值(AUM)11 图表7最终数据集的统计信息12 图表8零ALPHA基金、投资能力匮乏基金和有投资能力基金的比例。13 图表9随机选择ETF与风险因子之间的潜力对比14 图表10基于随机ETF选择,不同ETF数量组合下,各个组别的百分比情况15 图表11基于基金业绩分布的ETF选择结果16 图表12通过LASSO选择的ETF17 图表13通过正向选择选择的ETF18 图表14基于风险因子的选择结果19 1简介 文献使用交易型开放式指数基金(ETF)作为基准,而不是风险因子,来研究主动型共同基金的业绩分布。通过风险因子来描述基金的Alpha对基金而言更具挑战性,因为风险因子中不包含交易成本,而ETF的收益已经包含了交易成本。文献基于Barras、Scaillet和Wermers(2010)提出的FalseDiscoveryRate(FDR)方法,使用2005年至2019年的美国主动基金样本进行评估。 关于Alpha值,本文的结果与使用风险因子得出的结果有所不同,两者之间的差异几乎与投资于风险因子组合所需的交易成本相当(Frazzini、Israel和Moskowitz(2012))。另一方面,类似于使用风险因子方法得出的结果(Barras等人(2010)),估计约有95%的美国主动基金无法为其投资者创造价值。此外,随机选择ETF构造组合无法超越主动基金,但是,通过特定方法选择一组ETF可以实现这一目标。 将被动基金作为主动基金的基准并不是一件新鲜事。Malkiel(1995)认为,主动管理者应将被动基金视为机会成本。Sharpe(1992)的使用十二种资产类别指数解释了基金收益。 尽管ETF的规模大幅增长,但只有少数研究考虑了它们。运用彭博数据库,筛选了在美国证券交易所上市的2000多只ETF,涵盖了各种资产类别、地理位置和投资策略。若仅考虑美国国内股票市场的ETF,数据集显示有875只基金,截至2019年12月,管理的资产总额达到2.1万亿美元。 为了估计有投资能力的主动基金(skilledactivefunds)的比例,需要关注特定基金的净收益业绩和成本,从净超额收益中单独计算Alpha值,这通常用于衡量个 基的经济收益。因此,在文中,有投资能力的基金被定义为在控制了某些风险之后 能够提供异常收益的基金。 从计量经济学的角度来看,评估有投资能力主动基金的比例并非易事,因为必须处理运气成分(假阳性/第一类错误)。已经有许多论文尝试解决这个问题,Fama(2010)提出了一种自助法来计算零Alpha基金的分布,并通过与经验分布进行比较来得出有投资能力基金的分布结论。Pastor和Stambaugh(2002)应用贝叶斯技术,为投资能力匮乏、零Alpha和有投资能力基金的分布设定先验概率。Chen、Cliff和Zhao(2017)假设Alpha基金的分布是参数混合模型。本文采用了Barras等人(2010)提出的FalseDiscoveryRate(FDR)方法。该方法通过计算样本总体中实际幸运基金的比例来控制幸运基金的影响,此外,该方法不需要关于Alpha基金分布的先验假设,并且已经在基金行业研究中广泛应用。 文献提出了特定的算法,使投资者能够选择一组简约的ETF,以评估主动管理 基金的业绩。从随机选择一个ETF开始,通过多次重复进行,测试了随机ETF组合在共同基金中的平均超额收益能力。其次,提出了一种基于ETF的超越能力和解释基金收益变动性的能力来选择ETF的算法。最后,通过lasso和正向选择法 (forwardselection),在风险因子空间中选择ETF。 2研究方法 为了评估主动管理基金是否能够超越被动投资为其投资者创造价值,本文将基金与被动投资者所面对的投资机会进行对比,即ETF的净收益。 从以下线性风险因子模型开始分析: 𝛾𝑖,�=𝛼�+𝛽𝑖𝐸𝑇𝐹�+𝜀𝑖,�(1) 其中𝛾𝑖,�表示第�期的第�只共同基金的超额收益,𝐸𝑇𝐹�是一个(�×1)的�个选定ETF基金的超额收益向量,�∈(1,...,𝐼),�∈(1,...,𝑇)。需要强调的是,无论是共同基金还是ETF基金的收益都是净收益,考虑的是扣除了费用后的投资者直接收益。 根据模型(1),假设主动管理型共同基金的总体由三个不同的收益类别组成:投资能力匮乏的基金(�<0),零Alpha基金(�=0)和有投资能力的基金(�>0)。因此,如果第i只共同基金是一只有投资能力的基金(𝛼�>0),它将产生特异的正超额收益,并且业绩优于所选的基准。 对于任何给定的ETF选择,主要目的是评估样本中有投资能力的共同基金的真实比例。通过对�=(1,...,𝐼)进行(1)的估计,直接推断有投资能力的基金比例的 方法是收集来自𝐻0:𝛼�=0对𝐻1:𝛼�≠0的p值。然而,这种方法未能控制第一类错 �� 误,导致出现了假阳性。这些假阳性被称为幸运基金和不幸基金。为了解决这个问题,采用Storey(2002)提出的FDR方法,该方法最初由Barras等人(2010)在共同基金行业中使用。 为了获得有投资能力基金比例的FDR估计,需要确保使用模型(1)估计的个别检验具有足够的统计功效。因此,本文必须选择一组稀疏的ETF来通过OLS计算(1),并包括足够的时间序列长度,共采用了四种不同类型的ETF选择来获得稀疏的预测变量集。 为了比较不同ETF选择所得到的结果,将以下风险因子模型作为的基准模型: 𝛾𝑖,�=𝛼�+𝛽𝑖𝑓�+𝜀𝑖,�(2) 其中𝑓�是一个(𝑃�×1)的风险因子向量。 2.1FDR方法用于估计有投资能力基金比例 FDR方法常常被用于控制假阳性,假设零Alpha基金中被错误地认定为有投资能力(投资能力匮乏)基金的比例为𝐹+(𝐹−),即第一类错误比例,[注:�是显著 性水平]。 �� 𝐸(𝐹+)=�通过定义�为给定显著性水平�下的零Alpha基金的比例,𝐹+的期 �00� 望值可以表示为: 𝐸(𝐹+)=�� (3) �02 在计算模型(1)的𝐻0:𝛼�=0vs𝐻1:𝛼�≠0的p值之后,按如下方式计算产生 � 显著正�的基金比例: ̂+𝛼̂2 ∑ � ̂� 𝑖∈�+Ι(𝑝𝑖>) �= (4) �� 其中Ι(� >𝛾)是示性函数,如果� >�则等于1,否则为零;且�̂=[𝑖:𝛼̂> �2 �2 𝛼+� 0]。因此,通过对第一类错误比例进行修正,可以估计出总体中有投资能力基金的期望比例,即: � � 𝐸(𝜋+)=𝐸(𝑆+)−𝐸(𝐹+)(5) 𝛾∗ 因此,通过对零Alpha基金比例的估计(𝜋̂0),和一个𝛾∗的最优显著性水平,本文可以计算出𝐸(𝜋+),如下所示: 𝜋̂+ =𝑆̂+−𝜋̂ 𝛾∗ 02 (6) 由于负Alpha基金、零Alpha基金和正Alpha基金的比例之和必须为1,可以用以下公式计算𝐸(𝜋−): 𝜋̂−=1−𝜋̂0−𝜋̂+(7) 2.1.1对𝝅�的计算过程 根据定义和零假设𝐻0:𝛼�=0,对𝐻0:𝛼�=0𝑣�𝐻1:𝛼�≠0进行多重检验会生成 ��� 一系列的p值,若基金均为零Alpha基金,则这些p值在[0,1]区间内应该呈现均匀分布: � 𝐻0:𝛼�=0⇒𝑝�∼𝑈(0,1)(8) � 图表1𝑯𝟎:𝜶�=�下模拟数据集的估计p值 资料来源:《Unskilledfundmanagers:ReplicatingactivefundperformancewithfewETFs》,华安证券研究所 在本文的第二个假设中,假设大于阈值�∗的p值只能来自零Alpha基金。因此, 考虑到p值的经验分布,由∑𝑖∈�Ι(