您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中泰证券]:剔除“运气”找“实力”,用FDR方法优选基金 - 发现报告
当前位置:首页/其他报告/报告详情/

剔除“运气”找“实力”,用FDR方法优选基金

2022-10-23包赞中泰证券秋***
剔除“运气”找“实力”,用FDR方法优选基金

证券研究报告/金融工程报告2022年10月22日 剔除“运气”找“实力”,用FDR方法优选基金 分析师:包赞 电话:18017505196 执业证书编号:S0740522070001Email:baozan01@zts.com.cn 统计检验中不同比较准则: 报告摘要 ◆基金评价中的多重选择问题 基金评价中势必会用到一些量化指标,这些指标本身就是随机变量,存在估计误差问题。比如我们在计算基金alpha指标时候,置信度取5%,表示出�一类“弃真”错误,也就是把本来是运气的基金归为有实力的基金的概率是5%。这个错误概率在单算一个基金的时候是不大的。但是我们时常同时计算多个基金,几十个甚至几百个基金,犯�一类错误的概率是1-(95%)^n,假如n是20,出错概 率是0.64,且出错概率会随着样本基金的增加而不断变大,这个是无法接受的,就需要控制总体的�一类出错概率(falsediscoveryrate,FDR)。好在生物统计学对这个“假阳”的研究很成熟,我们金融领域可以直接拿来使用。 ◆FDR简介 计算统计量的时候,我们会得到相应的P值,比如计算某个基金alpha的时候,P值为0.01,这表明这个基金相对于基准是由显著的超额收益。但是这个P值完全是基于这个基金的收益算出来的,我们实际中,会计算很多个基金,会有很多个P值 需要在整体上对这些P值进行调整,这样才能控制这几十个基金整体上的估计误 差。FDR错误控制法是Benjamini于1995年提出的一种方法,基本原理是通过控制 FDR值来决定p值的值域。相对其它算法来说,FDR用比较温和的方法对p值进行了校正。尽量减少把“运气”算成了“实力”的错误,有助于我们筛选出真实力基金 ◆FDR在基金选择中的运用 (1)运用1:计算FDR时候,需要计算一个中间变量,叫零alpha基金占比,表示这个样本内,有多大比例的基金是没有alpha的,这个指标可以辅助我们判断哪个大类的基金在这个区间的表现是较好的。我们发现,2019到2022年9月这个时间段,普通股票型基金和指数增强零alpha占比最小,表现优秀,价值基金表现较差,但是价值基金从去年开始算,零alpha占比表现较为优秀。整体上看,指数增强的零alpha占比指标比较平稳。 (1)运用2:基金优选。实际基金选择中,我们会获得一个大的基金池,或者有几十个较为优秀基金构成的组合。我们可以依据FDR指标,进一步优选。如下表 代码 基金名称 P FDR 实力 真实力 004***.OF 金元顺安元启 0.0002 0.0029 * * 450***.OF 国富中国收益 0.0018 0.0131 * * 005***.OF 0.0259 0.1152 * 519***.OF 0.0307 0.1152 * 表:少量主动基金FDR计算举例(20210101-20211231) 风险提示:模型仅根据历史数据获得的历史经验,应用在未来可能产生风险。文中基金只是举例计算,样本不全,不构成推荐。 正文目录 1.基金研究中的多重检验问题3 2.FDR计算5 2.1总体错误的简单控制5 2.2FDR的估计7 2.3估计零alpha基金占比8 3.FDR的实际运用10 3.1零alpha基金比例10 3.2基金的FDR计算11 图表目录 图1:多重检验的不同准则比较6 表1:统计检验示意表7 图2:显著性参数与零基金比例的关系9 表2:零alpha基金占比11 表3:FDR计算举例12 1.基金研究中的多重检验问题 基金业绩评价中,常用alpha来表示权益基金基金经理的投资能力,我们常选择alpha大于零且显著的基金,来作为我们投资备选标的。假设我们需要计算M个权益基金的alpha,在回归计算中,是如下的假设检验问题: H0,1:a1=0,versusHA,1:a1>0ora1<0, ¼:¼ H0,M:aM=0,versusHA,M:aM>0oraM<0. 假如说我们每做一次假设检验有5%的几率犯�一类错误,也就是错误拒绝原假设的概率是5%,因为拒绝原假设表示该基金有显著alpha、有实力,错误拒绝就是把本来是运气的基金归为有实力的基金的概率是5%。这个在一个基金的计算中,出错概率不算大,但是我们时常同时计算多个基金,几十个甚至几百个基金,犯� 一类错误的概率是1-(95%)^n,假如n是20,出错概率是0.64,且出错概率会随着检验次数增加而不断变大,就需要控制总体的�一类出错概率(falsediscoveryrate,FDR)。所以为了保证假设检验结果的可靠性,我们要对假设检验的p值进行调整。这个在我们基金优选中有很强的实用性,因为我们通常选择基金不会只选一个,往往选很多个,所以“一个一个的选”角度下,最终得到的整体组合效果并不好,需要借助整体视角下的“多重 检验”。 其实上文说的这个问题,统计中有专门方法或者叫领域,叫多重检验(MultipleTest),其实更准确的说法是MultipleComparisons(多重比较),在生物统计学中研究比较充分,实际运用也很多,为了更清楚描述这个问题,我们再举一例。假设我有很多袋彩球,每袋100颗,其中紫色球95颗(代表正确的鉴定结果),其它颜 色的球5颗(代表错误的鉴定结果): 把一袋彩球倒入一个盒子里,随机从盒子里抽出一个球,抽到紫色球的概率为0.95; 把两袋彩球倒入一个盒子里,随机从盒子里同时抽出两个球,抽到两个紫色球的概率为:0.95*0.95=0.9025; 把一百袋彩球倒入一个盒子里,随机从盒子里同时抽出100个球,抽到100个紫色球的概率为100个0.95相乘,即0.005921。 虽然每个袋子里鉴定结果的正确率是很高的(紫色球占95%),但是当鉴定的数量非常多的时候,完全保证不了整个结果集合的正确率。 Barras,Scaillet,andWermers(2010)(BSW(2010))。BSW(2010)应用FDR方法来分析基金业绩,希望尽可能规避多重检验问题。这篇文章系统讲述了FDR方法在基金研究中的应用,并且计算得到的实力基金中,运气基金的占比。利用美国大量的权益基金横截面数据,文献发现,76.6%的基金是零alpha,21.3%是负alpha。剩下的2.1%的正alpha基金落在分布的极其右边的尾部,表明其有真实力。 这篇文献基于1975到2002间,1456个权益基金的数据来分析,分析显示,最优秀的一组基金受运气影响的程度很大。文献发现,在任意显著性水平上,各类型的优秀基金都有超过一半是来自运气因素,也就是说我们常规的到的显著alpha是估计有误的,真实的alpha为零。文献分析显示,大概76.6%基金是零alpha,剩下的比例中,21.3%产生负向alpha,只有2.1%有真正的正alpha,但是进攻型成长基金中8.4%有真正的正向alpha,这说明长期看,进攻成长策略还是要更优秀。 文献中还用FDR方法分析了业绩和三个滞后变量的关系,三个变量是换手率,费率,基金净资产。高换手基金负alpha占19.3%,低换手基金负向alpha占比14.9%,说明换手低的基金跑输基准的概率要小。低费率基金会更容易出现真实力基金,占比4.1%,而高费率基金中,真实力占比为零,但是低费率基金的负alpha占比更高 (26.3%vs14.7%),这说明高费率虽然真实力基金占比不高,但是特别差的比例也少很多。高净资产和低净资产基金,没有实力的占比是一样的(21.2%vs20.7%)。相对于低净资产基金,高净资产基金的真实力占比更高,是4.1%。 BSW(2010)这篇经典文献给我们分析基金的真实力问题,提供了全新的角度,但是文献对于我们业界实战领域来说,还存在两个缺憾,�一个是FDR方法描述不够直观,统计方法掌握不多的读者感到晦涩难懂,�二个问题是,文献从长期总体角度分析真实力基金的比例,并没有告诉我们哪些是真实力基金,而基金优选才是我们业界最关心的。本文在借鉴BSW(2010)的基础上,着力解决这两个关乎我们实战运用的问题,明确给出基金优选方法。 2.FDR计算 2.1总体错误的简单控制 举个简单例子,对全市场6000个基金的alpha进行检验,选出来实力基金,因为原假设是alpha等于零,所以拒绝原假设代表着实力,这是一个高维的假设检验问题。如果我们假设这6000个基金彼此独立的话,那么就 可以对每个基金单独做假设检验(不妨假设为T检验)。这里我们的NullHypothesis与零没有差别。 H0j是👉�个基金的alpha 于是就可以得到6000个彼此相互独立的假设检验T统计量t1,¼,t6000,然后按照显著性水平a=0.05进行检验,就可以依次决定拒绝还是接受H0j。但在这一步问题就来了,注意我们在做常规假设检验的时候,需要控制显著性水平为a=0.05(当然更低也行),就是我们希望犯�一类错误(即假实力,运气)的概率被控制在 a=0.05以下,所以如果统计量对应的p值小于0.05,就要考虑拒绝这个假设。但问题是在这里,我们需要做 总共6000次假设检验,即使每一次假设检验都是显著性水平a=0.05的检验,从平均上来讲也会产生 6000´0.05=300个运气基金,这就比较难处理:我们每次检验抽到运气基金的概率都小于0.05,但这么多次检验下来,抽到运气基金的个数却远远超过了我们可以承受的范围,可能我们选出来的考前的实力基金大部分其实都是靠运气。 怎么解决这个问题呢? �一个方法就是考虑BonferroniThreshold,即我们直接把单次检验的显著性水平设定为a1=a/N,其中 a是原来的显著性水平,N是假设检验的次数,在这里N=6000。 定义FWER(Family-wiseErrorRate)为:FWER=P(至少有一次运气),于是可以证明如果有M个基金服从NullHypothesis,则在BonferroniThreshold下: FWER=P(ÈiÎM(pi£a/N))£åP(i£a/N)=Ma/N£a iÎM 上面的基金之间独立,所以并集可以拿出概率函数出来变为求和。即整个6000次假设检验犯假阳性错误的概率 被压到了原有的显著性水平a之下。所以我们说BonferroniBound有效控制了FWER水平。 但BonferroniBound的问题在于,它太过于保守了。以我们前面提到的运气检测为例子,每次假设检验只 -6 有在其p值pi<0.05/6000»8´10的情况下才会被拒绝,这虽然控制了运气,但也可能搞出一大堆假运气, 因为检测出来全是运气了。 所以另一个思路是相比于控制FWER,我们改为控制FDR(FalseDiscoveryRate)。什么是FDR呢,现在假设我们要进行N次假设检验,在这N个检验中,有N0组数据是阴性(即NullHypothesis是真),其余 N1=N-N0组数据为阳性,拒绝原假设。 对于某个假设检验算法D(比如说两样本T检验),假设其在N次检验中给出了R次拒绝NullHypothesis (即判定为阳性),而在这R次中有a次为假阳性(即犯了�一类错误),b=R-a为真阳性,那么我们定义FalseDiscoveryProportion(FDP)为: Fdp(D)=a R 然后进一步定义FDR: FDR(D)=E[Fdp(D)] 也就是说,我们可以通过控制FDR来压低所有阳性结果中假阳性的比例(作为对比,FWER控制的是所有结果中假阳性的比例),换成我们基金研究中的话,FDR是用来控制所有实力基金中,靠运气基金的比例,让我们算出来的实力基金尽可能多的是靠真实力。 图1:多重检验的不同准则比较 资料来源:中泰证券研究所 上图是统计学中,几种假设检验的方法,在基金研究中,FDR是最合适的,既减少了错误,又不会过分严格。 2.2FDR的估计 FDR在实际中如何估计和计算是我们的核心问题,我们看如下统计检验: i0i H:alpha=0 vs. Hia:alphai