量化专题报告 基金经理层面的数据库制作与应用 为什么要构建基金经理层面的数据库 以往大部分的基金分析量化专题报告都是站在基金产品维度进行研究的,即将每个基金产品视作一个研究样本,甚至直接忽略基金产品背后的基金经理是否发生更换等重要信息,这样做的优势是数据获取与处理简单,但会有几个重大缺陷需要改进,因此我们构建了基金经理层面的数据库。 如何搭建基金经理层面的数据库 1、如何判定基金经理的代表产品?有几个选取原则:1)单独管理;2) 管理时长≥1年;3)产品规模大;本文在依次尽量满足上述原则1和2的 前提下,再按照原则3选择产品规模较大的作为基金经理代表产品。 2、基金经理投资生涯空窗期的业绩如何评价?计算基金经理业绩的时候,空窗期不纳入考核区间,按照该基金经理真实有在投资管理产品的日期计算。 3、如何制定基金经理业绩比较基准指数?计算研究样本内所有的基金经理日度收益率的中位数(处于空窗期的基金经理不纳入计算)。我们基于不同类型基金经理池分别构建了相对应的基金经理指数。 基金经理数据库的投资应用 制作基金经理层面数据库的最终目标还是帮助我们做FOF投资,例如可以 筛选出未来业绩有望较好的基金经理,或者反向剔除未来业绩风险较大的基金经理。 1、投资应用之优选经理:增强传统选基因子效果。基金经理维度的数据,在一些因子上的绩效比产品维度更好。可以使用基金经理维度的因子,这 些长期业绩类因子的IC值有显著提升,则可以进一步优化FOF策略。对于其他类型的基金,也可以使用基金经理层面的数据库增强因子表现。基金经理维度的数据样本量并不会比产品维度少很多,得到的结论是比较有效的。当然也有一些因子还是使用产品维度的数据会更好,并非所有的基金因子都可以通过基金经理维度的数据增强。使用基金经理层面的数据库能改进国盛量化多因子FOF组合的绩效。 2、投资应用之提示风险:制作基金经理风险提示清单。本文制作了一个基金经理风险提示清单辅助我们的FOF策略进行反向剔除或者说规避投资,从而改善FOF策略的绩效。有效的风险事件例如有基金经理更换公司、在管规模过大、管理精力分散、持有人信任度下滑、份额快速扩张、 过于追逐热点、重仓股踩雷、回撤幅度过大等等,经历史数据检验表明这些事件有比较显著的风险提示效果。 风险提示:结论基于历史数据统计和模型推演,模型设置存在局限性,第三方数据统计可能存在误差,存在失效风险。 证券研究报告|金融工程 2024年11月21日 作者 分析师张国安 执业证书编号:S0680524060003邮箱:zhangguoan@gszq.com 分析师林志朋 执业证书编号:S0680518100004邮箱:linzhipeng@gszq.com 分析师刘富兵 执业证书编号:S0680518030007邮箱:liufubing@gszq.com 相关研究 1、《量化专题报告:“量价淘金”选股因子系列研究(九MemoryMap在因子生产加速上的应用——以构建羊群效应因子簇为例》2024-11-20 2、《量化周报:市场短期有可能进入震荡整固期》 2024-11-17 3、《量化分析报告:择时雷达六面图:本期打分无变化》 2024-11-16 请仔细阅读本报告末页声明 内容目录 一、为什么要构建基金经理层面的数据库3 二、如何搭建基金经理层面的数据库4 2.1如何判定基金经理的代表作4 2.2基金经理投资生涯空窗期的业绩如何评价5 2.3如何制定基金经理业绩比较基准指数5 三、基金经理数据库的投资应用8 3.1投资应用之优选经理:增强传统选基因子效果8 3.2投资应用之提示风险:制作基金经理风险提示清单12 四、总结与附录19 图表目录 图表1:分域基金产品池的定义3 图表2:根据3条原则选取基金经理A的代表作示意图4 图表3:将基金经理多段任职经历的业绩进行拼接5 图表4:制作基金经理指数作为业绩比较基准6 图表5:基金经理指数历史累计收益曲线6 图表6:基金经理指数分年度绩效(截至2024/9/30)7 图表7:基金经理数据库可提供的字段7 图表8:未来3个月业绩与近3年Sharpe因子的相关性8 图表9:未来1年业绩与近3年Sharpe因子的相关性8 图表10:部分基金因子的业绩预测效果提升显著8 图表11:“近3年收益率因子”在全市场型基金域中的收益率曲线对比(截至2024/8/16)9 图表12:各类型的基金池业绩预测效果都有提升10 图表13:产品维度对于全市场型主动权益基金池有效的15个选基因子11 图表14:产品维度的量化多因子FOF组合(计算区间:2013/1/28-2024/10/31)11 图表15:经理维度的FOF组合相比产品维度有稳健超额(计算区间:2013/1/28-2024/10/31)12 图表16:策略的分年度收益率对比(计算区间:2013/1/28-2024/10/31)12 图表17:事件效应刻画示意图13 图表18:事件效应统计结果——基金经理更换公司14 图表19:事件效应统计结果——在管规模过大14 图表20:事件效应统计结果——管理精力分散15 图表21:事件效应统计结果——份额快速减少15 图表22:事件效应统计结果——份额快速扩张16 图表23:事件效应统计结果——过于追逐热点16 图表24:事件效应统计结果——重仓股踩雷17 图表25:事件效应统计结果——回撤幅度过大17 图表26:风险事件扣分权重18 图表27:风险清单基金经理的累计收益率曲线(计算区间:2013/1/4-2024/10/31)18 图表28:附录:其他基金因子的业绩预测效果回测(计算区间:2013/1/4-2024/10/31)20 一、为什么要构建基金经理层面的数据库 基金产品维度的研究结论有一些缺陷,构建基金经理层面的数据库可以改进。以往大部分的基金分析量化专题报告都是站在基金产品维度进行研究的,即将每个基金产品视作一个研究样本,甚至直接忽略基金产品背后的基金经理是否发生更换等重要信息,这样 做的优势是数据获取与处理简单,但会有几个重大缺陷需要改进: (1)很多投资者认为选基金的本质是选择基金经理,而且现在基金经理离职事件发生得也越来越频繁,在某一时间区间内某产品的业绩可能先后涉及多任基金经理,在这种情况下如果仅从产品维度去做测算,得到的相关评价指标的稳定性可能较差甚至失真。 (2)对于新跳槽的基金经理,无法通过其历史曾任职的产品对该基金经理进行评价,产品维度研究虽然增加了截面数据样本数量,却在某种程度上减少了数据历史长度。 (3)同一基金经理旗下常常会在管多只产品,而投资者通常最终会选择买入基金经理的代表作,而非其他产品。 研究样本:本文的研究对象是公募主动权益型基金经理,即管理过主动权益型基金产品的所有基金经理都是我们的研究样本,其中我们对主动权益型基金产品的定义是: 1、属于Wind二级分类的:普通股票型、偏股混合型、灵活配置型。 2、股票仓位上限>60%。具体而言,股票仓位上限=max[距离基金成立日最近的3个报 告期的股票占净值比的最大值,距离当前时点最近的3个报告期的股票占净值比的最大值]。 因为不同投资类型的主动权益型基金之间不具备可比性,所以我们要将上述主动权益型基金进行分域研究。本文将主要测算如下几个类型的分域基金池:全市场型、医药行业型、TMT主题型、成长风格型、价值风格型。(其他类型的基金同理,暂不赘述。)主要按照基金的历史持股暴露、业绩比较基准、合同约束等信息进行划分,具体定义如下: 图表1:分域基金产品池的定义 基金产品池 样本最新数量 定义 定义成长风格股票池(国证成长399370.SZ、全R成长000059.SH的成分股),基金 成长风格型 732 在成长风格股票池历史6期平均暴露度≥60%,若基金名称包含'成长'等字样或者业绩比较基准含有成长风格指数,则要求暴露度≥30%即可。定义价值风格股票池(国证价值399371.SZ、全R价值000060.SH的成分股),基金 价值风格型 183 在价值风格股票池历史6期平均暴露度≥60%,若基金名称包含'价值','低估'等字样或者业绩比较基准含有价值风格指数,则要求暴露度≥30%即可。定义科技股票池(中信一级行业"通信","传媒","计算机","电子"等指数的成分股),基金在科技股票池历史6期平均暴露度≥60%,若基金名称包含科技关键字样('计算机',' 科技主题型363人工智能','半导体','信息技术','科技','电子','通信','集成电路','5G','联网','AI')或者业绩 比较基准含有TMT相关的指数,则要求暴露度≥30%即可。 医药行业型163 定义医药股票池(中信医药指数CI005018.WI的成分股),基金在医药股票池历史6期平均暴露度≥60%,若基金名称包含'医','药','生物','健康'等字样或者业绩比较基准含有医药指数,则要求暴露度≥30%即可。 全市场型 2978 主动权益型基金,不限风格,但不属于任何行业主题型(例如不属于港股、金融地 产、军工、科技、消费、新能源、医药、制造、周期等行业主题型)。 资料来源:Wind,国盛证券研究所 二、如何搭建基金经理层面的数据库 在搭建基金经理层面的数据库过程中,需要解决如下几个问题: 问题1:如果基金经理同时在管多只产品,应该选哪只产品来代表基金经理?问题2:如果基金经理的投资生涯出现空窗期,空窗期是否要纳入评价? 问题3:不同基金披露的业绩比较基准可能不同,而且基金经理未必按照其披露的基准进行投资,是否存在某个业绩比较基准可同时适用样本池内所有基金经理的评价? 2.1如何判定基金经理的代表作 如何解决问题1:基金经理同时在管多只产品。通常的思路是将基金经理同时在管的多只产品直接按照产品规模进行加权合并,但这样做的问题在于如果产品的定位本身差异度就比较大,这种情况下简单合并的方式并不可取。另外,考虑到我们构建基金经理数 据库的主要目标是便于进行基金经理之间的相互比较,而且真正投资的时候通常选择的也是基金经理的代表作,所以我们认为选取基金经理最具代表性的产品作为研究样本才是相对而言更为合理的方案。那么如何判定基金经理的代表产品?有几个选取原则: 1)单独管理; 2)管理时长>1年; 3)产品规模大; 本文会判定基金经理在历史每个日期当时的代表产品,依次尽量满足上述原则1和2的 前提下,再按照原则3选择产品规模较大的作为基金经理代表产品。 图表2:根据3条原则选取基金经理A的代表作示意图 资料来源:国盛证券研究所绘制 2.2基金经理投资生涯空窗期的业绩如何评价 如何解决问题2:基金经理的投资生涯有时候会出现空窗期。从基金经理投资生涯的首次任职日期至今,可能会因为跳槽、休假或其他因素而出现管理业绩的空窗期,理论上 我们需要将基金经理各段投资管理的数据进行拼接,那么空窗期的业绩如何处理呢?通常有如下几种方法: 方法1:将空窗期的日度收益率视作0;(缺点:市场普涨/普跌情况下,可能会低估/高 估处于空窗期的基金经理的收益能力;) 方法2:将空窗期的日度收益率视作同行所有基金经理日度收益率的中位数;(缺点:不符合客观事实;) 方法3:将空窗期的日期去除,不纳入基金经理业绩的评价;(缺点:样本业绩的时间不 连续,数据处理比较复杂;) 其中,方法3虽然在因子计算时复杂一些,但是克服了方法1和方法2的缺点,所以本文最后选择了方法3,计算基金经理业绩的时候,空窗期不纳入考核区间,按照该基金经理真实有在投资管理产品的日期计算。 图表3:将基金经理多段任职经历的业绩进行拼接 资料来源:国盛证券研究所绘制 2.3如何制定基金经理业绩比较基准指数 如何解决问题3:如何找到适用样本内所有基金经理的业绩比较基准。计算研究样本内所有的基金经理日度收益率的中位数(处于空窗期的基金经理不纳入计算),据此制作基金经理业绩比较基准指数,则该指数可作为统一的业绩比较基准,用于计算超额收益等 业绩指标。 图表4: