主动权益基金行业调仓监测方法论研究卡尔曼滤波与基于拟合残差的改进 2022年9月22日 证券分析师 郭子睿投资咨询资格编号 S1060520070003 GUOZIRUI807@pingan.com.cn 王近投资咨询资格编号 S1060522070001 WANGJIN942@pingan.com.cn 本报告仅对基金行业进行分析,不包含对证券及证券相关产品的投资评级或估值分析。 公募基金在行业维度的调仓行为具有重要的参考价值,但基金的股票持仓信息披露频率低、披露时间相对滞后。在采用卡尔曼滤波模型监测主动权益基金行业调仓时,由于模型因子无法及时反映基金新进配置某一行业时的信息,可能会影响行业调仓的监测效果。针对该问题,报告从模型拟合残差的角度探讨了优化调仓监测的方法。 利用卡尔曼滤波监测公募基金行业调仓:1)卡尔曼滤波方法常用于线性系统中系统状态的最优化估计,其优势是根据新观测值不断修正和优化对系统 状态的估计。2)主动权益基金除了定期披露的股票持仓数据,每日净值的变化包含了基金持仓变化的信息,基于这些信息来监测基金持仓变化是卡尔曼滤波方法很好的应用场景。3)选取10个重仓股因子、1个非重仓股组合因子和1个债券资产因子,以半年度为监测窗口期,对全市场主动权益基金 2019年至2022年半年末区间每半年内的行业调仓情况进行了监测,并与实际调仓对照来统计胜率。2019年以来回测结果显示,采用卡尔曼滤波方法的行业调仓监测胜率平均达到66%。 基于拟合残差的基金调仓监测优化:1)当基金新进配置某一行业时,模型因子收益率及初始仓位信息无法反映该持仓变化,会影响行业调仓的监测效 果。2)若监测期内基金模拟净值明显偏离其实际净值,对于日收益率偏离与行业指数涨跌幅一致性概率高的行业,可能代表了基金的调仓方向。3)从基金维度看,基于拟合残差对基金调仓监测进行改进后,有53.1%的基金行业调仓监测胜率得到提升。4)从行业维度看,整个监测期内的每个半年内,基金整体增持或减持前十大行业中,模型监测方向保持一致的胜率平均达到81%。 2022年三季度公募基金最新行业调仓监测结果:截至2022年9月9日,净增持电力设备、国防军工、电子、机械设备、非银金融行业的基金数量最多, 净减持食品饮料、医药生物、有色金属、房地产、建筑材料行业的基金数量最多。 风险提示:1)本报告是基于公募基金历史数据进行的客观分析,样本基金可能存在错漏导致结果偏差。2)基金过往的情况不代表未来表现。3)基金行业调仓监测模型的估计结果存在误差。4)本报告涉及的基金不构成投资 建议。 基 金报 告 基 金动态跟踪报告 证券研究报告 正文目录 一、利用卡尔曼滤波监测公募基金行业调仓4 1.1卡尔曼滤波方法4 1.2基于卡尔曼滤波方法的调仓监测胜率回测4 二、基于拟合残差的基金调仓监测优化6 2.1卡尔曼滤波方法的局限性6 2.2基于拟合残差改进对基金新进入行业的监测6 三、2022年三季度公募基金最新行业调仓监测结果8 四、附录:卡尔曼增益矩阵K内涵介绍8 五、风险提示9 图表目录 图表1基金前五大重仓行业成分股收益率分布(%)5 图表2申万一级行业间收益率相关系数分布直方图5 图表32019年以来不同监测胜率的基金数量统计(只)6 图表4某基金2020H2持仓监测模拟净值及误差6 图表5某基金2022H1持仓监测模拟净值及误差6 图表6基于拟合残差改进后有53.1%的基金行业调仓监测胜率得到提升(只)7 图表7基于拟合残差改进后前十大增持/减持行业的监测胜率平均达到81%7 图表82022Q3公募基金净增持数量TOP5行业和净减持数量TOP5行业8 公募基金是股票市场重要的机构投资者类型之一,其在行业维度的调仓行为具有重要的参考价值。但是,基金的股票持仓信息披露频率低、披露时间相对滞后。公募基金仅在中期报告和年度报告中披露全部股票持仓,中期报告在上半年结束后2个月内披露,年度报告在每年结束后3个月内披露。为此,报告从基金净值拟合的角度探讨了优化主动权益基金调仓监测的方法。 一、利用卡尔曼滤波监测公募基金行业调仓 1.1卡尔曼滤波方法 卡尔曼滤波(KalmanFiltering)常用于线性系统中系统状态的最优化估计,其优势是根据新观测值不断修正和优化对系统状态的估计。在线性系统中,由于观测数据经常受到系统中噪声数据的干扰和影响,对系统状态的估计也可以看作是一个滤波过程。卡尔曼滤波是一种高效率的递归滤波方 法,能够根据系统中采集观测到的数据,从一系列存在测量噪声的数据中估计动态系统的状态。目前已广泛应用于通信、导航、制导与控制等领域。 主动权益基金除了定期披露的股票持仓数据,每日净值的变化包含了基金持仓变化的信息,基于这些信息来监测基金持仓变化是卡尔曼滤波方法很好的应用场景。我们对基金收益率𝑅�和因子收益率 𝑟�建模,满足以下状态观测方程: 𝑅�=𝑟�∗𝑊�+𝑣�(1) 其中,𝑊�为基金在各个因子的仓位暴露,是无法观测到的状态变化;𝑣�是服从高斯分布的误差项。假定基金经理的仓位调整是渐进式的,服从随机游走过程。因子仓位暴露𝑊�在t-1时刻的因子仓位 𝑊�−1的基础上调整,即服从以下状态预测方程: 𝑊�=𝑊�−1+𝑤�(2) 基金仓位的卡尔曼滤波估计包含“预测”与“更新”两个步骤: � 1)预测:根据状态预测方程,由前一时期仓位估计最新仓位,得到基金仓位的先验估计𝑊̃−: 𝑊̃−=𝑊̃(3) ��−1 � � 2)更新:把状态的先验估计𝑊̃−代入状态观测方程,会发现由先验估计仓位计算的收益率和基金实际收益率存在误差,即实际收益率存在超预期的部分:𝑅�−𝑟�∗𝑊̃−。用超预期的部分对𝑊�的状态先 验估计进行更新和修正如下,得到最优估计: 𝑊̃=𝑊̃−+�(�−�∗𝑊̃−)(4) ������ 其中,𝐾�是著名的卡尔曼增益矩阵,代表了系统中“估计误差”与“观测误差”的比重。 1.2基于卡尔曼滤波方法的调仓监测胜率回测 以半年度为监测窗口期,对全市场主动权益基金2019年至2022年半年末区间每半年内的行业调仓情况进行监测,并与实际调仓对照来统计胜率。回测基金样本具体条件如下:1)普通股票型、偏股混合型、最近4个报告期的基金的股票仓位>60%的灵活配置型基金。2)基金于2020年以前成立。 3)剔除行业主题基金,根据基金合同约定的业绩比较基准,将基准中包含特定行业主题指数的基金认定为行业主题基金。经过筛选后的基金样本共包含1756只基金。 因子选择上,选取10个重仓股因子、1个非重仓股组合因子和1个债券资产因子,通过个股估计仓 位进一步计算行业配置来监测基金调仓情况。考虑到行业指数因子对个股的表征度较低、行业间相关性强等因素,我们将因子下沉至个股层面,选择10个重仓股因子、1个非重仓股组合因子和1个 债券资产因子共12个因子。一是行业内个股表现分化,行业指数因子对基金相关行业持仓收益的代 表性较低。我们对截至2022年半年末主动权益基金前五大重仓行业内个股的收益率进行了统计,个股间收益表现分化:电力设备、食品饮料、医药生物、电子和有色金属共五个申万一级行业中,成分股今年以来收益率的极差(最大值与最小值之差)平均达到239%。二是行业指数因子间具有较强的相关性,2022年以来截至2022/9/9,31个申万一级行业间日收益率的相关系数大于0.5的概率达到72.6%。另外,因子数量明显少于选择行业指数因子时的数量,也降低了估计难度。具体模型如下: 𝑖=1 𝑅�=∑10重仓股因子 𝑖� ∗� 𝑖� +非重仓股组合 � ∗𝜑� +债券资产因子 � ∗𝛾� +𝑣� (5) 图表1基金前五大重仓行业成分股收益率分布(%)图表2申万一级行业间收益率相关系数分布直方图 资料来源:Wind,平安证券研究所;区间自今年以来截至2022/9/9资料来源:Wind,平安证券研究所;区间自今年以来截至2022/9/9 重仓股因子取最近定期报告披露的重仓股,将最近披露全部持仓剔除最新重仓股后看作非重仓股组合,作为非重仓股因子,债券资产因子取中债国债财富指数。比如,在监测截至2022年半年末的 持仓情况时,重仓股因子取截至2022年一季末的前10大重仓股,截至2021年末全部持仓剔除截至2022年一季末的前10大重仓股后作为非重仓股组合,以个股仓位占非重仓股总仓位的比重作为权重,对非重仓股收益率加权计算得到非重仓股组合因子收益率。 模型因子初始值设定上,重仓股、非重仓股组合、债券资产因子的初始仓位取最近定期报告披露的仓位信息。比如,在监测截至2022年半年末的持仓情况时,初始重仓股仓位为截至2022年一季末 10只重仓股的仓位,非重仓股组合初始仓位为截至2022年一季末的非重仓股仓位,债券资产因子 仓位为截至2022年一季末的非股票资产仓位。结合基金实际运作,对因子的估计结果施加以下后约束:每个重仓股因子仓位均不超过10%、因子仓位均不小于0、所有因子仓位之和等于100%。 2019年以来回测结果显示,采用卡尔曼滤波方法的行业调仓监测胜率平均达到66%。对每个半年末的因子滤波估计仓位,按照申万一级行业汇总得到各个行业的配置仓位。与基金半年度初的实际 行业配置相比,半年内基金增持3%或减持3%以上仓位的行业中,卡尔曼滤波估计调仓方向与实际调仓方向一致的行业占比平均达到66%。从结构上来看,1756只样本基金中,监测胜率介于60%~70%的基金数量777只,占比达到44.3%,介于70%~80%的基金数量422只,占比达到24%,超过80%的基金数量126只,占比达到7.2%。 图表32019年以来不同监测胜率的基金数量统计(只) 资料来源:Wind,平安证券研究所,数据截至2022/6/30 二、基于拟合残差的基金调仓监测优化 2.1卡尔曼滤波方法的局限性 当基金新进配置某一行业时,模型因子收益率及初始仓位信息无法反映该持仓变化,会影响行业调仓的监测效果。以某只行业配置经常变化的基金为例,该基金在2020年下半年新进增持石油石化、商贸零售行业,截至2020年末石油石化、商贸零售行业仓位分别超过15%、4%,由于该区间内的 重仓股因子和非重仓股组合因子未包含该持仓变动信息,基金模拟净值相对实际净值的误差在2020 年11月后明显提升,最高达到6%;同样,该基金在2022年上半年新进增持医药生物行业,截至 2022年半年末医药生物行业仓位超过20%,基金模拟净值相对实际净值的误差绝对值最高达到4%。 图表4某基金2020H2持仓监测模拟净值及误差图表5某基金2022H1持仓监测模拟净值及误差 资料来源:Wind,平安证券研究所;数据截至2020/12/31资料来源:Wind,平安证券研究所;数据截至2022/6/30 2.2基于拟合残差改进对基金新进入行业的监测 若监测期内基金模拟净值明显偏离其实际净值,对于日收益率偏离与行业指数涨跌幅一致性概率高的行业,可能代表了基金的调仓方向。由于模型因子主要包含历史持仓信息,基金新进入行业信息 体现在模型的拟合残差中。我们利用卡尔曼滤波方法的拟合残差数据,按照以下步骤对基金新进入行业进行预测,尝试改进对基金行业调仓的监测:1)若监测期内基金模拟净值相对实际净值的偏离度超过1%,则认定为基金可能发生新进入行业的情形。2)以10个交易日为监测窗口,选取模型 日收益率残差最高的10个交易日,在每个交易日内对与残差方向最匹配的5个申万一级行业进行标记。比如,若收益率残差为正,代表滤波模型无法解释有正收益贡献的行业持仓,则选取该交易日内涨幅最大的5个行业进行标记;若收益率残差为负,代表滤波模型无法解释有负收益贡献的行业 持仓,则选取该交易日内跌幅最大的5个行业进行标记。3)若某个行业被标记次数达到5次及以上,则认为基金可能调向了该行业。 从基金维度看,基于拟合残差对基金调仓监测进行改进后,有53.1%的基金行业调仓监测胜率得到提升。按