您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华创证券]:【宏观专题】因子投资与机器学习及业绩归因 - 发现报告
当前位置:首页/宏观策略/报告详情/

【宏观专题】因子投资与机器学习及业绩归因

2023-03-23张瑜华创证券甜***
【宏观专题】因子投资与机器学习及业绩归因

宏观研究 证券研究报告 宏观专题2023年03月23日 【宏观专题】 因子投资与机器学习及业绩归因 华创证券研究所 证券分析师:张瑜 电话:010-66500887 邮箱:zhangyu3@hcyjs.com执业编号:S0360518090001 联系人:李星宇 邮箱:lixingyu@hcyjs.com 相关研究报告 《【华创宏观】对接高标准经贸规则也是需要重视的改革动能——政策观察双周报第54期》 2023-03-21 《【华创宏观】SVB会是美国流动性危机的吹哨者吗?》 2023-03-12 《【华创宏观】疫后首份财政预算草案:强不强?钱花哪?怎么筹?》 2023-03-07 《【宏观专题】定量测算居民提前还款可能造成的影响》 2023-03-07 《【华创宏观】关于反通胀,历史会告诉我们什么?——海外论文双周报第14期》 2023-03-01 前言。 第十�期海外论文双周志聚焦因子投资,包括因子模型在机器学习发展背景下的研究进展以及因子投资的业绩归因。第一篇论文梳理了因子投资的经典模型,并介绍了机器学习在资产定价领域的最新进展,强调机器学习在解决高维 实证资产定价模型中的重要作用;第二篇论文介绍了一种度量主动型对冲基金获取贝塔收益能力的指标BA,发现主动型贝塔基金相比主动型阿尔法基金提供了更好的风险调整后收益,而且BA能够更好地预测基金未来的业绩表现。 因子模型、机器学习和资产定价 因子模型是资产定价中实证分析的主要框架。静态因子模型是最基础的因子模型,常见的研究框架包括三个方面,一是因子已知且可观测,二是因子及其暴露是隐含的,三是因子暴露是可观测的,但因子是隐含的。条件因子模型相比 静态因子模型更适合去描述单个资产以及时变的因子风险暴露,需要施加约束来识别模型,常见的建模方法包括Barra和工具变量PCA(IPCA)方法。机器学习在实证资产定价方法中的贡献包括测度预期收益、估计因子和风险 暴露、估计风险溢价以及估计随机折现因子及其暴露。测度预期收益方面,机 器学习方法的发展催生出股票收益预测的第三种方法,侧重于变量选择和降维 技术;估计因子和风险暴露方面,包括PCA、IPCA、自编码器学习等;估计风险溢价方面,包括三步回归、弱因子等;估计随机折现因子及其暴露方面,包括PCA、惩罚回归、深度学习等方法。 因子模型、风险溢价和阿尔法的统计特性的渐近识别方案。文献中有三种主要的渐近方案来表征因子模型、风险溢价和阿尔法的统计特性。传统的推断依赖于常用的大T、固定N的渐近性,第二种方案允许N和T同时无限增长, 第三种方案采用大N固定T的设计。在传统的OLS、GLS估计方法之外,许多文献开始采用PCA、风险溢价PCA以及有监督的PCA等机器学习方法对大N大T和大N小T类型的渐近形式进行识别。 主动贝塔对冲基金管理 两类投资风格的对冲基金:主动贝塔和主动阿尔法。本文将主动阿尔法定义为获取最终没有反映在因子暴露的收益,将主动贝塔定义为采取与宏观风险因子相关的方向性头寸。此外,本文在业绩归因、市场时机以及业绩预测领域对现有文献做了扩展,发现主动贝塔是对现有高级组合管理方法的补充。 数据选择以及统计梳理。从数据选择看,本文使用彭博的1994-2013年期间的对冲基金数据,彭博要求所有基金报告自成立以来的所有业绩,同时采取相关方法处理了幸存者偏见和回填偏差的影响。从样本统计看,代表性基金管理资 产7300万美元,管理费为1.5%,对投资者高于水位线以上的所有利润收取20%的激励费用,最低初始投资额为25万美元,赎回期为30天。 主动贝塔管理的测度。主动贝塔管理是试图采取与未来产生最高绝对回报的因子相关的持仓。本文引入两个变量以捕捉基本模型中所有因子不同方面的主动贝塔,其中SBS测度当期成功,而DBR捕捉因子择时的动态效应,然后引入SBS和DBR的平均等权平均值作为主动贝塔的综合度量。 主动阿尔法和主动贝塔的比较。根据主动贝塔管理的测度BA,本文创建了按照BA排名的基金组合,发现头部BA组合明显优于底部组合,同时提供更高的长期回报率、夏普比率以及信息比率。此外。头部主动贝塔基金在长期表现 上优于头部主动阿尔法基金,并且在短期表现方面经常比头部主动阿尔法基金表现得更好。 风险提示: 论文理解和翻译偏差。 投资主题 报告亮点 华创宏观团队定期发布海外论文双周志,针对全球热点事件,选取各国央行以及国际组织的研究报告,从而归纳出官方机构的观点以及研究视角。本期海外论文双周志将聚焦因子投资。 投资逻辑 本期海外论文双周志聚焦因子投资。第一篇论文梳理了因子投资的经典模型,并介绍了机器学习在资产定价领域的最新进展,强调机器学习在解决高维实证资产定价模型中的作用;第二篇论文介绍了一种度量主动型对冲基金获取 贝塔收益能力的指标BA,发现主动型贝塔基金相比主动型阿尔法基金提供了更好的风险调整后收益,而且BA能够更好地预测基金未来的业绩表现。 目录 一、因子模型、机器学习和资产定价5 (一)模型设定5 1、静态因子模型5 2、条件因子模型6 (二)方法论7 1、测度预期收益7 2、估计因子和风险暴露7 3、估计风险溢价8 4、估计随机折现因子及其暴露9 (三)渐近理论11 1、小N大T11 2、大N大T11 3、大N小T12 二、主动贝塔对冲基金管理13 (一)引言及相关文献13 1、引言13 2、相关文献13 (二)数据描述14 (三)研究方法及实证结果16 1、基准模型16 2、主动贝塔管理的测度17 3、统计总结18 4、BA:一个组合测度19 (四)主动阿尔法和主动贝塔的比较21 图表目录 图表1统计汇总:1994-201315 图表2主动管理的统计汇总19 图表3单个贝塔变量分离投资组合:2000-201320 图表4头部主动贝塔、阿尔法以及阿尔法t统计量投资组合的样本外表现:2000-2013 ...................................................................................................................................22 图表5对冲基金组合累计财富比较:2000-201323 图表6BA和阿尔法组合回报的累计差异:2000-201323 一、因子模型、机器学习和资产定价1 因子模型是用于对股权回报建模的工具,因为它们提供了对回报的截面相关性结构的一个简约的统计描述。因子模型是从早期的资产定价理论演变而来的,最著名的是Sharpe的CAPM(1964)和Merton的ICAPM(1973)。这些和其他开创性因素模型使用可观察到的金融和宏观经济变量作为由经济理论驱动的风险因子。 Ross(1976)的套利定价理论(APT)后来通过无套利条件,提供了回报因子结构和风险溢价之间严格的经济联系。APT的一个重要创新是能够直接谈论基本的经济概念,如风险暴露和风险溢价,而不需要对这些因子进行经济解释。APT对共同因子结构的关注 (可以由任何类型的因素表示,无论是可观察的还是不可观察的,交易的或非交易的)引发了一系列调查,主要是统计导向的回报模型。因此,因子模型已成为学者和从业者最广泛采用的单一实证研究范式。特别是,APT为回报打开了进入潜在因子模型的大门。APT和潜在因子模型与无监督和半监督的机器学习密切相关,可以被视为实证资产定价中机器学习方法革命的催化剂。 (一)模型设定 1、静态因子模型 静态因子模型可以写成: 其中𝑟�是�×1的向量,表示测试资产(例如规模和价值的双重分类投资组合)相对于无风险利率的超额回报,�是�×�的因子暴露矩阵,𝑣�是�×1的因子新息向量(均值为零), 𝑢�是�×1的异质误差向量。 预期收益率总是可以被分解为: 其中�是�×1维的风险溢价向量,�是�×1维的定价误差向量。这个公式总是成立的, 因为右边的自由度比左边多,但是Ros(s1976)提出的资产定价理论(APT)以及Huberman (1982)、Ingersoll(1984)和Chamberlain&Rothschild(1983)的后续研究预测,当�增加时,无渐近套利意味着𝛼�∑−1�<∞,其中∑�是�的协方差矩阵。 �� 在金融文献中,最常见的框架假设因子是已知和可观测的。换句话说, 其中µ是𝑓�的(总体)期望的某个未知参数。如果因子是可交易的组合(例如Fama和French在1993年和2015年提出的因子),那么µ=𝛾:可交易因子的风险溢价就是其预期超额收益。 第二个框架最近重新获得了人们的关注,但可以追溯到Connor&Korajczyk(1986)早期的研究。这个框架假设所有因子和它们的暴露都是隐含的,这放宽了上述设定中所有因 1Giglio,Stefano,BryanT.Kelly,andDachengXiu."Factormodels,machinelearning,andassetpricing."MachineLearning,andAssetPricing(October15,2021)(2021). 子都为已知和可观测的相对苛刻的假设。 第三个框架假设因子暴露是可观察的,但因子是隐含的。这可以说是从业者中最为普遍的框架,最初是由Rosenberg(1974)提出的MSCIBarra模型。该模型的流行源于其便捷地适应了个体股票收益的时间变化的风险暴露。 2、条件因子模型 有人可能会认为公式(1)中的静态模型适用于某些资产组合(尽管即使在这种情况下,静态假设也是可疑的),但它显然不适用于大多数单个资产。然而,重要的是,模型能够描述单个资产的行为,而不仅仅是分类组合,以更全面地了解资产市场中的各种异质性。一旦我们开始考虑单个资产,条件模型的设定就变得至关重要。例如,单个股票的风险暴露很可能随着公司的发展而随时间变化。此外,具有固定到期日和非线性支付结构(例如债券和期权)的资产在其到期日滚续或基础资产价值变化时会经历风险敞口的机制变化。在这种情况下,因子模型应该适应时间变化的条件风险暴露。它的一般形式是: 这个公式描述了一种条件因子模型,其中𝑟𝑡̃和𝑢̃�是单个资产的超额收益和异质性误差的 �×1向量。在这个方程中,𝛽𝑡−1𝛾𝑡−1是通过对共同风险因子𝑣�暴露获得的条件风险溢价,因为资产在𝑣�上每单位的条件贝塔都可以获得𝛾𝑡−1的条件补偿。𝛼𝑡−1项包括任何超额补偿,这些补偿与因子暴露无关。 很明显,公式(4)的右边自由度太高,模型无法在没有额外限制的情况下被识别。一个额外限制的例子是Rosenberg(1974)的模型,它强制要求𝛽𝑡−1=𝑏𝑡−1𝛽,其中𝑏𝑡−1是一个 �×�的可观察特征矩阵,�是N×K的参数向量。在这种情况下,公式(4)的一般形式 变成了: 其中,𝑓̃:=𝛽(�+�)是一个新的潜在因子的�×1向量,𝜀̃:=�+𝑢̃。这是MSCI �𝑡−1��𝑡−1� Barra模型原型,它因其在建模单个股权回报方面的简单性和通用性而被从业者所接受。 Kellyetal.(2019)提出了一种新的建模方法,称为工具变量PCA方法(IPCA)。IPCA继承了Barra模型的通用性和可操作性,但通过内置的维数缩减避免了其统计效率低下的问题: 公式(6)的左边部分是已知的,它表示特征数据𝑏𝑡−1和未知系数�之间的线性关系,而右边的部分是未知的,需要通过计算估计得到。这个模型与公式(1)中的组合的静态模型存在直接关联。如果我们在每个�将𝑏𝑡−1投到公式(6)的两侧,则可以得到该关联。 这与静态因子模型(1)相呼应。直觉是,只要特征驱动风险敞口,通过这些特征进行分类就可以消除分类组合的风险敞口的时间变化。因此,静态组合表示可以直接应用于适当排序的相关特征的组合;或者,可以使用个股作为测试资产,使用IPCA明确地考虑 与其特征相关的时间变化的风