您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华安证券]:“学海拾珠”系列之一百八十二:基于网络和机器学习的因子、资产和混合配置 - 发现报告
当前位置:首页/其他报告/报告详情/

“学海拾珠”系列之一百八十二:基于网络和机器学习的因子、资产和混合配置

2024-03-14严佳炜、吴正宇华安证券叶***
“学海拾珠”系列之一百八十二:基于网络和机器学习的因子、资产和混合配置

金融工程 专题报告 基于网络和机器学习的因子、资产和混合配置 ——“学海拾珠”系列之一百八十二 主要观点: 报告日期:2024-03-14 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 分析师:吴正宇 执业证书号:S0010522090001邮箱:wuzy@hazq.com 相关报告 1.《股息收益率、股息增长率和回报可预测性——“学海拾珠”系列之一百八十一》 2.《基金投资者能否从波动率管理中获益?——“学海拾珠”系列之一百八十》 3.《如何使用强化学习优化动态资产配置?——“学海拾珠”系列之一百七十九》 4.《高成交量回报溢价与经济基本面 ——“学海拾珠”系列之一百七十八》 5.《基金经理技能之卖出能力的重要性——“学海拾珠”系列之一百七十七》 6.《美元beta与股票回报——“学海拾珠”系列之一百七十六》 7.《基于残差因子分布预测的投资组合优化——“学海拾珠”系列之一百七十�》 8.《历史持仓回报会影响基金经理后续选股吗?——“学海拾珠”系列之一百七十四》 本篇是“学海拾珠”系列第一百八十二篇,作者利用传统和替代配置技术对因子和资产配置组合进行研究和比较。首先,作者从理论层面介绍关联网络和有向网络,并与投资组合管理相结合;其次,应用图论和网络分析研究资产和因子之间的关系;此外,作者展示各配置技术在纯因子、纯资产和混合配置中的实证结果;最后,运用LASSO和交叉验证来研究策略的风险敞口和找到最优配置方案。 回到国内市场,资产和因子配置领域尚有较大的研究空间,机器学习和网络技术不失为一个良好的切入角度,值得探索。 资产和因子之间存在较强的相互关联性 网络结果很容易解释资产和因子之间的相互联系;网络中每个集群 都包含一个价值因子和动量因子,与其他因子和资产相连。对于专业投资者来说,用预测资产和因子之间联系的预测模型将有助于解决风险与配置问题。 包含因子和资产的混合配置可获得最大的收益 各策略的实证结果表明,资产配置使用有向网络更好,并由显著的中心性得分的美国国债和货币收益驱动;而因子配置使用关联网络和逆方差效果更好,可产生有利的风险收益参数,主要有FFC因子的重要性 得分所驱动。混合配置的实证结果发现因子在投资组合中重要性的信息,即更建议投资者考虑混合配置策略。 在投资组合管理中运用机器学习有助于帮助投资者找到配置方案 运用LASSO对因子和资产具有明显的收缩作用和显著的截距,突 出了特征选择的重要性和分散性,获得了更稳健的资产配置;后进行交 叉验证,根据MSE选择最佳的模型,帮助投资者理解模型价值,找到最优配置方案。 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 敬请参阅末页重要声明及评级说明证券研究报告 正文目录 1引言4 2数据6 3如何衡量资产和因子的连通性?7 3.1关联网络VS.有向网络7 3.2网络特性8 4从网络到投资组合管理9 4.1投资组合配置9 4.2投资组合度量的比较9 5因子和资产(不)相关吗?10 6投资组合配置的实证结果13 6.1纯因子配置13 6.2纯资产配置14 6.3混合配置15 7投资组合管理中的机器学习16 7.1投资组合配置:特征重要性17 7.2交叉验证17 8结论19 风险提示:20 图表目录 图表1文章框架4 图表2资产、因子回报和总互惠性(2003.01-2017.12)11 图表3回报与总互惠性之间的预测关系11 图表4资产集群和因子MST网络(2003.01-2017.12)12 图表5资产和因子的层次聚类(2003.01-2017.12)13 图表6因子ALPHA中心性得分(2003.01-2017.12)14 图表7纯因子配置的绩效表现14 图表8资产ALPHA中心性得分(2003.01-2017.12)15 图表9纯资产配置的绩效表现15 图表10资产和因子ALPHA中心性得分(2003.01-2017.12)16 图表11混合配置的绩效表现16 图表12资产和因子配置策略的LASSO回归17 图表13混合配置策略的LASSO回归18 图表14交叉验证:样本内和样本外的LASSO回归19 1引言 图表1文章框架 资料来源:华安证券研究所整理 对于作为与经济网络相关的因子和资产已经进行了大量的研究。正如Fabozzi和LópezdePrado(2017)所认为,经济网络提供了经济关系的视角。在本文中,本文作者将资产和因子定义为网络中的节点,将它们之间的联系定义为边。因此,本文使用一个由相互作用的资产和因子所代表的网络。 最近,有关网络和计量经济模型的研究数量有所增加。然而,据本文作者所知,基于回报的因子和资产图的网络分析尚未被研究和应用于多资产、多因子和混合投 资组合配置中。在本文中,作者使用基于中心性的技术研究了资产和因子之间的关系。此外,本文作者在传统和替代投资组合优化方法中使用了有向网络和基于相关性的网络,从而得出了配置结果。本文的目标是通过为投资经理提供一个新颖的方法和对构建因子和资产配置提供广泛的分析来填补研究空白。本文对这些策略进行评估,并提出切实可行的方法,使传统方法和应用机器学习与人工智能最新技术的方法都能从本文的方法中获益。 本文研究的主要思路不是创建和测试投资策略,而是根据Simonian(2019)的精神,使用传统和替代资产配置技术对因子和资产配置组合进行比较。为了测试资产配置方法,本文采用了资产管理中的最新方法:网络分析和基于中心性的配置 算法。具体来说,本文比较了基于最小方差优化(MVP)、逆方差加权(IVW)、等权(EW)、基于中心性的关联网络(CCN)和基于中心性的有向网络(CDN)的策略。根据具体的绩效评价指标和风险指标对这些策略进行评估。本着LópezdePrado(2019)的精神,本文作者采用分层聚类的方法来推导出所测试的资产配置方法中的最佳策略。 有几项前人研究与本文研究相关。LópezdePrado(2016)成功地将图论和机器学习整合到资产管理行业中。Kaya(2015)、Raffinot(2018)以及Baitinger和Papenbrock(2017)利用关联网络研究了资产的相互关联性,并推导出了资产配置。Bender、Sun和Thomas(2019)以传统方式比较了资产配置和因子配置。Bender、Blackburn和Sun(2019)对因子投资组合使用了不同的权重方案,并评估了其重要性。然而,Arnottetal.(2019)认为无论是因子还是暴露于这些因子的基金,都不是独立的。最近,Ma、Jacobsen和Lee(2019)以及Simonian和Wu (2019)从机器学习的角度研究了多资产投资组合。 网络分析为何重要?LópezdePrado和Fabozzi(2017)已经强调了金融分析中对替代方法的需求。网络分析提供了有关基于因子的连通性、关系以及风险如何在网络之间转移的重要信息。学术研究和实证研究都记录了因子投资中的拥挤现象。因此,风险是在网络内部转移。单个实体,如承载风险因子敞口的基金,承担并可能将风险转移给整个市场。 Balasubramanianetal.(2019)以及Konstantinov和Rebmann(2019)认为受共同因子暴露驱动的一对基金可能对彼此产生因果影响。实证研究表明市场动态是由共同因子驱动的。最常用的因子包括价值因子(高账面市值比减低账面市值比[HML])、规模因子(小市值减大市值[SMB])、市场风险因子(MKT-RF)和动量因子(MOM),Fama和French(1992、1993)以及Carhart(1997)对此都有记载。在本文的分析中,作者使用了具有深厚学术和实践基础的知名因子;这些因子来自AQRCapitalManagement,LLC和KennethFrench的网站。此外,本文使用了一组广泛使用的资产,与最近文献中广泛使用的资产类似。因子与资产之间的关系是本文研究的问题之一。 本文作者从几个层面进行分析。首先,本文试图提供一些关于资产(或因子)之间相互作用的一些见解。其次,本文旨在研究风险从一种资产或因子转移到另一种资产或因子的程度。换句话说,测量重要性得分,找出相互关联度最高的资产和因子,并证实之前的研究结果:价值因子和动量因子确实无处不在。最后,本文使用传统方法和基于网络的替代方法(机器学习和使用收缩方法的正则化(LASSO))测试了不同的因子和资产配置技术。具体来说,作者发现,正如Konstantinov和 Rusev(2020)所指出的,有向网络在资产配置中的应用效率更高。对于因子配置, 关联网络的结果更好。 本文作者认为金融市场既可以表示为有向网络,也可以表示为无向网络。本文在2003年01月至2017年12月的样本中运行该过程,以深入了解一段时间内的相互关联性,推导出资产配置策略,并应用正则化和交叉验证。本文重点关注与投资相关的实际应用。Arnott、Harvey和Markowitz(2019)强调了利用回测和机器学习来帮助改善研究文化的必要步骤。遵循他们的观点,本文的目标是进行良好的研究,而不是寻找制胜策略。后者可能是未来研究的课题。 综上所述,本文发现因子之间的相互关联性远远高于资产之间的相互关联性。在这方面,作者认为与之前的研究一致,特定的因子是拥挤的。资产回报的下降会导致相互关联性的下降,反之,随着资产回报的恢复,相互关联度会上升。然而,这些相互关联的因子在资产投资组合中提供了更广泛的分散性回报。此外,本文作者还发现,在网络背景下,资产和因子与动量因子和价值因子相关。 投资组合管理的含义和步骤是什么?本文作者表明与既定模型相比,基于中心性得分的网络技术可提供有效的因子投资组合优化技术。另外,使用有向网络或逆方差技术可以更好地进行资产配置。本文运用机器学习算法来研究这些策略的风险敞口。本文的结果与之前关于资产配置和因子配置方面的研究结果一致。因此,投资者应使用基于网络的方法进行配置、风险管理和监控,并使用机器学习技术。 2数据 在分析中,本文考虑了两个反映不同经济环境的广泛数据集,每个数据集都由2001年01月至2017年12月期间的16个因子和16种资产组成。数据频率为每月一次。第一个数据集是纯因子数据集,在学术界和实践研究都被广泛考虑,由以下因子组成: 股票溢价,即美国股市的超额收益,表示为MKT-RF。 标准的Fama和French(1992,1993,2015)因子,包括价值因子(高减低)、规模因子(小减大)、盈利因子(强减弱)和投资因子(保守减激进),分别表示为HML、SMB,RMW和CMA。 滞后一个月的股票溢价,即股票总市值,表示为𝑀𝑉(�−1),这是一个非流动性因子,存在于股票、信贷和债券久期中。 基于Asness、Moskowitz和Pedersen(2013)以及Moskowitz、Ooi和Pedersen(2013)的商品、货币、债券和股票的价值和动量策略的时间序列回报,由AQRCapitalManagement,LLC提供;这些分别表示为FI.VALUE、FI.MOM、FX.MOM、FX.VALUE等。 根据Frazzini和Pedersen(2014),多空股票对赌beta因子(BAB)的超额收益,其中包括做多低beta证券和做空高beta证券的投资组合,由AQRCapitalManagement,LLC提供。 第二个数据集由资产组成,与以往研究中使用的资产数据集密切相关。本文作者认为投资者对广泛的分散化投资感兴趣,包括传统资产和另类资产。该数据集包括新兴市场、国际股票、公司债券、私募股权、大宗商品回报、货币和对冲基金回报: 标准普尔500指数回报率,表示为S&P500 MSCI新兴市场指数,表示为EM ICEBofAML美国企业指数,表示为US.Corp ICEBofAML美国高收益公司债券指数,表示为US