基于端到端神经网络的风险预算与组合优化 ——“学海拾珠”系列之一百七十三 金融工程 专题报告 主要观点: 报告日期:2024-1-4 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 分析师:吴正宇 执业证书号:S0010522090001邮箱:wuzy@hazq.com 相关报告 1.《MemSum:基于多步情景马尔可夫决策过程的长文档摘要提取——“学海拾珠”系列之一百六十四》 2.《均衡配置宏观经济因子:分散效果如何?——“学海拾珠”系列之一百六十�》 3.《基金波动率来源与基金业绩——“学海拾珠”系列之一百六十六》 4.《企业季度投资激增与股票横截面收益——“学海拾珠”系列之一百六十七》 5.《机器学习与基金特征如何选择正Alpha基金?——“学海拾珠”系列之一百六十八》 6.《资产增长率在资产定价中的作用 ——“学海拾珠”系列之一百六十九》7.《如何改进短期反转策略?——“学海拾珠”系列之一百七十》 8.《如何衡量基金产品创新与差异化 ——“学海拾珠”系列之一百七十一》 9.《低风险组合构建:基于下行风险的缩放策略——“学海拾珠”系列之一百七十二》 本篇是“学海拾珠”系列第一百七十三篇,研究了基于端到端神经网络对于资产配置的应用。首先,作者结合以往的研究,用七种资产构成了一个资产组合,以夏普比率作为调优的目标函数来训练端对端的神 经网络,经过训练和超参数调整,得到了优于名义风险平价的模型,并通过了显著性检测。此外,作者还在风险预算层之后嵌入了一组随机门控器用于控制相应的资产风险预算,从而避免投资组合由于低波动性承担损失。该模型取得良好的效果,并且优于其他模型。 回到国内市场,风险预算是资产配置领域中一类经典的模型,通过神经网络改进原有模型的不足,并实现端对端学习有助于提升组合表现。 端到端学习方法的创新应用 本文通过端到端的学习方法来解决投资组合优化问题,将预测和优化任务集成到一个全连接的神经网络中。这种方法避免了直接训练相关参数,而是用神经网络自主地确定用于估计的参数的最优值。通过与其 他模型进行比较,这种集成方法提供了一种更有效的方式来处理和解决复杂的投资策略问题。 引入随机门控机制 本文将资产选择特性引入风险分配投资组合,通过随机门控机制过 滤掉不希望持有的资产。这种机制有助于提升投资组合的整体表现,并 在实证中超越基准。这种策略的引入可能是对传统投资组合策略的重要改进,提供了一种在保持投资组合分散化的同时提高资产选择质量的方法。 框架整合了预测与优化任务 本文通过集成预测和优化任务,在一个端到端的学习框架中提出了 一种创新的投资组合优化方法。这种方法使用无模型和有模型网络在模 型的解释性和复杂性之间提供不同的权衡。资产选择功能的引入进一步增强了基于风险分配的投资组合的整体表现,并降低了组合的风险。 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 敬请参阅末页重要声明及评级说明证券研究报告 正文目录 1引言4 2文献回顾5 3模型构建6 4模拟研究7 4.1预处理7 4.2结论7 5真实市场数据9 6风险预算投资组合中的资产选择9 6.1在市场数据集上的表现11 6.2低波动性和低回报资产的表现12 7结论13 风险提示:14 图表目录 图表1:文章框架4 图表2:当调优目标选择为夏普比率时,模拟数据上的计算结果。7 图表3:当调优目标选择为累计回报时,模拟数据上的计算结果8 图表4:2011-2021年期间ETF的表现统计数据9 图表5:资产筛选的随机门控器10 图表6:基于模型的带有资产过滤门控器方法的计算图11 图表7:2020年后端到端投资组合带随机门控器和名义基准的样本外绩效12 图表8:2017年至2021年6月样本外期间的年化绩效指标12 图表9:端到端投资组合带有随机门控器和基准的样本外(2017年至2021年6月)绩效13 图表10:2017年至2021年6月样本外期间的年化绩效指标13 1引言 图表1:文章框架 资料来源:华安证券研究所整理 机器学习和深度学习算法已经成为各个领域研究人员常见的方法论,这得益于大数据和计算工具的进步。同样,量化金融领域也利用这些方法为金融中的各种领域的问题带来了新的解决方法。预测建模任务是机器学习方法和深度学习广泛应用的主要领域之一。这些方法不仅有助于提高模型性能,还允许探索不同的数据集,如高维度或替代性数据。然而,在许多问题中,预测结果并非最终目标,而是过程中的一部分。 投资组合优化是金融领域中的一个著名问题,它始于马科维茨投资组合理论 (Markowitz(1952)),可分为两个部分:预测和优化。一些常见的预测任务包括:为优化问题预测资产参数(例如因子模型、股票回报预测、协方差矩阵结构等),为制度(regime)转换投资组合进行制度预测等。与传统模型相比,这些方法可以提高预测性能。然而,在投资组合优化中,资产参数预测并非终极目标,而是资产分配决策任务的中间步骤。解决这个问题的一般方法是分两个阶段建模:(1)使用 预测模型生成模型参数,(2)通过优化问题将预测结果纳入决策,用于投资组合构建。如果预测模型性能良好,这种两阶段方法是有益的。然而,当预测模型的准确性不高时,通常在资产回报预测中会出现这种情况,两阶段模型可能导致主要任务的次优决策。这个问题是由于在每个阶段为不同目标进行训练。预测模型的训练目标是最小化预测误差,而优化问题通常是根据决策损失函数进行优化。因此,这两阶段模型可能导致误差累积,从而产生次优决策。 这篇文章的目标是通过一种端到端的学习方法来解决投资组合优化问题。关键创新点在于将预测和优化任务集成到一个完全连接的神经网络中,网络生成投资组合决策作为其输出。值得注意的是,该方法避免直接训练相关参数的数值。相反,神经网络自主确定用于估计的参数的最优值。 此外,论文提出了一种将资产选择属性引入风险分配投资组合的新方法。嵌入的随机门机制用于过滤投资组合中不希望持有的资产。这种资产选择法有助于提升投资组合绩效,并在市场数据中超越基准。 总的来说,该文章通过在一个端到端的学习框架中无缝集成预测和优化任务,提出了一种创新的投资组合优化方法。使用无模型和有模型网络在解释性和复杂性 之间提供了不同的权衡,而资产选择方法的引入增强了风险分配投资组合的整体性 能。 有关端到端学习方法在整合预测和决策任务方面的激动人心的发展。在这篇论文中,我们遵循Donti等人(2017)和Agrawal等人(2019)的研究,并提出了一个端到端的投资组合构建框架。在这里,我们选择风险预算投资组合优化(Bruder和Roncalli(2012))作为端到端学习系统中的策略规则,并将其实现为神经网络中的可微分优化层。风险预算投资组合技术是一类用于构建基于风险的投资组合的策略规则,其中一些是基于风险的分散而不考虑预期资产回报的方法。风险预算投资组合具有经典Markowitz方法所没有的几个理想特性,并且不受回报估计困难的影响。等风险贡献或风险平价是风险预算投资组合的一个特殊版本,其中所有风险预算均相等设置(Maillard等人(2010))。由于其在各种市场环境下的稳健性和对参数估计的低敏感性,它引起了越来越多的关注(Ardia等人(2017))。根据纽伯格曼资产管理(Kaya(2020)),基于风险平价策略的资产管理规模约为1200亿美元(Fabozzi等人(2021))。此外,该方法可以根据投资者的偏好与不同的投资组合优化技术一起使用。在本文中,作者提出了一个整合了投资组合构建中的预测和优化步骤的框架,并且该框架还可以扩展到许多涉及预测和优化任务的其他量化金融问题。 论文的其余部分组织如下。第2节主要介绍了有关端到端学习的相关研究,并 呈现了不同的方法。第3节解释了端到端投资组合模型方法,采用神经网络和优化 层。第4节展示了模拟研究的结果,第5节呈现了对真实市场数据进行广泛实证的 计算结果。第6节展示了风险预算模型的资产选择部分。 2文献回顾 在金融领域,已经有一些研究致力于实现类似的目标,即在神经网络中整合预测和决策步骤,以建立数据驱动的决策制定系统。最早的研究由Bengio在1996年进行,他设计了一个包含单隐藏层的全连接网络中的两个模块,第一个模块生成股票回报预测,第二个模块是基于先验知识的交易模块。在35只加拿大股票上进行的投资组合选择结果显示了模块联合训练的好处。近期,Zohren等人在2020年提出了一种类似的方法,他们训练不同的神经网络来优化投资组合的夏普比率。他们 发现在各种网络架构中,长短期记忆模型的表现是最佳的。模型以资产价格和过去 50天的当前和历史值作为特征,并报告了由于参数过多而导致全连接网络的过拟合问题。Butler和Kwon在2021年将预测和优化框架整合到均值-方差投资组合问题中。他们在某些约束条件下提供了封闭形式的解决方案,并使用带有可微优化层的神经网络来寻找不存在封闭形式解的解决方案。现实投资世界的实证测试显示,在表现上超过了两步模型,其中传统方法是执行线性回归然后进行投资组合优化。 在强化学习领域,也出现了类似的端到端学习方法,其中原始观测直接映射到动作,采用有模型和无模型方法。目标是找到一个策略,以最大化累积奖励。Amos等人在2018年提出使用模型预测控制作为强化学习中的可微策略类。他们发现这种方法与传统方法相比计算量和内存需求都小得多。最近在Zhang等人2020年的研究中可以找到强化学习在交易模型应用的一个例子。 在这篇文章中,作者采用了端到端的框架来学习基于风险预算投资组合优化模型的投资策略。这个方法是基于Dontietal.(2017)和Agrawaletal.(2019)的端到端决策制定流程方法,并且构建了一个含有隐层的神经网络,以嵌入风险预算投资组合优化问题。文章测试了无模型(model-free)和有模型(model-based)两种结构。在无模型策略中,前馈神经网络直接从特征学习并输出分配决策。在有模型策略中,神经网络首先从特征中学习每个资产的风险贡献,从而进行资产分配。研究发现基于风险的投资组合在不同市场环境下以及对于参数估计的错误更加鲁棒,但是它对于底层资产的选择十分敏感。通过基于风险预算的有模型方法,作者旨在继承基于风险的投资组合的鲁棒性,同时通过动态分配低风险预算来避开不希望投资的资产。最后,文章引入了一种新颖的资产选择特性到端到端系统中,通过随机门构造稀疏投资组合,这些投资组合对于底层资产的选择非常鲁棒。增加这种过滤属性可以提升市场数据中的表现,并帮助保护风险预算投资组合免受不盈利的低波动性资产的影响。 3模型构建 在投资组合优化中广泛采用的一种方法是通过预测模型估计相关参数,如预期回报和协方差矩阵,并基于这些参数做出分配决策,以优化目标函数。这种两步骤过程长期以来被从业者和研究者采用。然而,它自然面临两种批评。其中一种批评是这种方法严重依赖于中间估计值,而且一些投资组合框架对于中间估计值的错误非常不稳定。这种间接优化可能会导致目标不一致,并导致次优决策。在估计步骤中,数据被概括为少数关键特征,忽略了其他可能有用的信息。其次,文献表明,精确估计某些特征通常很难。虽然协方差矩阵的估计相对稳定,但预期回报的估计常常被证明是不精确的。有偏的参数估计会导致次优的分配策略。特别是,众所周知的均值-方差Markowitz投资组合优化对回报估计很敏感,导致不明智的分配决策和在回报估计偏离时的表现不佳。 随机优化是投资组合优化问题中另一个常用的方法。随机规划是在已知或估计的基础随机过程下进行决策的一种方法。在随机规划中,人们根据决策时可获得的信息采取行动,并且不允许利用未来信息。在金融中,它被称为非预期性约束。金融应用的随机优化例子包括Mulvey和Shetty(2004年)的研究。在本文中,我们采用端到端方法解决投资组合分配问题,模型不再依赖于产生资产参数的预测模