金融工程 专题报告 基于残差因子分布预测的投资组合优化 ——“学海拾珠”系列之一百七十� 报告日期:2024-01-17 主要观点: 分析师:骆昱杉 执业证书号:S0010522110001邮箱:luoyushan@hazq.com 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 相关报告 1.《历史持仓回报会影响基金经理后续选股吗?——“学海拾珠”系列之一百七十四》 2.《基于端到端神经网络的风险预算与组合优化——“学海拾珠”系列之一百七十三》 3.《低风险组合构建:基于下行风险的缩放策略——“学海拾珠”系列之一百七十二》 4.《如何衡量基金产品创新与差异化:基于文本的视角——“学海拾珠”系列之一百七十一》 5.《如何改进短期反转策略?——“学海拾珠”系列之一百七十》 6.《资产增长率在资产定价中的作用 ——“学海拾珠”系列之一百六十九》 7.《机器学习与基金特征如何选择正Alpha基金?——“学海拾珠”系列之一百六十八》 8.《企业季度投资激增与股票横截面收益——“学海拾珠”系列之一百六十七》 本篇是“学海拾珠”系列第一百七十�篇,文章提出了一种新的基于预测谱残差因子的分布来构建投资组合的策略,能以较高的计算效率提取残差信息,同时对金融归纳偏差有效建模。 对冲市场因子风险的谱残差因子 如果资产收益与市场因子有很强的相关性,那么该资产就有很大的市场风险敞口。通过主成分分析,丢弃几个最大特征值的主成分可以得到谱残差,可以证明谱残差与线性因子模型中的共同因子具有较低的相关性,且其分量互不相关。实验表明,基于PCA的谱残差的提取速度明显快于线性因子模型(FA)。 能够反映金融归纳偏差的神经网络架构 金融序列中存在两类不变量。第一种为波动聚集,即波动率或振幅保持不变,在神经网络中可以使用归一化建模,具体思想是球面上的任何函数类可以转换为正齐次函数类。第二种为分形结构,为利用分形结构的自相似性,可以对输入序列进行不同频率的采样得到多个子序列,然后应用同一操作提取信息,最后取平均输出信息。 分布预测与投资组合构建 分布预测是指给定已实现残差因子序列,预测未来观测值的条件分布,即预测未来观测值的多个条件分位数。利用预测得到的多个等距分位数,可以估计未来残差的均值和方差,然后根据现代组合理论构建最优投资组合。 策略效果 文章在美国市场和日本市场上进行策略检验。在美国市场方面,文 章使用2000年1月至2020年4月期间标准普尔500指数成分股的每日价格数据,2008年1月之前的数据用于进行训练和验证,其余数据用于测试。实证研究表明,分布预测、两种网络架构、谱残差的使用 均能改善策略的各种指标表现。 文献来源 核心内容摘选自Imajo,K.,Minami,K.,Ito,K.,&Nakagawa,K. 2021.5.18发布在AAAI的文章《DeepPortfolioOptimizationviaDistributionalPredictionofResidualFactors》 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建 议。 敬请参阅末页重要声明及评级说明证券研究报告 正文目录 1简介4 1.1对冲市场共同因子的风险敞口5 1.2不变尺度时间序列的架构设计5 1.3通过分布预测构建投资组合5 1.4本文贡献总结6 2预备知识6 2.1问题设定6 2.2投资组合优化的概念7 3系统架构7 3.1提取残差因子7 3.2分布预测与投资组合构建9 3.3网络架构10 4实验11 4.1数据集描述和共同设置11 4.2谱残差的有效性12 4.3系统的性能评估13 5相关工作14 5.1因子模型与残差因子14 5.2基于深度学习模型的资产价格预测14 6结论15 风险提示:15 图表目录 图表1文章框架4 图表2系统概述7 图表3基于原始收益、FA残差、谱残差的反转策略的累积收益率12 图表4美国市场上的策略累积财富13 图表5美国市场上的策略表现对比13 图表6美国市场上的策略累积财富(未提取谱残差)14 图表7美国市场上的策略表现对比(未提取谱残差)14 图表1文章框架 1简介 资料来源:华安证券研究所整理 制定可盈利的交易策略是金融行业的核心问题。在过去的十年里,机器学习和深度学习技术在许多应用领域中取得了重大进展(Devlinetal.2019;Graves,Mohamed,andHinton2013),这激发了投资者和金融机构开发机器学习辅助交易策略的热情(Wangetal.2019;ChoudhryandGarg2008;Shah2007)。然而,人们认为预测金融时间序列的本质是一项困难的任务(Krauss,Do,andHuck2017)。尤其是众所周知的有效市场假说(MalkielandFama1970)认为,由于市场动态变化迅速,没有任何一种交易策略可以永久盈利。在这一点上,金融市场与大多数机器学习/深度学习方法通常假设的静态环境有很大不同。 一般来说,深度学习方法快速适应给定环境的好方式是引入一种能够很好地反 映环境归纳偏差的网络架构。此类架构最突出的例子包括用于图像数据的卷积神经 网络CNNs(Krizhevsky,Sutskever,andHinton2012)和用于一般时间序列数据的长短期记忆网络LSTMs(HochreiterandSchmidhuber1997)。因此,一个自然而然的问题是,什么样的架构能有效处理金融时间序列。 在金融领域,研究人员提出了各种交易策略,并对其有效性进行了实证研究。因此,从金融研究的实证结果中寻找架构灵感是合理的。我们尤其考虑了股票市场的以下三个特点。 1.1对冲市场共同因子的风险敞口 许多关于股票收益的实证研究都是用因子模型来描述的(e.g.,FamaandFrench1992,2015)。这些因子模型将股票�在时间�的收益率表示为�个因子加上一个残差项的线性组合: � �=∑𝛽(𝑘)𝑓(𝑘)+� (1) 𝑖,� �� 𝑘=1 𝑖,� 其中,𝑓(1),…,𝑓(𝐾)是股票�∈[1,…,𝑆]的共同因子,� 是对应于个股�的残差因子。 ��𝑖,� 因此,共同因子对应的是整个股票市场或行业的动态,而残差因子则传达了一些公司的特定信息。 一般来说,如果资产的收益与市场因子有很强的相关性,那么该资产就有很大的市场风险敞口。例如,众所周知,基于动量效应的经典策略(JegadeeshandTitman1993)与Fama-French因子(FamaandFrench1992,2015)相关,在2008 年信贷危机期间表现为负收益(Calomiris,Love,andPeria2010;Szado2009)。另一方面,研究人员发现,仅基于残差因子的交易策略可以稳健盈利,因为这类策略可以对冲市场因子的时变风险敞口(Blitz,Huij,andMartens2011;Blitzetal.2013)。 因此,为了制定对市场结构性变化具有稳健性的交易策略,考虑基于残差因子的策略是合理的。 消除市场效应和提取残差因子的一种自然方法是利用线性分解方法,如主成分分析(PCA)和因子分析(FA)。在训练基于深度学习的策略时,从观测数据中学习这种分解结构是较为困难的。一个可能的原因是,学习到的策略会偏向于使用 市场因子的信息,因为市场因子的影响在许多股票中占主导地位(Pasini2017)。因此,为了利用残差因子,在架构中明确实现类似分解的结构是合理的。 1.2不变尺度时间序列的架构设计 当我们使用基于神经网络的方法处理某项预测任务时,神经网络架构的有效选择通常取决于数据中的模式或不变量。例如,CNN(LeCunetal.1999)考虑到了通常出现在图像类数据中的平移不变性结构。从这个角度来看,找到对处理金融时间序列有用的不变性结构非常重要。 目前金融文献中有两类不变量适合作为这种结构的候选对象。首先,在金融时间序列中经常观察到一种称为波动率聚集的现象(LuxandMarchesi2000),这表明序列的波动率(即振幅)具有不变性结构。其次,有一种假设认为股票价格序列具有一定的时间尺度不变性,即分形结构(Peters1994)。我们假设,将这种不变性纳入网络架构可有效加速对金融时间序列数据的学习。 1.3通过分布预测构建投资组合 另一个重要的问题是如何将给定的收益预测转化为实际的交易策略。在金融领域,有几种著名的交易策略,例如,动量效应(JegadeeshandTitman1993)建议采 取一种押注当前市场趋势的策略,而均值回归(PoterbaandSummers1988)则建议采取另一种假设股票收益朝着当前方向的相反方向移动的策略。然而,从结构上看,动量策略和反转策略互为负相关,通常不清楚哪种策略对特定市场是有效的。另一方面,现代投资组合理论(Markowitz1952)提供了另一个框架,可根据资产价格的 分布特性(通常是收益的均值和方差)来确定投资组合,由此得出的投资组合是唯一的,因为它在某些预设条件下对收益和风险进行了最佳权衡。从这个角度来看,收益的分布预测有助于构建能够自适应市场的交易策略。 1.4本文贡献总结 我们提出了一种提取残差信息的新方法,称之为“谱残差”。与经典的基于因子分析的方法相比,谱残差的计算速度更快,同时又不会失去对冲市场因子风险的能力。此外,谱残差可以很容易地与任何预测算法相结合。 我们提出了一种基于深度神经网络的股票价格分布预测系统。系统包含两个新的神经网络架构,其灵感来源于众所周知的金融时间序列不变性假设。通过预测收 益的分布信息,我们可以利用现代投资组合理论确定最优投资组合。我们在真实市场数据上证明了所提出的方法的有效性。 补充材料可参见发表在arXiv上的本文的扩展版本(Imajoetal.2020)。补充材料包含了本文附录,其中包括详细的数学公式、实验设置、理论分析和附加实验。 2预备知识 2.1问题设定 我们的问题是,基于股票价格序列观测值构建一个随时间变化的投资组合。假设有�支股票,以符号�为索引,观测值是股票价格的离散时间序列𝒑(1)= (𝑝(𝑖),𝑝(𝑖),…,𝑝(𝑖),…),其中,𝑝(𝑖)是股票�在时刻�的价格。我们主要考虑股票的收益 12�� 率,而非原始价格。股票�在时刻�的收益率定义为𝑟(𝑖)=𝑝(𝑖)/𝑝(𝑖)−1。 �𝑡+1� 投资组合可表示为股票的权重向量�=(𝑏(1),…,𝑏(𝑖),…,𝑏(𝑆)),其中𝑏(𝑖)是股票� ����� 在时刻�的投资数量,满足∑�|𝑏(𝑖)|=1。投资组合�可以理解为一种特殊的交易 𝑖=1�� 策略,即𝑏(𝑖)>0意味着投资者在时刻�对股票�持有数量为|𝑏(𝑖)|的多头头寸,而 �� 𝑏(𝑖)<0则意味着对该股票持有空头头寸。给定投资组合�,其在时刻�的总收益 �� �≔∑�𝑏(𝑖)𝑟(𝑖),那么,给定个股收益的历史观测值,我们的任务就是确定能够 �𝑖=1�� 最大化未来收益的𝒃�。 一类重要的投资组合是零投资组合,其定义如下。 � 定义1(零投资组合):零投资组合是指多头头寸和空头头寸平衡的投资组合, ∑即 � 𝑖=1 𝑏(𝑖)=0。 在本文中,我们将只关注输出为零投资组合的交易策略。这一假设是合理的,因为零投资组合不需要股权,因此有利于不同策略之间进行公平比较。 在实践中,收益观测和实际执行交易之间可能会有延迟。考虑到这种延迟,我 们在实验中采用了延迟参数�。当我们在延迟�天的情况下进行交易时,总收益应为 �≔𝑅�=∑� 𝑏(𝑖)𝑟(𝑖)。 �� 𝑖=1� 𝑡+� 2.2投资组合优化的概念 根据现代投资组合理论(Markowitz1952),投资者构建投资组合的目的是在特定的可接受风险水平下实现预期收益