金融工程 专题报告 利用深度神经网络改进时间序列动量策略 ——“学海拾珠”系列之一百三十九 主要观点: 报告日期:2023-5-3 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 分析师:骆昱杉 执业证书号:S0010522110001邮箱:luoyushan@hazq.com 相关报告 1.《如何管理投资组合波动率?——“学海拾珠”系列之一百二十三》 2.《基金具有情绪择时能力吗?——“学海拾珠”系列之一百二十四》 3.《投机股与止损策略——“学海拾珠”系列之一百二十�》 4.《基金持仓集中度究竟如何影响基金业绩?——“学海拾珠”系列之一百二十六》 5.《20和21世纪风格因子表现的趋势和周期——“学海拾珠”系列之一百二十七》 6.《基金在阶段业绩不佳后会调整激进程度吗?——“学海拾珠”系列之一百二十八》 7.《基于盈利公告发布日期的交易策略——“学海拾珠”系列之一百二十九》 8.《媒体效应如何影响基金投资者和基金经理的决策?——“学海拾珠”系列之一百三十》 本篇是“学海拾珠”系列第一百三十九篇,作者引入了深度动量网络 ——一种复合深度学习模型。深度动量网络保留了时间序列动量策略的波动率缩放框架,以数据驱动的方式同时学习趋势和仓位,通过优化信号的夏普比率直接训练网络。 传统时间序列动量策略泛化性差 时间序列动量策略是在横截面动量策略的基础上发展而来,自诞生以来已经得到了广泛应用,但计算时间序列动量首先要对序列的趋势做出估计,在估计的基础上计算头寸,这一方面增加了误差累积的风险,另一方面又与交易规则深度相关,采用不同的交易规则对结果可能产生很大的影响。 深度动量网络可以直接拟合复杂的时序动量策略 目前研究人员通常将价格预测任务定义为一个分类问题,首先证明他们所采用的方法在预测下一次价格走势方面的准确性有所提高。然后,根据类别概率手动定义交易规则。该过程需要许多明确的设计决策来定义复杂的时间序列动量策略,而本文中的深度动量网络可以直接从数据中学习复杂的非线性关系,将头寸的预测结果作为输出,从而减少对手动规范的需求。 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 敬请参阅末页重要声明及评级说明证券研究报告 正文目录 1引言4 2相关研究5 2.1经典动量策略5 2.2深度学习在金融领域的应用5 3动量策略定义6 3.1标准交易规则6 3.2扩展机器学习方法8 4深度动量网络9 4.1模型结构9 4.2模型训练细节11 5模型收益评估11 5.1数据集概述11 5.2回测说明11 5.3结果展示12 6关于换手率的分析17 6.1换手率正则化18 7结论19 风险提示:20 图表目录 图表1头寸计算函数𝜙(𝑦)7 图表2表现度量指标—原始输入12 图表3表现度量指标—根据目标波动率缩放后13 图表4采用不同损失函数的累计收益—根据目标波动率缩放后14 图表5单个资产的表现16 图表6TURNOVER分析18 图表7交易成本对SHARPERATIO的影响18 图表8有交易成本的表现度量指标(C=10BPS)19 1引言 动量效应作为金融风险溢价已在此前的学术文献中得到广泛记录,在一系列资产类别、预测范围和时间段内都带来了持续的异常回报(Hurst等人(2017),Lemprire等人(2014),Baz等人(2015))。基于强价格趋势有持续趋势这一观点,时间序列动量策略通常被设计为在发生大的方向性移动时加仓,并在其他时候减仓。尽管该策略显然是符合直觉的,但具体的实施细节可能因信号而异,有很多方法可用于估计价格趋势的幅度(Levine和Pedersen(2016),Bruder等人(2013)),并将其映射到实际交易头寸(Kim等人(2016),Baltas等人(2017),Harvey等人(2018))。 近年来,深度神经网络越来越多地用于时间序列预测,在需求预测(Laptev等人,2017)、医学(Lim等人,2018)和金融等(Zhang等人,2019)应用中优于传统方案。随着卷积神经网络(CNNs)和递归神经网络(RNN)(Goodfellow等人,2016)等现代架构的发展,深度学习模型因其能够构建给定数据集输入和标签之间高度非线性映射而受到青睐(Bengio等人,2013)——尤其是,该过程纯粹以数据驱动。TensorFlow(Abadi等人,2015)和PyTorch(Paszke等人,2017)等强大的开源框架也促进了深度神经网络的应用,它们使用自动微分来计算反向传播的梯度,而无需事先明确推导。这种灵活性使深度神经网络超越了标准的分类和回归模型。例如,将传统时间序列模型与神经网络组件相结合的复合方法已经被观察到在任何领域(Makridakis等人,2018)中都优于纯粹的传统方法,例如指数平滑RNN(Smyl等人,2018)、自回归CNN(Binkowski等人,2018)和卡尔曼滤波器变体(Rangapuram等人(2018),Fraccaro等人(2017)),同时这也使输出更容易被从业者解释。此外,这些框架还允许研究人员使用新损失函数来提升模型性能,例如生成对抗性网络 (GANs)中的对抗性损失函数(Goodfellow等人,2014)。 目前已有许多论文研究了机器学习在金融时间序列预测中的应用,但它们通常侧重于将潜在的预测问题作为标准回归或分类任务(Gu等人(2017),Kim等人(2019),Sirignano等人(2018),Zhang等人(2019),Ghoshal和Roberts(2018),Binkowski等人(2018),Bao等人(2017))——回归模型预测预期回报,分类模型预测未来价格走势。然而,由于以下原因,这种方法在分析时间序列动量问题中的表现并非最优。首先,仅根据预期收益来调整头寸并没有考虑风险特征,如预测收益分布的波动性或偏斜,这可能会无意中使信号暴露在大幅下跌中。这一点尤其重要,因为在市场恐慌期间,没有充分风险调整的原始动量策略,如波动率缩放,很容易发生大规模崩盘(Barroso和Santa-Clara(2015),Daniel和Moskowitz(2016))。此外,即使波动率扩大会导致收益分布正偏斜和类似做多期权的行为(Martins和Zou(2012),Jusselin等人(2017))——趋势跟踪策略可能会进行更多的亏损交易而不是盈利交易,且在总体上表现为盈利——因为趋势会被放大但方向移动并不频繁。因此,Potters和Bounchaud(2016)认为,盈利交易的分数是一个没有意义的绩效指标,因为它不能独立于策略的交易风格进行评估。同样,高准确率的分类也不一定能转化为有效的策略收益,因为盈利能力也取决于每个类别的回报幅度。这也反映在博彩策略中,如 Kelly准则(Rotando和Throp,1992),该准则需要输赢概率和博彩赔率才能在二项式游戏中实现最佳规模。鉴于传统监督学习技术的不足,需要探索新的损失函数和训练方法来调整头寸——风险和回报之间的权衡。 本文介绍了一类新的复合模型,该模型将基于深度学习的交易信号与时间序列动量策略中使用的波动率缩放框架相结合,称之为深度动量网络(DMN)。该模型从多个角度改进了现有的方法。首先,通过使用深度神经网络直接生成交易信号,无 需手动指定趋势估计器和头寸调整方法,从而可以直接使用神经网络架构直接学习它们。其次,通过在现有的反向传播框架中应用自动微分,明确优化了网络的风险调整收益指标,即夏普比率(Sharpe,1994),总体上改善了信号预测的风险程度。最后,与其他动量策略保持一致的框架也使该模型能够保留以前工作中的理想特性, 特别是波动率缩放,这在时间序列动量策略中发挥着关键作用。这种一致性也有助于与现有方法进行比较,并有助于解释整体信号的不同组成部分。 2相关研究 2.1经典动量策略 动量策略可分为两类,即(多变量)横截面动量(Jegadeesh和Titman(1993),Kim(2019))和(单变量)时间序列动量。横截面动量策略侧重于证券的相对表现,买入相对评价高者,卖出相对评价低者。通过根据过去的回报率对一系列股票进行排 名,并将前十分位数与后十分位数进行交易,发现在过去3至12个月内最近表现优于同行的证券在下个月的平均表现将继续优于同行。横截面动量的表现也被证明是随时间变化保持稳定的,不管是在多市场或多资产类别中。 时间序列动量扩展了这一概念,将重点放在资产自身的过去回报上,构建包括考虑范围内所有证券的投资组合。这最初是由Moskowitzj(2012)等人提出的,他们描述了一种具体的策略,该策略使用波动率缩放,并根据过去一年的回报信号进行头寸交易——在25年的数据中,分别展示了58种不同流动性工具的盈利能力。从那时起,人们提出了许多交易规则——通过各种趋势估计技术和方法将其映射到交易头寸。例如,Bruder等人记录了一系列线性和非线性滤波器来测量趋势,并记录了一个统计数据来测试其重要性——尽管没有直接讨论用这些估计来确定头寸的方法。Baltas和Kosowski(2017)采用与Moskowitz等人(2012)类似的方法,将过去12个月的对数价格与时间进行回归,并使用回归系数的t统计量来确定交易头寸的方向。虽然两者的夏普比率具有可比性,但基于t统计量的趋势估计导致投资组合的换手率减少了66%,从而降低了交易成本。Baz等人(2015)和Rohrbach等人(2017)提出了更复杂的交易规则,将标准化波动率的MACD指标作为输入。尽管方式多种多样,但很少对交易规则本身进行比较,几乎没有研究提供明确的证据或直观的推理来支持一种规则而不是另一种规则。因此,本文建议使用深度神经网络来直接生成这些规则,避免了明确规范的需要。基于风险调整后的收益指标对其进行训练,网络直接从数据本身学习最佳参数。 2.2深度学习在金融领域的应用 长期以来,机器学习一直被用于金融时间序列预测,最近的深度学习在金融领域的应用研究使用每日数据或限价指令簿数据来预测中间价。虽然各种CNN和RNN模型已经有了长足的进步,但研究人员通常还是将预测任务定义为一个分类问题,证明了它们的方法在预测下一次价格走势方面的准确性有所提高。然后,根据类别概率手动定义交易规则——要么使用分类概率的阈值来确定何时开始头寸,要么将这些阈值纳入分类问题本身,根据幅度将价格走势划分为买入、持有和卖出类别(Zhang等人(2019),Zhang等人(2018))。除了这些依赖高准确性的策略之外,还可以通过直接从数据中学习交易规则来获得进一步的收益——这两者都在本文提出的方法中得到了解决。 深度学习回归方法也被考虑用于横截面策略,根据下一时间段的预期回报对资产进行排名。Gu等人(2018)使用各种线性、基于树的和神经网络模型证明了非线性 方法的优越性,深度神经网络——特别是3层以上的多层感知器(MLPs)——具有最佳的样本外预测𝑅2。然后,通过使用模型预测结果每月对股票进行排名来建立机器学习投资组合,最佳策略来自4层MLP模型,该MLP策略将预测的前十分位数与后十分位数进行交易。在其他工作中,Kim(2019)采用了类似的方法,使用自编码器和去噪自编码器架构,并将波动率缩放纳入其模型中。虽然基本深度神经网络的结果表现还不错,但它们没有考虑在时序模型中使用更“现代”的架构,例如本次研究中涉及到的LSTM(Hochreiter,1997)和WaveNet(Oord等人,2016)架构。此外,本文首次考虑在时间序列动量策略的背景下使用深度学习——为在另一类信号处理中应用深度学习算法这一课题开辟可能性。 深度强化学习(RL)因DeepMind的AlphaGoZero(Silver等人,2017)的成功而广受欢迎,近年来也受到了广泛关注,因为它能够在动态环境中采用路径依赖的决策。RL很适合应用于路径依赖的执行策略和自动套期保值领域(Kolm和R