您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东吴证券]:金工专题报告20240927:提升技术分析的品格 - 发现报告
当前位置:首页/其他报告/报告详情/

金工专题报告20240927:提升技术分析的品格

2024-09-26高子剑东吴证券华***
金工专题报告20240927:提升技术分析的品格

金工专题报告20240927 证券研究报告金融工程金工专题报告 提升技术分析的品格2024年09月27日 研究观点 市场弱式有效假说认为,当前的市场价格已经充分反映了所有历史的证券价格信息,包括成交量和成交价等。因此,投资者无法通过对历史价格数据的分析获得超额收益,这一假说对技术分析的有效性提出了质疑。如果市场达到了弱式有效状态,过去的价格信息将不再具备预测能力,进而导致技术分析失效。 检验市场是否为弱式有效的主流方法主要分为两类:一是检验股票价格序列是否符合随机游走,常用方法包括单位根检验、Hurst指数检验和方差比检验;二是检验价格序列是否具有序列独立性,常用方法包括BDS检验、游程检验和序列相关检验等。然而,从实证结果来看,市场尚未完全达到弱式有效的直观体现是我们仍然可以通过历史K线指标预测未来的涨跌。 基于此,本文分别从线性和非线性角度构建了ARMAGARCH模型和LSTM模型来预测沪深300指数的次日涨跌,结果显示,预测准确率分别为5161和5233,显著高于“抛硬币”预测法。因此,我们认为市场尚未达到弱式有效状态,通过技术分析获取超额收益仍具可行性。 风险提示:本报告所有统计结果均基于历史数据,未来市场可能发生重大变化。 证券分析师高子剑 执业证书:S0600518010001 02160199793 gaozjdwzqcomcn 相关研究 《技术分析的品格》 20191101 118 东吴证券研究所 内容目录 1前言4 2理解弱式有效市场4 21什么是弱式有效市场4 22如何证明市场为非弱式有效4 3数据描述及预处理5 31数据来源5 32数据预处理5 321平稳性检验6 322白噪声检验7 4ARMAGARCH模型8 41ARMAGARCH模型介绍8 42ARMAGARCH模型构建8 43模型训练结果10 44策略回测与结果分析11 5LSTM模型13 51LSTM模型介绍13 52LSTM模型构建14 53模型训练结果16 54策略回测与结果分析16 6总结17 7附录17 71参考文献17 8风险提示17 218 东吴证券研究所 图表目录 图1:沪深300价格走势(2005120248)6 图2:沪深300指数的对数收益率6 图3:对数收益率ACF8 图4:对数收益率PACF8 图5:ARMA53模型残差9 图6:ARMAGARCH策略净值(含多空,2012120248)11 图7:抛硬币预测与ARMAGARCH预测效果展示(2012120248)12 图8:抛硬币预测年化收益率直方分布图12 图9:LSTM工作原理13 图10:LSTM模型预测下的沪深300择时效果(200861820231229)17 表1:沪深300指数对数收益率ADF检验结果7 表2:沪深300指数对数收益率LB检验结果7 表3:ARMA模型残差LB检验结果9 表4:ARMA模型残差ARCH检验结果9 表5:ARMAGARCH模型残差LB检验结果10 表6:ARMAGARCH模型残差ARCH检验结果10 表7:二元评价指标10 表8:相关指标12 表9:LSTM模型步长20训练集、验证集及测试集划分15 表10:各步长不同轮次准确率16 318 东吴证券研究所 1前言 自1970年尤金法玛提出市场弱式有效假说(EfficientMarketsHypothesis,简称EMH)以来,关于市场是否真正达到了弱式有效的争论在业界与学界从未停歇。市场是否达到弱式有效,直接决定了技术分析的可行性。在《20191101技术分析的品格》报告中,我们使用了BDS检验和方差比检验对市场弱式有效性进行检验,得出的结论是市场尚未达到弱式有效。为了进一步探讨这一问题,本报告将采用更加实证化的方法进行验证。 本报告的第一部分将构建ARMAGARCH模型,旨在捕捉市场中的线性关系。顾名思义,ARMAGARCH模型由ARMA和GARCH两部分组成,能够有效处理时间序列中的线性依赖结构与波动性特征,尤其适用于金融市场中常见的波动聚集现象。 本报告的第二部分将构建LSTM模型,用于捕捉市场中的非线性关系。LSTM模型是一种特殊的递归神经网络(RNN),专为处理和预测时间序列数据中的长期依赖性。LSTM通过其独特的遗忘门、输入门和输出门机制,可在金融市场中大展拳脚。在股市中,K线指标,交易量等会存在长期的趋势(如历史高点、政策等),LSTM模型能够对重要市场信息进行记忆,同时遗忘门能够让模型选择性记忆信息,在面对大量噪声以及短期波动时也能应对自如。 本报告采用时间序列分析和机器学习中的两种常用模型对沪深300指数进行预测。如果市场已经达到了弱式有效状态,那么过去的信息将无法用于预测未来价格,两个模型的预测能力应当失效。相反,如果其中一个模型具备预测能力,则可以认为市场尚未达到弱式有效。 2理解弱式有效市场 21什么是弱式有效市场 弱式有效市场假说认为,市场价格已经充分反映出过去所有历史的证券价格信息,包括股票的成交价、成交量等,隐藏在历史信息中关于股票未来表现的信息会迅速被大众通过买卖交易反映在股价变动中。因此,投资者无法通过各种方法分析过去的股票价格来获取超额回报。随着弱式效率的提高,基于过去价格和成交量的技术分析将会变得越来越不准确。 22如何证明市场为非弱式有效 当现在的价格充分反映价格历史序列数据中所包含的一切信息,即由过去股价构成的信息集,投资者不可能通过股价的历史变动来预测未来股价的变动,此时的市场为弱 418 东吴证券研究所 式有效。 11 其中,112为t1期的信息集。 当市场为弱式有效市场时,线性预测与非线性预测都将失效,以下为相关证明: (1)弱式有效市场等价于鞅过程: 设1,若10,则称是鞅过程; a鞅过程市场弱式有效: 11111,即市场为弱式有效; b市场弱式有效鞅过程: 11010即市场弱式有效可推出鞅过程因此得证弱式有效市场等价于鞅过程 (2)序列为鞅过程则不可被预测: 鞅过程的核心性质是未来的增量在给定当前信息的条件下,其期望值为0,因此无论从线性还是非线性的角度我们都无法进行有效的预测。 因此,只要能够说明在线性预测或非线性预测中存在有效的预测,那么市场就不是弱式有效的。这里“有效”是指,这两种预测方式在统计学上与通过抛硬币的形式来预测次日涨跌存在显著差异。 3数据描述及预处理 31数据来源 由于技术分析主要依赖历史市场数据(如价格和交易量)来预测未来市场走势,本报告选取了沪深300指数从2005年1月4日至2024年8月30日的总共4788个数据点,包括开盘价、收盘价、最高价、最低价以及成交量等基本K线指标,作为市场走势预测的基础。 32数据预处理 在时间序列分析中,数据的平稳性对于模型的准确性和有效性至关重要。简单来说,平稳性要求时间序列的统计特征(如均值、方差等)不随时间显著变化。然而,沪深300 指数的价格随着市场波动显著变化,呈现出非平稳的特性。如图1所示,沪深300指数在多个时段内经历了明显的上涨和下跌趋势,显然不符合平稳性假设。 518 图1:沪深300价格走势(2005120248) 300ffi 7000 6000 5000 4000 3000 2000 1000 0 20052006200720082009201020112012201320142015201620172018201920202021202220232024 数据来源:Wind资讯,东吴证券研究所 为了使数据满足平稳性要求,我们对数据进行了预处理。通常对数收益率具有更好的统计性质,尤其是它能够更好地处理数据的长期趋势和波动性,因此我们选择使用对数收益率对沪深300指数的价格数据进行转换。下图展示了沪深300指数的对数收益率的走势。 图2:沪深300指数的对数收益率 300fi 01 005 0 005 01 015 20052006200720082009201020112012201320142015201620172018201920202021202220232024 数据来源:Wind资讯,东吴证券研究所 321平稳性检验 首先,我们使用ADF检验对对数收益率序列进行平稳性测试。ADF在时间序列中通常用来判断是否存在单位根,如果序列平稳的,则不存在单位根,检验结果如下: 618 东吴证券研究所 东吴证券研究所 表1:沪深300指数对数收益率ADF检验结果 T检验统计量 P值 ADF统计量 1601 000 1水平临界值 343 5水平临界值 286 10水平临界值 257 数据来源:WIND资讯,东吴证券研究所 其中ADF统计量小于1显著性水平下的临界值,因此我们认为对数收益率序列是平稳的。 322白噪声检验 接下来,我们需要进行白噪声检验。白噪声是指在时间序列中纯随机的序列,具有平稳、无序且无自相关的特性,因此白噪声序列本身不含有任何有用的信息。我们使用LB检验(LjungBox检验)来测试沪深300对数收益率序列是否为白噪声,检验结果如下: 表2:沪深300指数对数收益率LB检验结果 滞后阶数 LB统计量 P值 1 279 0095 2 560 0061 3 908 0028 4 1849 0001 5 1850 0002 数据来源:WIND资讯,东吴证券研究所 上表显示,在阶数大于等于3的情况下,检验的P值小于5的显著性水平,表明原时间序列不为白噪声。综上所述,沪深300对数收益率序列仍存在显著的自相关关系,即该序列不是白噪声,且满足平稳性和非白噪声特性,可以继续构建ARMA模型。 718 4ARMAGARCH模型 41ARMAGARCH模型介绍 ARMA模型是研究时间序列的重要方法,上文已对其进行初步介绍具体模型公式如下: 0 11 其中代表t时刻的对数收益率,0代表常数项,代表模型自回归系数,代表模型平均移动项系数,代表模型扰动项,为误差项。 GARCH模型可用于解决收益率序列条件异方差的现象,具体公式如下: 202 2 1 1 东吴证券研究所 其中,2表示时间t的条件异方差,0为常数项,为滞后i期残差平方项的系数,为滞后j期条件方差项的系数,为时间t的残差,N01表示标准正态分布的随机变量。 42ARMAGARCH模型构建 首先,将数据划分为训练集和测试集。训练集用于确定模型参数,测试集则用于后续回测和准确率验证。训练集的样本区间为2005年1月4日至2011年12月31日,测 试集的样本区间为2012年1月1日至2024年8月30日。 图3:对数收益率ACF图4:对数收益率PACF 数据来源:WIND资讯,东吴证券研究所数据来源:WIND资讯,东吴证券研究所 一般来说,可以通过自相关图和偏自相关图来确定ARMA模型中的p和q参数大小。从上图可以看到,当阶数增大时,自相关系数和偏自相关系数迅速减小至接近0,并在横轴附近小幅波动,表现出截尾特性,但无法准确确定对应的阶数。因此,我们采 818 用另一种常见方法信息准则,通过AIC信息准则最终确定ARMA模型参数为(53)。接着对ARMA模型的残差进行分析。下图展示了残差的变化情况,显然残差并非 白噪声,对数收益率时间序列中仍存在ARMA模型尚未捕捉到的信息。 图5:ARMA53模型残差 ARMAW 06 04 02 0 02 04 06 2005 200620072008200920102011 数据来源:Wind资讯,东吴证券研究所 进一步,我们对模型残差进行LB检验。LB检验的统计量反映了滞后期数内的自相关性强弱,数值越大,说明自相关性越强。下表显示滞后15期的P值均远大于005,统计量也接近0,这表明残差没有显著的自相关性。 表3:ARMA模型残差LB检验结果 滞后阶数 LB统计量 P值 1 000 099 2 000 100 3 001 100 4 001 100 5 005 1