您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:机器学习择时系列之四:基于卷积神经网络模型的市场择时策略 - 发现报告
当前位置:首页/其他报告/报告详情/

机器学习择时系列之四:基于卷积神经网络模型的市场择时策略

2022-08-28王祥宇、杨国平、周游华西证券更***
机器学习择时系列之四:基于卷积神经网络模型的市场择时策略

仅供机构投资者使用证券研究报告|量化研究报告 2022年08月28日 基于卷积神经网络模型的市场择时策略 评级及分析师信息 证券分析师:王祥宇SACNO:S1120520080004证券分析师:杨国平SACNO:S1120520070002研究助理:周游邮箱:zhouyou2@hx168.com.cn 机器学习择时系列之四 投资要点: ►量化择时交易策略 深度学习量化交易策略是从海量历史数据中利用统计原理通过 数据挖掘和逻辑验证的方式发掘出超额收益来源。相比于传统 的线性模型,深度学习模型的表示能力更强,能够学习的特征更多。本文以卷积神经网络为例,介绍深度学习模型在量化择时模型中的应用。 ►卷积神经网络感受野更宽,非线性表达能力更强,在收益率分类的场景下表现突出 卷积神经网络是一种常用的机器学习模型,相比于传统的全连 接神经网络,卷积神经网络通过卷积层和池化层的结构,使得输出的感受野更宽,同时卷积核的权值是共享的,从而有效减少参数数量,卷积神经网络通过卷积层、池化层、全连接层不同块的组合结构设计,使得自动化的特征抽取成为可能,大大增强了神经网络的表示能力(模式识别能力)相比于传统的线性分类模型和支持向量机等模型表现更加突出。 ►利用卷积神经网络实现的市场择时策略能够获得明显的超额收益 本文实现了利用指数不同的低纬度特征,例如技术指标数据 等,进行特征抽取和收益率分类的模型,并且通过预测的收益率分类结果进行交易,在沪深300指数历史数据上进行回测,结果表明模型表现良好。 风险提示 模型基于对历史数据统计,仅作为投资参考。 正文目录 1.卷积神经网络基本理论4 1.1.卷积神经网络的定义4 1.2.卷积神经网络模型4 1.2.1.卷积神经网络的输入层4 1.2.2.卷积神经网络的卷积层4 1.2.3.卷积神经网络的池化层6 1.2.4.卷积神经网络的全连接层6 1.3.卷积神经网络模型的优势6 2.基于卷积神经网络模型的择时建模6 2.1.CNN模型合理性的讨论7 2.2.基于FSL-LR模型的策略设计思路7 2.2.1.建模方法7 2.2.2.预测方法8 2.2.3.数据及参数选择8 2.3.策略具体过程及回测分析10 2.3.1.技术指标与股票涨跌趋势的相关性分析10 2.3.2.卷积神经网络模型的优化13 2.3.3.7:3数据划分训练模式分析15 2.3.4.CNN模型评估15 2.4.择时策略讨论16 3.总结16 4.风险提示17 图目录 图1CNN原理示意图4 图2卷积操作过程示意图5 图3SIGNAL_MACD指标与沪深300股价趋势图11 图4CCI指标与沪深300股价趋势图11 图5RSI指标与沪深300股价趋势图12 图6ADX指标与沪深300股价趋势图13 图7CNN模型7:3数据划分训练模式累计收益15 图8CNN模型7:3数据划分训练模式累计超额收益率15 图9CNN模型的ROC曲线图16 图10CNN模型的PR曲线图16 表目录 表114个技术指标及其含义9 表214个技术指标的权重值10 表3随机断开输入神经元比例对回测结果的影响13 表4单个训练批次样本数对回测结果的影响14 表5训练批次对回测结果的影响14 表6优化器学习率对回测结果的影响14 表7CNN模型7:3数据划分训练模式回测结果15 1.卷积神经网络基本理论 卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且 具有深度结构的前馈神经网络,是机器学习的代表算法之一。卷积神经网络具有表征学习能力。对卷积神经网络的研究始于二十世纪80至90年代,在二十一世纪后,随着深度学习理论的提出和数值计算设备的改进,卷积神经网络得到了快速发展,并被应用于计算机视觉、自然语言处理等领域。这一节,我们主要介绍卷积神经网络的基本理论,包含卷积神经网络的定义和优势。 1.1.卷积神经网络的定义 卷积神经网络仿造生物的视知觉机制构建,其隐含层内的卷积核参数共享和层间 连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征频进行学习,有稳 定的效果且对数据没有额外的特征工程要求。 典型的CNN由三部分组成:卷积层、池化层和全连接层。卷积层负责提取图像中 的局部特征,池化层用来大幅降低参数量级,全连接层用来输出最后的结果。 1.2.卷积神经网络模型 这里使用卷积神经网络构建市场择时策略,卷积神经网络的结构如图1所示。这 里给出卷积神经网络的典型结构。 图1:卷积神经网络典型结构图 资料来源:华西证券研究所 1.2.1.卷积神经网络的输入层 输入层中的单位数等于预测变量的尺寸。一般而言,股票市场的各项指标数据在 送入模型训练之前,均需要进行预处理操作,也就是标准化,输入数据如果数量级不一样,会导致神经网络收敛速度变慢,降低收敛效率;同时,数据范围大的输入在训练过程中权重占比过大,导致模型忽略其他数据的作用。 1.2.2.卷积神经网络的卷积层 卷积层通过在输入和输出之间添加卷积运算来合并更灵活的预测指标关联项。每 个卷积层都从所有输入神经元中线性抽取信息。然后,每个神经元都应用非线性的激活函数对神经元进行激活。在将其输出发送到下一层之前,先将其恢复为聚合信号。使用不同的卷积核(滤波器)进行卷积运算可以得到多种特征信息,从而更好地衡量训练目标。 经过卷积操作提取出的特征,需要转换为二维或三维结构输入训练模型。每种特征代表样本数据不同的信息维度。因此,卷积神经网络在增加卷积核数目时,可以增强结构性能,提取出不同的信息。 图2:卷积操作过程示意图 资料来源:华西证券研究所 基本的二维卷积运算如方程式所示,假设某个信号的样本矩阵为𝑥,滤波器�的大小为�×𝑉,则�输出�是信号序列�和滤波器�的卷积。不同的滤波器可以提取出信号样本不同的信息。这里假设卷积的输出�的下标(𝑖,𝑗)从(𝑈,𝑉)开始。 �� 其一般的连续形式为: 𝑦𝑖,�=෍෍𝑤𝑢,�𝑥𝑖−𝑢+1,𝑗−𝑣+1 𝑢=1𝑣=1 ∞ 𝑦(𝑛)=൫𝑓⨂𝑤൯(𝑛)=න𝑓(𝑥)𝑤(�−𝑥)𝑑� −∞ 离散形式为: ∞ 𝑦(𝑛)=൫𝑓⨂𝑤൯(𝑛)=෍𝑓(𝑥)𝑤(�−𝑥) 𝑥=−∞ 卷积运算用⨂来表示,在CNN网络的计算中,函数f通常称为输入函数,而w一般称为核函数或加权函数,输出y则称为特征映射。每次卷积运算都从上一层的特征映射中线性抽取信息,对上一层的映射x与滤波器w进行卷积运算,对卷积结果加上偏置项常量b得到净输入信号𝑧�。然后应用非线性的激活函数f对神经元信号进行激活,将其恢复为聚合信号。最后,将每个特征映射的结果线性汇总输入下一层。其运算过程如下: 𝑧�=𝑤𝑙⨂�+𝑏� 𝑦�=𝑓(�𝑙) 1.2.3.卷积神经网络的池化层 池化层是利用池化函数来衡量数据信息的总体特征,同时忽略不重要的细微特征。 池化操作主要减少特征维度和增强网络对图像缩放和旋转的鲁棒性。 在卷积层中,特征数量被减少,然而神经元数目基本没有变化。因此仍然需要在 池化层中进行池化操作,从而降低特征维数,避免过拟合。 1.2.4.卷积神经网络的全连接层 全连接层将所有加权信号汇总到最终预测中,并将多维向量映射为一维向量,将 所学习到的所有特征整合起来,同时将整合出的特征映射到输出空间,给出分类结果。一般而言,卷积神经网络均会有两层全连接层,第一层的作用是将前面的卷积层及池化层得到的加权信号映射到样本标记空间。第二层全连接层使用某种激活函数,得到分类预测的最终概率。 1.3.卷积神经网络模型的优势 金融市场是巨大的动态领域,很难建模和预测。它的许多特性使其成为使用深度 学习方法进行分析的特别有吸引力的领域。衡量金融市场未来趋势从根本上来说是一 个预期收益率的回归/分类问题,因此深度学习模型适合于金融数据的建模。 在股票市场产生的数据中,最基础的量价数据是股票交易价格和对应成交量。根据量价数据进行初步数学计算发展出的均线、MACD线、布林线等技术指标,这些技术指标可以被认为是衍生特征。股票收益率分类模型的候选特征的集合很大,这时特征工程和特征选择就显得尤为重要,否则模型会因为维数灾难(CurseofDimensionality)问题而变得难以训练和收敛。 卷积神经网络卷积层、池化层的结构扮演了自编码器(AutoEncoder)的角色,能够自动对输入特征进行降维和特征抽取/降维,相比于传统的机器学习模型需要人工进行特征工程,大大减少了工作量。2012年,AlexNet使用了8层卷积神经网络,并以很大的优势赢得了ImageNet2012图像识别挑战赛。它首次证明了学习到的特征可以超越手工设计的特征,从而一举打破计算机视觉研究的前状,在金融市场的模式识别领域,卷积神经网络的特征学习能力同样有可能击败有经验的交易者。 本文利用技术指标作为卷积神经网络的输入,有经验的交易者往往通过从K线图中寻找投资机会,这一过程,从数量模型的角度来看,也是特征学习的过程,交易者根据过往技术分析的胜率选择建仓买入或者卖出。而卷积神经网络在计算机视觉领域已经证明了它的特征学习能力要超过有经验的人类专家(Supervisor)。那么在技术分析的领域,机器学习模型同样可以取得优秀的结果。 2.基于卷积神经网络模型的择时建模 量化择时是指采用数据化的方式,判断进场或者离场时机。通过计算机技术分析 相关数据,得出对证券市场未来一段时间内发展趋势的分析预判,如果判定上涨则给出买入持有的操盘建议,如果判定下跌则提示投资者卖出清仓规避风险。 2.1.CNN模型合理性的讨论 股市是一个复杂的非线性动态系统,是众多因素共同作用的结果,受到政策、社 会新闻事件、公司本身经营状况以及投资者心理变化等众多因素的影响,因而股市趋势预测是一个非常具有挑战性的问题。随着国内量化交易和计算机技术的发展,伴随着学科交叉现象的普及,越来越多的学者在开展研究时尝试引入人工智能、机器学习等一系列计算机学科理论方法,最终目的在于研发出新的能够预测股票价格并指导量化交易的方法。在此背景下,神经网络成为了一个主要的研究途径。卷积神经网络本身是一个非线性模型,网络结构的复杂堆栈让其相较于线性模型能够更好的识别股票市场的非线性特征,从而更准确的对股票涨跌趋势进行建模及预测。随着网络深度的增加,模型对输入数据的特征组合和特征提取能力也在不断增强,因此,使用卷积神经网络模型研究存在大量噪音的非线性金融时间序列具有一定的优势。 在模型参数学习过程中存在两个问题一是最初的假设是否能反应问题的特征,如果选择用直线去拟合非直线的问题,就会出现重大的错误。另一个就是曲线拟合好不好,所求参数如果不理想,就会出现欠拟合或者过拟合的现象,所得结果也并不理想。在这两个问题中显然前者的影响更严重,会导致最终结果出现较大偏差。但在实际应用中一般假设所选模型符合数据的特征,尤其在高维数据处理中,数据一般都是线性可分的。 卷积神经网络具有大规模并行处理能力,容错性良好,可以实现高度的非线性映射。我们这里选取一些重要的技术指标因子作为特征,再以涨跌趋势(涨为1,跌为0)作为二元响应变量Y,将卷积神经网络强大的监督学习性能应用到对沪深300指数涨跌情况的预测之中,取得了不错的预测效果,为后续投资策略的制定提供了有力依据。 2.2.基于FSL-LR模型的策略设计思路 2.2.1.建模方法 卷积神经网络具有共享局部视野,权值共享等特点,它只需要让每个神经元对局 部进行感知,更高层的神经元再来综合局部信息以得到更高级的信息,从而有效减少参数数量。此外,一个卷积核可以在所有位置使用相同的参数提取特征,使模型的学习过程更加高效。 建模过程为: 采用7:3数据划分模式训练模型,即将70%的数据作为训练数据,剩余30%的数据作为测试数据。选取一