您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:金融工程专题研究:递归神经网络RNN~长短期记忆细胞(LSTM)的分行业多因子预测 - 发现报告
当前位置:首页/其他报告/报告详情/

金融工程专题研究:递归神经网络RNN~长短期记忆细胞(LSTM)的分行业多因子预测

2018-12-28黄志文、邹璐国信证券小***
金融工程专题研究:递归神经网络RNN~长短期记忆细胞(LSTM)的分行业多因子预测

请务必阅读正文之后的免责条款部分 全球视野 本土智慧 金融工程研究 Page 1 证券研究报告—深度报告 金融工程 [Table_Title] 金融工程专题研究 数量化投资 2018年12月28日 [Table_BaseInfo] 相关研究报告: 《金融工程专题研究:基于市场强弱下月初效应的指数投资方法》 ——2018-08-13 《金融工程专题研究:市场强弱下动态回撤率控制》 ——2018-06-13 《金融工程专题研究:指数调样掘金:做优质剔除股的中长期反转》 ——2018-11-05 《金融工程专题研究:单向波动差值择时之六:成交额过滤转多信号的改进方法》 ——2018-12-10 《金融工程专题研究:降低调仓频率,获取超额收益》 ——2018-08-01 证券分析师:黄志文 电话: 0755-82133928 E-MAIL: huangzw@guosen.com.cn 证券投资咨询执业资格证书编码:S0980510120059 证券分析师:邹璐 电话: 0755-82130833-701418 E-MAIL: zoulu@guosen.com.cn 证券投资咨询执业资格证书编码:S0980516080005 独立性声明: 作者保证报告所采用的数据均来自合规渠道,分析逻辑基于本人的职业理解,通过合理判断并得出结论,力求客观、公正,结论不受任何第三方的授意、影响,特此声明。 专题报告 递归神经网络RNN——长短期记忆细胞(LSTM)的分行业多因子预测  递归神经网络RNN RNN不同于传统神经网络的感知机的最大特征就是跟时间挂上钩,即包含了一个循环的网络,就是下一时间的结果不仅受下一时间输入的影响,也受上一个时间输出的影响,进一步地说就是信息具有持久的影响力。人们在看到新的信息的时候产生的看法或者判断,不仅仅是对当前信息的反应,先前的经验、思想也会参与到这次信息推断当中。  分行业建模 往期系列报告中,我们尝试了不同神经网络模型在整个股票分析上的表现能力。而股票市场中,经常观察到某一行业或者板块的股票在特定时期中表现出齐涨共跌的特征。这说明,在这些股票中,存在着某种行业性或产业性的共同影响因素。另外,根据产业周期理论,任何产业或行业通常都要经历幼稚期、成长期、成熟期、稳定期四个阶段。每个行业都处于各自的生命周期,其所属股票价格趋势也有不同特征。通过使用神经网络对不同行业单独进行分析,有利于抓住各个行业独有的影响因素,防止不同行业之间影响因素的相互影响,从而更精准的作出预测。  RNN网络训练 在往期的报告中我们循着网络结构复杂度提高的方向简析了自适应计算次数ACT与维度叠加(Grid-LSTM)在多因子预测模型上的表现。随着网络结构复杂度加深,对计算机的性能要求越来越高。我们在本篇报告中采用对最普及的神经网络进行优化的方法,在复杂度一定的网络结构上尽可能提升网络的表现力。同时,在往期的报告中我们在把多因子输入时,都预先经过了一遍人工筛选;本次我们将获取的69个因子全部输入模型,让模型自己筛选,减少人工干预。对于神经网络的训练来说,由于采用月频数据作为训练集,训练集相对来说比较稀少,随着训练次数的增加,过拟合现象明显加重。采用单独的验证集验证神经网络可以有效地监测过拟合现象的产生,控制神经网络的无效训练次数。  训练结果分析 通过神经网络对不同行业股票走势进行分析预测,我们观察到神经网络在不同行业的验证集上的表现随着神经网络训练次数的增加有不同的表现,我们认为这说明了不同行业对历史经验的依赖程度有差异。神经网络最终在大部分行业的预测准确率处于40%左右,与之前不分行业进行预测的准确率相差不大。训练所用样本集大小对训练表现有较大的影响,大样本集的验证准确度表现出过拟合前有较大的上升区间。 请务必阅读正文之后的免责条款部分 全球视野 本土智慧 Page 2 内容目录 深度神经网络与投资 .................................................................................................... 5 递归神经网络RNN .............................................................................................. 5 长短期记忆网络(LSTM) .................................................................................. 6 循环神经网络分行业多因子选股模型 ........................................................................... 8 样本数据参数 ....................................................................................................... 8 循环神经网络模型参数 ........................................................................................ 9 循环神经网络模型分行业训练结果 ............................................................................. 11 行业划分 .............................................................................................................11 训练结果 .............................................................................................................11 循环神经网络模型行业大类选股效果 ......................................................................... 13 结论 ........................................................................................................................... 16 附录:单行业训练结果............................................................................................... 17 国信证券投资评级 ...................................................................................................... 28 分析师承诺 ................................................................................................................ 28 风险提示 .................................................................................................................... 28 证券投资咨询业务的说明 ........................................................................................... 28 请务必阅读正文之后的免责条款部分 全球视野 本土智慧 Page 3 图表目录 图1:递归神经网络及其展开形式 ............................................................................... 5 图2:LSTM的单元结构 .............................................................................................. 7 图3:全市场股票训练及测试准确率 .......................................................................... 11 图4:全市场股票训练及测试损失(loss) ............................................................... 11 图5:消费行业大类训练及测试准确率 ...................................................................... 12 图6:消费行业大类训练及测试损失(loss) ........................................................... 12 图7:工业行业大类训练及测试准确率 ...................................................................... 12 图8:工业行业大类训练及测试损失(loss) ........................................................... 12 图9:新兴产业行业大类训练及测试准确率 ............................................................... 12 图10:新兴产业行业大类训练及测试损失(loss) .................................................. 12 图11:金融行业训练及测试准确率 ........................................................................... 13 图12:金融行业大类训练及测试损失(loss) ......................................................... 13 图13:全市场神经网络模型20%选股多空组合净值 ................................................. 14 图14:消费行业大类神经网络模型20%选股多空组合净值 ....................................... 14 图15:工业行业大类神经网络模型20%选股多空组合净值 ....................................... 15 图16:新兴行业大类神经网络模型20%选股多空组合净值 ....................................... 15 图17:金融行业大类神经网络模型20%选股多空组合净值 ....................................... 16 图18:可选消费行业训练及测试准确率 ..................................................................