您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中信期货]:商品量化专题报告:时序预测系列(一)基于分解算法和深度学习的预测建模研究 - 发现报告
当前位置:首页/其他报告/报告详情/

商品量化专题报告:时序预测系列(一)基于分解算法和深度学习的预测建模研究

2023-02-16蒋可欣中信期货劣***
商品量化专题报告:时序预测系列(一)基于分解算法和深度学习的预测建模研究

重要提示:本报告难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本报告内容而视相关人员为客户;市场有风险,投资需谨慎。 投资咨询业务资格: 证监许可【2012】669号 商品量化组 研究员: 蒋可欣 FRM jiangkexin@citicsf.com 从业资格号F03098078 投资咨询号Z0018262 中信期货研究|商品量化专题报告 时序预测系列(一) 基于分解算法和深度学习的预测建模研究 摘要: 分解算法(EMD和CEEMDAN)能根据信号特点自适应地将信号分解成一组具有物理意义的IMF分量的线性组合,非常适合非线性、非平稳信号分析。深度学习算法(LSTM和GRU)对复杂序列中长期依赖关系有较强的提取能力。因此,本文将两者结合来探究高精度时序预测的可能性。 为测试模型的有效性和泛化能力,本文在CU、IF和T三种期货合约上进行了测试。在三个品种的预测中,푅2最高可提升10%以上,三个品种的最佳方向准确率均达到60%以上,我们发现在分解算法将价格序列分解成IMF分量组合后,可以不简单依靠T检验对序列进行高频、低频和趋势项的分类加和,将IMF分量依次组合求得最优组合方式能强化深度学习模型的学习能力。同时,通过剔除少量高频IMF分量对高频序列进行去噪可以再次增强优化效果。 此外,我们还发现虽然EMD和CEEMDAN均能对深度学习算法进行优化,但优化效果不一定,CEEMDAN的优化效果不一定强于EMD。同时,重组去噪后的GRU模型并非绝对优于重组去噪后的LSTM模型。 风险提示:本报告中所涉及的算法和模型应用仅为回溯举例,并不构成推荐建议。 本次报告将分解算法(EMD和CEEMDAN)和深度学习算法(LSTM和GRU)分别组合对日度收盘价进行单步预测,发现价格经分解算法分解重组后可提升深度学习时序预测的有效性,若将分解后的高频序列进行去噪可以进一步强化预测模型的有效性。 报告要点 商品量化专题报告 2 / 27 目录 摘要: ..................................................................................... 1 一、引言 ............................................................................... 4 二、EMD和CEEMDAN的基本原理和方法 ...................................................... 5 (一)EMD .............................................................................. 5 (二)CEEMDAN .......................................................................... 7 二、LSTM和GRU网络的内部结构和工作原理 ................................................. 8 (一)LSTM神经网络 .................................................................... 8 (二)GRU神经网络 .................................................................... 12 三、组合模型构建 ...................................................................... 14 (一)IMF重组 ........................................................................ 14 (二)组合模型建模流程 ................................................................ 14 (三)LSTM和GRU网络的计算图结构和训练方法选择 ....................................... 16 四、预测结果分析 ...................................................................... 17 (一)数据选择和处理 .................................................................. 17 (二)预测结果评价指标 ................................................................ 18 (三)预测结果展示和分析 .............................................................. 19 六、结论与展望 ........................................................................ 25 参考文献 .................................................................................. 26 免责声明 .................................................................................. 27 图表目录 图表 1:CU主力合约价格走势和EMD分解过程 ............................................... 6 图表 2 :CEEMDAN的更迭流程 ............................................................. 7 图表 3:CU主力合约价格走势和CEEMDAN分解过程 ........................................... 8 图表 4:单个RNN神经元结构和展开形式 ................................................... 9 图表 5:LSTM神经元结构................................................................. 9 图表 6:Sigmoid函数图像 .............................................................. 10 图表 7:Tanh函数图像 ................................................................. 11 图表 8:GRU神经元结构 ................................................................ 12 图表 9:组合模型的流程 ................................................................ 15 图表 10:LSTM/GRU网络的计算图结构 ..................................................... 16 图表 11:CU分解后各频率序列LSTM模型预测效果比较 ...................................... 19 图表 12:CU经EMD分解高频序列模型预测结果展示 ......................................... 19 图表 13:CU经EMD分解后高频序列模型预测效果比较 ....................................... 20 图表 14:CU经CEEMDAN分解各序列LSTM模型预测效果比较 .................................. 20 图表 15:CU经CEEMDAN分解高频序列模型预测结果展示 ..................................... 21 图表 16:CU各类模型预测结果展示 ....................................................... 21 商品量化专题报告 3 / 27 图表 17:CU各类模型预测效果比较 ....................................................... 22 图表 18:IF各类模型预测结果展示 ....................................................... 23 图表 19:IF各类模型预测效果比较 ....................................................... 23 图表 20:T模型各类预测结果展示 ........................................................ 24 图表 21:T模型各类预测效果比较 ........................................................ 24 商品量化专题报告 4 / 27 一、 引言 中国金融市场是一个受多种社会因素驱动的非线性复杂系统,价格时间序列通常具有显著非平稳、非线性和高噪音的复杂特性。当前市场,时序的预测模型主要有三类分别为1)技术分析法以道氏理论为基础,认为股价基本走势与市场波动趋势趋同;2)统计建模方法依据严谨的统计学理论对价格时序进行预测建模;3)利用机器学习方法对金融时序进行预测建模。技术分析法比较直观,计算简单,但其信号延迟严重,所产生的买卖信号不确定性过高,在短期预测中效果不佳;统计建模方法的预测结果在统计意义上可靠,但其优势体现在处理线性数据上,需要严格的基础假设,实操性较弱;机器学习方法不需要满足统计假设,对非线性时间序列有着更高的预测精度。目前常用的机器学习方法包括决策树、支持向量机(SVM)和神经网络等,其中,神经网络的学习机制使其拥有强大的学习能力和非线性拟合能力,因此被广泛运用到价格时序预测中。近年来,传统的神经网络过拟合和泛化能力弱的问题被越来越多的学者验证,随着大数据技术的提高,深度学习技术受到了国内外学者的广泛关注。和传统的神经网络相比,深度学习模型层数更多,特征提取能力更强。然而,金融市场是一个受多重因素影响的复杂系统,随机性过多,即便使用了循环神经网络(RNN)和卷积神经网络(CNN)等为代表的深度学习技术,预测精度仍未得到充分开发。单个技术难以充分挖掘并刻画复杂金融市场中的多维量价变化规律,为克服依靠单一方法建模的局限性,融合计量手段、信号处理和机器学习的组合模型因其稳定的预测性能得到了广泛关注。因此,本次时序预测系列研究从信号分析和深度学习这两块展开,先通过各类信号分析方法对时序进行分解,再运用深度学习方法对分解后的分量分别进行预测。本篇为本系列的第一个课题,将对融合了分解算法和深度