您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华泰期货]:量化专题报告:基于AI文本挖掘的波动率预测模型-既达万顷,又需见微 - 发现报告
当前位置:首页/其他报告/报告详情/

量化专题报告:基于AI文本挖掘的波动率预测模型-既达万顷,又需见微

2023-07-25高天越、李光庭、李逸资华泰期货娇***
量化专题报告:基于AI文本挖掘的波动率预测模型-既达万顷,又需见微

请仔细阅读本报告最后一页的免责声明摘要波动率在期权和期货交易中都起到了关键作用,因此对波动率的研究具有重要意义。本文将研究重心聚焦在低频波动率上,进行了如下研究并得出了一定结论:1)文本挖掘方法能够获取较全面的商品影响因素。2)预测模型优于均值回归模型并出现了与历史波动率一样的翘尾效应。3)在俄乌冲突前预测模型通过小众因子提前捕捉到了原油价格的异动。4)根据最新预测情况,绝大部分商品的未来月波动率都将上升。研究证明预测模型对于低频波动率的预测较准确,并且在识别非线性因素和尾部风险以及归因分析中更具优势。核心观点波动率的判断在实际业务中具备较大的意义,它会显著影响期货做市商交易的成本与风险,也是期权定价的关键部分。本文研究的重点是对较低频的以日频数据计算的波动率,以月度为时间区间的波动率进行预测。1)对搜集网络上的各类商品品种新闻并采用DP-Sent-LDA机器学习模型进行文本挖掘分析,得出30多种商品影响因素,并对影响因素进行分类及寻找相应的代理指标用以进行数据分析。2)对代理指标的数据进行日频转化、计算其波动率、z-score标准化等处理,代入回归模型得到预测波动率变化,再加上过去20日波动率最终预测未来20日的波动率。3)预测模型的拟合优度要高于均值回归模型,通过引入更多影响波动率的重要指标,出现了和真实值一样的翘尾效应,部分捕捉到了均值回归无法捕捉的影响因子与波动率之间的非线性关系。4)在俄乌冲突中预测模型对原油波动率的预测由于运输费用这一小众因子提前出现了反转,导致了该指标的波动率加大,从而提高了整体的预测效果。5)模型最新预测结果表明,大部分品种未来波动率都将上升。期货研究报告|量化专题报告2023-07-25既达万顷,又需见微——基于AI文本挖掘的波动率预测模型研究院量化组研究员高天越0755-23887993gaotianyue@htfc.com从业资格号:F3055799投资咨询号:Z0016156联系人李光庭0755-23887993liguangting@htfc.com从业资格号:F03108562李逸资0755-23887993liyizi@htfc.com从业资格号:F03105861投资咨询业务资格:证监许可【2011】1289号 请仔细阅读本报告最后一页的免责声明目录摘要.......................................................................................................................................................................................................1核心观点...............................................................................................................................................................................................1低频波动率影响因素...........................................................................................................................................................................4■波动率的研究意义.......................................................................................................................................................................................4■研究方法.......................................................................................................................................................................................................41.确立文本挖掘模型.......................................................................................................................................................42.挖掘资讯识别影响因素...............................................................................................................................................5■影响因素预测波动率实证研究...................................................................................................................................................................71.寻找代理指标...............................................................................................................................................................72.数据处理.......................................................................................................................................................................83.时间序列交叉验证.......................................................................................................................................................94.预测模型与均值回归模型对比.................................................................................................................................105.案例分析.....................................................................................................................................................................126.归因分析.....................................................................................................................................................................137.最新预测情况.............................................................................................................................................................14■总结.............................................................................................................................................................................................................15 量化专题报告丨2023/7/25请仔细阅读本报告最后一页的免责声明图表图1:LDA、SENT-LDA和DP-SENT-LDA的图形模型表示...........................................................................................................5图2:商品影响因素词云.....................................................................................................................................................................6图3:商品波动率影响因素................................................................................................................................................................7图4:原油影响因素及代理指标.........................................................................................................................................................8图5:数据处理与波动率预测.............................................................................................................................................................9图6:预测集散点图与回归曲线.......................................................................................................................................................9图7:均值回归模型预测表现.........................................................................................................................................