
——基于 AI 文本挖掘的波动率预测模型 研究院 量化组 摘要 研究员 波动率在期权和期货交易中都起到了关键作用,因此对波动率的研究具有重要意义。本文将研究重心聚焦在低频波动率上,进行了如下研究并得出了一定结论: 高天越0755-23887993gaotianyue@htfc.com从业资格号:F3055799投资咨询号:Z0016156 1)文本挖掘方法能够获取较全面的商品影响因素。2)预测模型优于均值回归模型并出现了与历史波动率一样的翘尾效应。3)在俄乌冲突前预测模型通过小众因子提前捕捉到了原油价格的异动。4)根据最新预测情况,绝大部分商品的未来月波动率都将上升。 联系人 李光庭0755-23887993liguangting@htfc.com从业资格号:F03108562 研究证明预测模型对于低频波动率的预测较准确,并且在识别非线性因素和尾部风险以及归因分析中更具优势。 核心观点 李逸资0755-23887993liyizi@htfc.com从业资格号:F03105861 波动率的判断在实际业务中具备较大的意义,它会显著影响期货做市商交易的成本与风险,也是期权定价的关键部分。本文研究的重点是对较低频的以日频数据计算的波动率,以月度为时间区间的波动率进行预测。 1) 对搜集网络上的各类商品品种新闻并采用 DP-Sent-LDA 机器学习模型进行文本挖掘分析,得出 30 多种商品影响因素,并对影响因素进行分类及寻找相应的代理指标用以进行数据分析。 投资咨询业务资格:证监许可【2011】1289 号 2) 对代理指标的数据进行日频转化、计算其波动率、z-score 标准化等处理,代入回归模型得到预测波动率变化,再加上过去 20 日波动率最终预测未来 20 日的波动率。 3) 预测模型的拟合优度要高于均值回归模型,通过引入更多影响波动率的重要指标,出现了和真实值一样的翘尾效应,部分捕捉到了均值回归无法捕捉的影响因子与波动率之间的非线性关系。 4) 在俄乌冲突中预测模型对原油波动率的预测由于运输费用这一小众因子提前出现了反转,导致了该指标的波动率加大,从而提高了整体的预测效果。 5) 模型最新预测结果表明,大部分品种未来波动率都将上升。 目录 摘要.......................................................................................................................................................................................................1核心观点...............................................................................................................................................................................................1低频波动率影响因素...........................................................................................................................................................................4■波动率的研究意义.......................................................................................................................................................................................4■研究方法.......................................................................................................................................................................................................41.确立文本挖掘模型....................................................................................................................................................... 42.挖掘资讯识别影响因素............................................................................................................................................... 5■影响因素预测波动率实证研究...................................................................................................................................................................71.寻找代理指标............................................................................................................................................................... 72.数据处理....................................................................................................................................................................... 83.时间序列交叉验证....................................................................................................................................................... 94.预测模型与均值回归模型对比................................................................................................................................. 105.案例分析..................................................................................................................................................................... 126.归因分析..................................................................................................................................................................... 137.最新预测情况............................................................................................................................................................. 14■总结.............................................................................................................................................................................................................15 图表 图1:LDA、SENT-LDA 和 DP-SENT-LDA 的图形模型表示........................................................................................................... 5图2: 商品影响因素词云.....................................................................................................................................................................6图3:商品波动率影响因素................................................................................................................................................................ 7图4: 原油影响因素及代理指标.........................................................................................................................................................8图5: 数据处理与波动率预测.............................................................................................................................................................9图6:预测集散点图与回归曲线....................................................................................................................................................... 9图7: 均值回归模型预测表现...........................................................................................................................................................10