行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

量化专题报告：基于AI文本挖掘的波动率预测模型-既达万顷，又需见微

2023-07-25 高天越,李光庭,李逸资华泰期货娇小姐

想要全面及时的研报数据，就上发现报告（www.fxbaogao.com）。我们是国内知名的研报平台，拥有海量用户。这里的报告特别多，覆盖范围极广，从宏观经济到细分赛道应有尽有。我们用最朴素的方式帮您整理信息，界面简洁，技术过硬，助您快速找到想要的资料。深度洞察市场，做出精准决策，从这里开始。

——基于 AI 文本挖掘的波动率预测模型研究院量化组摘要研究员波动率在期权和期货交易中都起到了关键作用，因此对波动率的研究具有重要意义。本文将研究重心聚焦在低频波动率上，进行了如下研究并得出了一定结论：高天越0755-23887993gaotianyue@htfc.com从业资格号：F3055799投资咨询号：Z0016156 1）文本挖掘方法能够获取较全面的商品影响因素。2）预测模型优于均值回归模型并出现了与历史波动率一样的翘尾效应。3）在俄乌冲突前预测模型通过小众因子提前捕捉到了原油价格的异动。4）根据最新预测情况，绝大部分商品的未来月波动率都将上升。联系人李光庭0755-23887993liguangting@htfc.com从业资格号：F03108562 研究证明预测模型对于低频波动率的预测较准确，并且在识别非线性因素和尾部风险以及归因分析中更具优势。核心观点李逸资0755-23887993liyizi@htfc.com从业资格号：F03105861 波动率的判断在实际业务中具备较大的意义，它会显著影响期货做市商交易的成本与风险，也是期权定价的关键部分。本文研究的重点是对较低频的以日频数据计算的波动率，以月度为时间区间的波动率进行预测。 1）对搜集网络上的各类商品品种新闻并采用 DP-Sent-LDA 机器学习模型进行文本挖掘分析，得出 30 多种商品影响因素，并对影响因素进行分类及寻找相应的代理指标用以进行数据分析。投资咨询业务资格：证监许可【2011】1289 号 2）对代理指标的数据进行日频转化、计算其波动率、z-score 标准化等处理，代入回归模型得到预测波动率变化，再加上过去 20 日波动率最终预测未来 20 日的波动率。 3）预测模型的拟合优度要高于均值回归模型，通过引入更多影响波动率的重要指标，出现了和真实值一样的翘尾效应，部分捕捉到了均值回归无法捕捉的影响因子与波动率之间的非线性关系。 4）在俄乌冲突中预测模型对原油波动率的预测由于运输费用这一小众因子提前出现了反转，导致了该指标的波动率加大，从而提高了整体的预测效果。 5）模型最新预测结果表明，大部分品种未来波动率都将上升。目录摘要.......................................................................................................................................................................................................1核心观点...............................................................................................................................................................................................1低频波动率影响因素...........................................................................................................................................................................4■波动率的研究意义.......................................................................................................................................................................................4■研究方法.......................................................................................................................................................................................................41.确立文本挖掘模型....................................................................................................................................................... 42.挖掘资讯识别影响因素............................................................................................................................................... 5■影响因素预测波动率实证研究...................................................................................................................................................................71.寻找代理指标............................................................................................................................................................... 72.数据处理....................................................................................................................................................................... 83.时间序列交叉验证....................................................................................................................................................... 94.预测模型与均值回归模型对比................................................................................................................................. 105.案例分析..................................................................................................................................................................... 126.归因分析..................................................................................................................................................................... 137.最新预测情况............................................................................................................................................................. 14■总结.............................................................................................................................................................................................................15 图表图1：LDA、SENT-LDA 和 DP-SENT-LDA 的图形模型表示........................................................................................................... 5图2: 商品影响因素词云.....................................................................................................................................................................6图3:商品波动率影响因素................................................................................................................................................................ 7图4: 原油影响因素及代理指标.........................................................................................................................................................8图5: 数据处理与波动率预测.............................................................................................................................................................9图6：预测集散点图与回归曲线....................................................................................................................................................... 9图7: 均值回归模型预测表现...........................................................................................................................................................10

点击免费查看完整报告

量化专题报告：基于AI文本挖掘的波动率预测模型-既达万顷，又需见微

你可能感兴趣

第八届挑战赛C2-基于BERT深度语言模型的“智慧政务”文本挖掘应用

海外文献速览系列之十六：高频数据下基于文本挖掘和深度学习的股票波动性预测

金工专题报告 20260110：深度学习系列之一：AI重塑量化，基于大语言模型驱动的因子改进与情绪Alpha挖掘

量化专题报告：多因子系列之二：Alpha因子高维度与非线性问题——基于Lasso的收益预测模型

基本面量化专题报告：基于夜光数据的固定资产投资预测模型

量化专题报告：基于多因子体系的基差预测模型

学界纵横系列之三十八：基于波动率分解的高频波动率预测模型

专题报告：基于SABR模型的期权波动率曲线套利策略

场外衍生品专题报告：场外期权定价的波动率选择,基于UVM模型

量化专题报告：基于分钟K线的“主力波动率”构造及应用