期货研究 二〇 二2024年7月3日 四年度 CTA与机器学习在期权波动率预测中的可行性 分析 张雪慧投资咨询从业资格号:Z0015363Zhangxuehui022447@gtjas.com 国 泰李宏磊投资咨询从业资格号:Z0018445lihonglei023572@gtjas.com 君高宇飞(联系人)从业资格号:F03124155gaoyufei028920@gtjas.com 安 期报告导读: 货 研我们认为,场内期权,尤其是商品期权,其波动率的变化趋势可以通过类似CTA策略中的研究方法进究行预测。研究和预测期权波动率与CTA中预测商品期货价格的涨跌,在逻辑上有一定的关联性。我们可以所借鉴CTA中一些构造因子的方法,从而将其变为可以用来预测期权波动率的因子。 商品期货与期权的量价行情数据,商品期货的基本面数据,期权隐波的衍生数据等,都可以用于波动率的预测的因子处理。CTA方法中可用于期权预测的因子,有量价因子、期限结构因子、基本面因子和另类因子。由于我们处理的金融数据量往往较大,因此需要机器学习算法将数据特征映射到数据标签、一个某个类别或是某个维度。 CTA及机器学习方法在期权波动率预测上具备一定的可行性,也行能够提供较好的预测效果。以下是我们认为波动率预测结果可应用的领域:1.直接用于波动率多空趋势交易;2.用于波动率卖权策略止损信号;3.用于大类资产配置。 目录 1.期权和CTA结合的相似性3 2.期权或者标的期货可以用做因子处理的数据3 3.CTA方法中可用于期权预测的因子4 3.1量价因子4 3.1.1动量因子4 3.1.2反转因子5 3.1.3条件规则型因子5 3.2期限结构因子6 3.2.1基差因子6 3.2.2基差动量因子6 3.2.3价差因子6 3.2.4展期收益率7 3.3基本面因子7 3.3.1库存因子7 3.3.2仓单因子8 3.3.3利润因子8 3.3.4开工率因子8 3.4其他因子8 3.4.1宏观因子9 3.4.2市场情绪因子9 3.4.3会员持仓因子9 3.4.4天气因子9 4.机器学习模型的应用9 4.1线性模型9 4.2非线性模型11 4.2.1GAM模型11 4.2.2神经网络12 4.2.3决策树模型13 4.2.4集成学习14 5.期权波动率预测结果可应用的领域16 (正文) 1.期权和CTA结合的相似性 在衍生品市场中,期权和期货是两种极为重要的衍生品,他们也是在场内市场中被研究最多、应用最广泛的衍生品。CTA全称为CommoditiesTradingAdvisor,即商品交易顾问,CTA策略也通常被成为管理期货类策略它是指由专业的资金管理人投资于期货市场,利用期货价格上升或下降而获利的一种投资策略。 在CTA的策略中,投资者往往从行情数据,例如商品期货不同合约的价格、成交量、持仓量等信息出发,判断下一阶段商品价格及对应的期货合约的涨跌幅度。同时,由于标的资产的商品属性,也可以从供需的角度出发,结合产业链和上下游进行分析,预测商品期货下一步的涨跌。 期权是指一种合约,该合约赋予持有人在某一特定日期或该日之前的任何时间以固定价格购进(认购期权)或售出(认沽期权)一种资产的权利。在期权的研究中,最为核心的问题是期权如何合理地进行定价。一般地,欧式期权的定价遵循BSM模型,由F.Black和M.Scholes于1973年提出,其中确定了五个基本参数(标的股价、执行价格、利率、到期时间、波动率)和期权价格之间的定量关系,除波动率外的其他四个参数都易于确定或观测到。因此,预测期权价格的涨跌的关键在于如何准确的界定标的资产的波动率大小。 我们认为,场内期权,尤其是商品期权,其波动率的变化趋势可以通过类似CTA策略中的研究方法进行预测。例如分析标的商品期货的行情数据、价量数据等。通过捕捉商品期货的上涨下跌趋势,对波动率的变化进行预测。此外,基本面、事件驱动、宏观因素和政策扰动等影响,也可能引起标的资产价格大幅波动,这些因子可以作为警示波动率上升风险的重要要素。 综上所述,研究和预测期权波动率与CTA中预测商品期货价格的涨跌,在逻辑上有一定的关联性。我们可以借鉴CTA中一些构造因子的方法,从而将其变为可以用来预测期权波动率的因子。 2.期权或者标的期货可以用做因子处理的数据 场内商品期权的标的资产为已在交易所上市的商品期货,因此,期权CTA可用的数据更为丰富,既可以是期权本身的行情数据也可以是其标的期货的数据。在之前的系列报告《期权CTA-趋势量价因子在波动率预测上的效果》中,我们使用标的商品期货的主力合约连续价格,对一些交易较为活跃、成交量排名靠前的商品期权的隐含波动率的涨跌进行了预测,从而发现,一些商品期货合约的价格对波动率一定的预测作用。 除了价格行情数据,商品期货的持仓量和成交量等其他数据也会对预测有一定的作用。例如交易所盘后公布的会员持仓龙虎榜,从多空头持仓的增减可以分析多空的力量对比和博弈情况,进而判断下一步价格的涨跌。当多空单某一方占据较明显优势时,则下一阶段价格可能发生较大变化,波动率抬升;反之若多空力量相当,则下一阶段价格横盘震荡的可能性较高,波动率下降。 类似的,期权的量价行情数据对于期权价格本身也有同样的预测作用,而期权价格与隐含波动率有较强的正相关性,因此对于波动率的预测也有一定的效果。我们同样以期权合约的会员持仓龙虎榜为例,可以对比看涨期权与看跌期权持仓中各自买持仓与卖持仓的变化,来观察波动率买方与波动率卖方的博弈力量,从而推测波动率未来的变化趋势。当看涨期权加看跌期权的买持仓明显增加、卖持仓明显下降,则证明波动率买方力量较强,隐含波动率可能提升;反之,若买持仓明显下降、卖持仓明显增加,则证明波动率卖方力量较强,隐含波动率可能下降。 商品期货的基本面数据也有一定的预测效果,比如我们看某商品的关键库存数据,若较同环比变化幅度较大,说明其供需失衡,在下一阶段可能导致价格变化较大,波动率抬升。宏观经济指标对某些特定的商品的影响类似,例如黄金、白银等贵金属,对于利率、汇率等较为敏感。此外,政策和事件驱动也会导致短期商品期货价格变化。例如对农产品,USDA每年都会发布农产品(大豆、棉花、玉米等)的种植进度表和对应的报告等。当目前的种植进度、单产、面积等大幅超过或不及预期时,说明接下来该农产品的供需将失衡,从而引起波动率的抬升,反之若基本符合预期,则波动率会回落。再比如我们知道宏观经济的月度数据发布通常在下一个月的中旬,有一定的滞后性,且最终结果是否偏离预期有较大的不确定性。因此在数据发布前一段时间,波动率往往有抬升的迹象。 期权隐波的衍生数据也可以用于波动率的预测,如隐含波动率锥与历史波动率锥,可以用于进行条件规则性判定,例如,投资者会根据波动率锥的统计,在设定的区间之间,例如下穿10分位数或者上穿90分位数,意味着波动率已经到极端值,可以考虑进行均值复归的策略布局;隐波衍生指标,如隐波偏度或隐波期限结构,偏度可以用于观察市场看涨与看跌期权的定价差异,期限可以用于观察近月与远月的波动差异,来判断微观层面上期权投资者的偏好及改变。 3.CTA方法中可用于期权预测的因子 图1:商品因子分类 资料来源:国泰君安期货研究 在《期权CTA-趋势量价因子在波动率预测上的效果》中,我们提到,可以用趋势跟踪为基础的量价因子结合行情数据进行波动率的预测。量价因子就是从期货的成交持仓量和价格信息中提取出的因子,当前市场最流行的量价因子是动量因子和反转因子。 3.1量价因子 3.1.1动量因子 动量因子是一个基于趋势跟踪而产生的因子,动量因子的核心理念是,如果一个标的在过去的一段时间内表现良好,那么它在未来的一段时间内也可能会表现良好。反之,如果一个标的在过去的一段时间内表现糟糕,那么它在未来的一段时间内可能也会表现糟糕。商品动量因子则基于对商品标的品种的趋势跟踪,从 而来预测未来的涨跌表现,我们也把它简单称之为“追涨杀跌”。目前在国内的CTA策略量价因子中,动量因子是占比最高,应用最普遍的因子之一。 动量因子投资策略的主要优点是简单易行,只需要根据过去的价格择时选择买入及卖出。此外,许多研究表明,动量因子投资策略在更长或者更短的周期内都可以实现超额回报,因此衍生出不同周期的动量因子,按照周期的不同,动量因子又可进一步划分为短周期/中周期/长周期动量。 图2:常见的动量因子构造公式 𝑐𝑙𝑜𝑠𝑒� 𝑖−1 𝑙𝑜𝑔𝑟𝑒𝑡�=ln(𝑐𝑙𝑜𝑠�) � 𝑓𝑎𝑐𝑡𝑜𝑟_𝑣𝑎𝑙𝑢𝑒�=∑𝑙𝑜𝑔𝑟𝑒𝑡𝑇−� 𝑖=1 资料来源:国泰君安期货研究 其中,close_i代表第i日的收盘价,第T日的因子值为前N日的对数收益率之和。 然而,动量因子也有其缺点。首先,过去的表现并不能保证未来的表现,趋势性较强的品种也有可能在一段时间内长期横盘。其次,短周期的动量因子投资策略可能会导致投资者过度交易,从而增加交易成本。 3.1.2反转因子 反转因子的构造逻辑和动量因子恰好相反。反转因子的核心理念是,那些在过去表现不佳的投资标的在未来可能会有更好的表现,而过去表现良好的投资标的在未来可能会表现不佳。反转因子的理论基础是市场的过度反应和调整。市场可能会对某些信息反应过度,导致商品价格迅速上升或下降。然而,随着时间的推移,市场会对这些过度反应进行调整,商品价格可能会恢复到更合理的水平。这就是投资者利用反转因子来获取利润的方式。技术分析中的布林带通道,KDJ和RSI等都是常见的反转因子。 反转因子的主要挑战在于确定何时入市。如果投资者过早入市,他们可能会损失大量资金。如果他们过晚入市,他们可能会错过最佳的投资机会。尽管反转因子在历史上已经证明是有效的,但这并不保证它在未来也会有效。市场环境的变化、新的信息和投资者行为的变化都可能影响反转因子的有效性。 3.1.3条件规则型因子 除此之外,投资者还可以根据已经掌握的行情数据设计一系列的规则型量价因子,例如经典的均线突破因子,当短期移动均线从下方穿过长期移动均线,我们认为可以择时买入,反之如果短期移动均线从上方穿过长期移动均线,我们认为可以择时卖出。此外,股票中经典的技术分析指标MACD,以及形态分析,如头肩顶,圆弧顶等,也都可以用来构造商品因子。 图3:形态分析 资料来源:国泰君安期货研究 我们在《期权CTA-趋势量价因子在波动率预测上的效果》一文中提出,动量趋势,反转和条件规则型因子可以分别与期权波动率的群聚性、均值复归性和非对称性相对应,从而其也可以作为预测期权波动率的量价因子。 3.2期限结构因子 期限结构是指同一个品种、不同到期时间的合约价格差异,可以揭示市场对未来供需状况的预期。常见的期限结构因子包括:基差因子、基差动量因子、近远月月差因子等。 对于商品期权来说,研究标的期货的期限结构也是十分重要手段。当标的的期货合约价格显著被高估或低估,与其他合约或现货价格的价差过大,由于商品期货的交割机制和均值复归性的存在,其价差在未来一段时间大概率会收敛,从而导致期权波动率的抬升。反之若各合约间价差较为平稳,呈现出一定的规律性,则波动率大概率会进一步收窄。 3.2.1基差因子 基差因子也称为基差风险或基差风险因子,衡量合约现货价格和期货价格之间差距。这种差距是由多种因素导致的,包括供需关系、交割地点和时间、存储成本以及利率等等。现货价格和期货价格并不完全一致,二者的差距(即基差)可能会随市场行情变化,这就导致了基差风险。但由于商品期货的交割机制,临近交割日的期货和现货价格通常趋于一致。因此当基差过大或者过小时,通常有套利机会的存在。 3.2.2基差动量因子 如果投资者不止想关注当前基差所在的绝对点位,同时也想了解基差变化的趋势,从而更好地进行基差风险管理和套利操作,基差动量因子是较好的参考。和价格动量原理类似,基差的动量也是基于过去一段时间基差的走势的趋势从而对后市基差进行的预判。与基差因子