中信期货研究|商品期权 2023-09-22 报告要点 报告主要对机器学习与期权结合策略进行了研究,发现波动率优化策略在卡玛比率和最长衰退期上都有较大优化,显示出期权多维特征对策略的优化效果。 摘要: 商品期权与机器学习结合策略研究 投资咨询业务资格: 证监许可【2012】669号 115 113 报告主要研究了如何将机器学习与商品期权结合,通过期权的特征优化机器学习策略。111 109 107 105 机器学习策略主要通过运用机器学习方法和技术分析结合,找到历史当中最为相近的 行情,进而预测未来价格走势。期权波动率有均值回归、聚集性、趋势性等特征,结合期103 权特性,可以对机器学习策略进行优化。 根据机器学习信号,对应分别采用卖期权、买期权和波动率优化策略。 通过对10个场内商品期权与机器学习结合策略研究发现,利用波动率的均值回归等特性,在波动率偏低时通过买期权构建机器学习策略,在波动率高时卖期权构建机器学习策略,多数品种的表现是对最长衰退期优化幅度较大,铝、甲醇、白糖、菜粕波动率优化策略在卡玛比率和最长衰退期上都有一定程度的优化。 将各个品种的卖期权、买期权、波动率优化机器学习策略进行等权重组合,发现相对于标的组合,波动率优化策略卡玛比率为3.52,优于标的的3.24,同时最长衰退期仅为69,远低于标的的116,波动率优化组合效果明显。 利用商品期权特征优化机器学习策略,可以取得较好效果,显示出期权多维工具的特征。 风险提示:数据处理偏差;策略参数有效性;交易环境变化 中信期货商品指数走势 中信期货沪深300股指期货指数 中信期货商品指数 中信期货十年期国债期货指数 2020-09-07 2020-09-21 2020-10-13 2020-10-27 2020-11-10 2020-11-24 2020-12-08 2020-12-22 2021-01-06 2021-01-20 2021-02-03 2021-02-24 2021-03-10 2021-03-24 2021-04-08 2021-04-22 2021-05-11 2021-05-25 2021-06-08 2021-06-23 2021-07-07 权益及期权策略组研究员: 魏新照 021-80401773 weixinzhao@citicsf.com 从业资格号F3084987 投资咨询号Z0016364 240 220 200 180 160 140 120 100 重要提示:本报告非期货交易咨询业务项下服务,其中的观点和信息仅作参考之用,不构成对任何人的投资建议。我司不会因为关注、收到或阅读本报告内容而视相关人员为客户;市场有风险,投资需谨慎。 目录 摘要:1 一、机器学习与技术分析6 (一)机器学习介绍6 1、机器学习分类6 2、监督学习介绍8 (二)技术分析应用14 1、三大假设14 2、形态理论15 二、期权特征解析16 (一)基础策略16 (二)时间价值17 (三)波动率18 三、期权与机器学习结合策略19 (一)策略构建19 (二)金属板块20 1、铜20 2、铝23 3、锌26 4、黄金29 5、铁矿32 (三)能化板块35 1、PTA35 2、甲醇38 (四)农副板块41 1、棉花41 2、白糖44 3、菜粕47 (五)策略组合50 五、总结51 免责声明53 图表目录 图表1:机器学习根据任务类型分类7 图表2:机器学习根据算法类型分类7 图表3:KNN算法图示8 图表4:SVM算法图示9 图表5:决策树算法图示10 图表6:随机森林算法图示11 图表7:线性回归算法图示12 图表8:Sigmod函数13 图表9:BP神经网络算法图示14 图表10:整理与反转形态15 图表11:期权基础策略16 图表12:期权时间价值递减规律17 图表13:PTA期权隐含波动率18 图表14:PTA期权隐含波动率单位根检验与一阶自回归18 图表15:期权机器学习策略回测品种19 图表16:铜卖期权机器学习策略收益率曲线20 图表17:铜买期权机器学习策略收益率曲线21 图表18:铜期权机器学习策略收益率参数21 图表19:铜期权隐含波动率滑动平均22 图表20:铜波动率优化机器学习策略收益率曲线22 图表21:铜波动率优化机器学习策略收益率参数22 图表22:铜期权各机器学习策略收益率参数对比23 图表23:铝卖期权机器学习策略收益率曲线23 图表24:铝买期权机器学习策略收益率曲线24 图表25:铝期权机器学习策略收益率曲线参数24 图表26:铝期权隐含波动率滑动平均25 图表27:铝波动率优化机器学习策略收益率曲线25 图表28:铝波动率优化机器学习策略收益率参数25 图表29:铝期权各机器学习策略收益率参数对比26 图表30:锌卖期权机器学习策略收益率曲线26 图表31:锌买期权机器学习策略收益率曲线27 图表32:锌期权机器学习策略收益率曲线参数27 图表33:锌期权隐含波动率滑动平均28 图表34:锌波动率优化机器学习策略收益率曲线28 图表35:锌波动率优化机器学习策略收益率参数28 图表36:锌期权各机器学习策略收益率参数对比28 图表37:黄金卖期权机器学习策略收益率曲线29 图表38:黄金买期权机器学习策略收益率曲线30 图表39:黄金期权机器学习策略收益率曲线参数30 图表40:黄金期权隐含波动率滑动平均31 图表41:黄金波动率优化机器学习策略收益率曲线31 图表42:黄金波动率优化机器学习策略收益率参数31 图表43:黄金期权各机器学习策略收益率参数对比32 图表44:铁矿卖期权机器学习策略收益率曲线32 图表45:铁矿买期权机器学习策略收益率曲线33 图表46:铁矿期权机器学习策略收益率曲线参数33 图表47:铁矿期权隐含波动率滑动平均34 图表48:铁矿波动率优化机器学习策略收益率曲线34 图表49:铁矿波动率优化机器学习策略收益率参数34 图表50:铁矿期权各机器学习策略收益率参数对比35 图表51:PTA卖期权机器学习策略收益率曲线35 图表52:PTA买期权机器学习策略收益率曲线36 图表53:PTA期权机器学习策略收益率曲线参数36 图表54:PTA期权隐含波动率滑动平均37 图表55:PTA波动率优化机器学习策略收益率曲线37 图表56:PTA波动率优化机器学习策略收益率参数37 图表57:PTA期权各机器学习策略收益率参数对比37 图表58:甲醇卖期权机器学习策略收益率曲线39 图表59:甲醇买期权机器学习策略收益率曲线39 图表60:甲醇期权机器学习策略收益率曲线参数40 图表61:甲醇期权隐含波动率滑动平均40 图表62:甲醇波动率优化机器学习策略收益率曲线41 图表63:甲醇波动率优化机器学习策略收益率参数41 图表64:甲醇期权各机器学习策略收益率参数对比41 图表65:棉花卖期权机器学习策略收益率曲线42 图表66:棉花买期权机器学习策略收益率曲线42 图表67:棉花期权机器学习策略收益率曲线参数43 图表68:棉花期权隐含波动率滑动平均43 图表69:棉花波动率优化机器学习策略收益率曲线44 图表70:棉花波动率优化机器学习策略收益率参数44 图表71:棉花期权各机器学习策略收益率参数对比44 图表72:白糖卖期权机器学习策略收益率曲线45 图表73:白糖买期权机器学习策略收益率曲线45 图表74:白糖期权机器学习策略收益率曲线参数46 图表75:白糖期权隐含波动率滑动平均46 图表76:白糖波动率优化机器学习策略收益率曲线47 图表77:白糖波动率优化机器学习策略收益率参数47 图表78:白糖期权各机器学习策略收益率参数对比47 图表79:菜粕卖期权机器学习策略收益率曲线48 图表80:菜粕买期权机器学习策略收益率曲线48 图表81:菜粕期权机器学习策略收益率曲线参数49 图表82:菜粕期权隐含波动率滑动平均49 图表83:菜粕波动率优化机器学习策略收益率曲线50 图表84:菜粕波动率优化机器学习策略收益率参数50 图表85:菜粕期权各机器学习策略收益率参数对比50 图表86:机器学习策略组合收益率曲线51 图表87:机器学习策略组合收益率曲线参数51 一、机器学习与技术分析 (一)机器学习介绍 这一部分主要介绍机器学习基础,并对一些可以应用的监督学习方法进行介绍。 1、机器学习分类 TomMichaelMitchell在1997年给出机器学习一个形式化的定义:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。 机器学习致力于如何通过计算手段,利用经验来改善系统自身的性能。在计算机系统中,经验通常以数据形式存在,利用计算机从数据中产生模型算法,即“学习算法”,是机器学习的主要内容。如果把经验数据提供给学习算法,就能产生相应的模型,在面对新情况时,模型会提供相应的判断。 简而言之,机器学习是从经验数据中获得模型,进而预测未来。 一般的机器学习流程是输入数据、训练模型、模型预测,输入的数据是数据集,其中每一条记录称为一个示例,示例中包含对象的属性,如果示例信息中包含标记,那么该示例称为样例。 机器学习根据任务类型,可以分为无监督学习、监督学习、半监督学习、强化学习。其中无监督学习是训练数据中不包含标记,该任务可以再分为聚类和降维;监督学习是训练数据中包含标记,如果标记为离散值,则该任务是分类任务,如果是连续的,该任务是回归任务。半监督学习介于监督学习和无监督学习之间,用大量的未标记训练数据和少量的已标记数据来训练模型。强化学习以环境反馈 (奖/惩信号)作为输入,以统计和动态规划技术为指导的一种学习方法。 聚类 降维 分类 回归 无监督学习 监督学习 图表1:机器学习根据任务类型分类 半监督学习 强化学习 机器学习 资料来源:中信期货研究所 根据算法类型,机器学习可以分为传统统计学习和深度学习。 传统统计学习基于严格的数学推理,具有可解释性强、运行速度快、可应用于小规模数据集的特点。如SVM、逻辑回归、决策树等。 深度学习是基于神经网络的机器学习方法,包括前馈神经网络、卷积神经网络等。这类方法可解释性较差,强烈依赖于数据集规模,但在语音、视觉处理方面很成功。 传统统计学习 SVM、逻辑回归、决策树、朴素贝叶斯 深度学习 前馈神经网络、卷积神经网络 机器学习 图表2:机器学习根据算法类型分类 资料来源:中信期货研究所 机器学习在期货策略应用方面,对于价格预测,显然上涨和下跌是数据集的标记,因此可以使用监督学习和深度学习模型,再结合金融理论对期货价格涨跌进行预测。 2、监督学习介绍 KNN算法 10最近点 8 预测点 6 4 2 0 -10 -8 -6 -4 -2 0 2 4 6 8 10 -2 -4 -6 -8 -10 特征1 图表3:KNN算法图示 这一部分主要对可用于期货价格预测的8种监督学习方法进行介绍,包括KNN、SVM、朴素贝叶斯、决策树、随机森林、逻辑回归、线性回归、BP神经网络,这些方法可以与技术分析理论有机结合。 (1)KNN KNN算法多用于分类问题,算法逻辑是先记录所有已知数据,再使用一个距离函数,找出已知数据中距离未知事件最近的K组数据,最后根据这K组中类别最多的作为预测结果。 距离函数有欧式距离、曼哈顿距离、闵氏距离、汉明距离,在后文中预测价格时,使用欧式距离。 该算法计算成本较高,一般需要对原始数据进行标准化处理。 特征2 资料来源:中信期货研究所 以图中为例,假设分类任务有纵横坐标两个特征,当K=1时,与预测点距离最近的点如图所示,那么预测点就归为最近点的分类。 (2)SVM SVM即支持向量机,一般应用于二分类问题。它将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面,在分类超平面的正负两边各找到一个离分类超平面最近