您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华泰期货]:量化专题报告:持仓数据应用(上) - 发现报告
当前位置:首页/其他报告/报告详情/

量化专题报告:持仓数据应用(上)

2024-08-08高天越、李光庭、李逸资、麦锐聪、黄煦然华泰期货文***
量化专题报告:持仓数据应用(上)

期货研究报告|量化专题报告2024-08-08 持仓数据量化应专题用报告(丨2上024)/8/8 研究院量化组 研究员 高天越 0755-23887993 gaotianyue@htfc.com从业资格号:F3055799投资咨询号:Z0016156联系人 李光庭 0755-23887993 liguangting@htfc.com 从业资格号:F03108562 李逸资 0755-23887993 liyizi@htfc.com 从业资格号:F03105861 麦锐聪 0755-23887993 mairuicong@htfc.com 从业资格号:F03130381 黄煦然 0755-23887993 huangxuran@htfc.com 从业资格号:F03130959 投资咨询业务资格: 证监许可【2011】1289号 摘要 持仓数据提供了一个强大的框架来更好地理解商品市场的价格变化、风险、情绪以及投资者行为,CommodityFuturesTradingCommission(CFTC)数据是最具有市场影响力的一种持仓类型数据。 我们统计资管持仓表现。资管持仓在绝大多数品种上都能获得长期的正收益,如果构建等权组合,组合年化收益率12%,夏普达到1.2。与资管持仓不同,产业持仓普遍收益为负,仅在天然气等个别品种上为正。交易商数量在各商品上的表现与持仓数量类似,同 时更为有效。 对于原油,我们更需关注资管多头交易商以及产业空头持仓(即意味着CTA多头机构数量以及大体量的原油产业空头套保);对于咖啡,我们更需关注产业多头交易商以及资管空头持仓。 另外,由于CFTC数据延迟披露,因此其对未来的短期行情的指引性不强。我们将在后序的报告中,使用非延迟披露的中国数据对此问题做进一步分析。 目录 摘要1 CFTC数据简要介绍3 ■CFTC数据概况3 ■CFTC数据统计5 ■CFTC对行情解释性10 图表 图1:COMEX铜多头持仓分布|单位:手4 图2:COMEX铜空头持仓分布|单位:手4 图3:CFTC数据(周二截面)于每周五发布|单位:无4 图4:持仓收益较高,跟踪收益减弱丨单位:%6 图5:各类型持仓收益对比丨单位:%8 图6:MM持仓收益对比MM交易商收益丨单位:%9 表1:CFTC数据不同划分标准丨单位:无3 表2:资管持仓收益丨单位:%5 表3:产业持仓收益丨单位:%7 表4:资管与产业近5年平均净头寸丨单位:手7 表5:资管交易商收益丨单位:%9 表6:持仓与交易商数据平均MSE丨单位:0.00110 表7:各商品交易商数量重要性丨单位:%11 表8:各商品持仓数量重要性丨单位:%11 CFTC数据简要介绍 ■CFTC数据概况 持仓数据提供了一个强大的框架来更好地理解商品市场的价格变化、风险、情绪以及投资者行为。首先,持仓数据向我们展示了谁在交易什么,以及他们在交易多少。其次,持仓分析帮助我们识别数据中的行为模式,并了解特定变量的变化如何影响持仓、影响 情绪和驱动价格。综合来看,基于标准的持仓数据辅以其他类型的变量如商品价格、曲线结构、基本面(如库存、季节性因素)、汇率、更广泛的宏观经济环境的变化,以及市场的风险和不确定性等等——可以用来开发模型、产生信号、归因分析。 CommodityFuturesTradingCommission(CFTC)数据是最具有市场影响力的一种持仓类型数据。该数据始于1924年,当时美国农业部(USDA)谷物期货管理局发布了第一份关于受监管的期货市场对冲和投机的全面年度报告;1962年,该数据开始每月公布;1990年,CFTC开始在月中和月底发布数据;1992年每两周发布一次;2000年每周发 布一次。 CFTC数据存在若干不同格式的版本,本文后续主要采用的是DisaggregatedReport中披露的数据,针对一般商品而言,其内容主要包括:1、Producer/Merchant/Processor/User(PMPU或称产业);2、SwapDealer(SD或称互换商);3、MoneyManager(MM或称资管);4、OtherReportables(OR或称其他)以及5、NonReportable(NR或称非报告)的多、空、套利持仓量(套利指持有相同头寸的多空部分)。另外,在其他不同的版本中,常将PMPU与SD统称为Commercial(C或称商业),将MM与OR统称为 Non-Commercial(NC或称非商业)。以多头持仓量为例,其可以按照不同层级划分如下: 表1:CFTC数据不同划分标准丨单位:无 Layer1Layer2Layer3Layer4 互换交易商套利持仓互换交易商多头持仓 生产商/贸易商/加工企业 /用户多头持仓 资产管理机构多头持仓其他多头持仓 资产管理机构套利持仓其他套利持仓 商业多头持仓 非商业多头持仓非商业套利持仓 报告头寸多头总持仓 总持仓 非报告头寸多头持仓非报告头寸多头持仓非报告头寸多头持仓 数据来源:CFTC华泰期货研究院 以COMEX铜2019年1月8日数据为例,可以分别对多空方向做�以下树状图,其中PMPU、SD、MM、OR、NR含义参考上文,末位字母D代表套利持仓,L代表多头持仓,S代表空头持仓。可以看�图中空头持仓更为集中,而多头持仓分布更为分散。 图1:COMEX铜多头持仓分布|单位:手图2:COMEX铜空头持仓分布|单位:手 数据来源:CFTC华泰期货研究院数据来源:CFTC华泰期货研究院 另外,对于PMPU、SD、MM、OR,CFTC额外披露交易员数量信息,但同一交易员可以同时持有多头仓位与空头仓位,因此该类型数据无法与上图类似构建加总的树状图。 CFTC数据每周五下午15:30发布(美国东部时间),实际数据截面日期为前一个周二 (“报告日期”),这意味着数据滞后了三个交易日(周三、周四和周五)。同时它也是在所有大宗商品期货市场收盘后发布的,因此,基于数据的交易信号实际只能在接下来的周一实施。但是,在本文中我们首先考虑该数据的有效性,其次才考虑数据的可用性,因此我们参考《AdvancedPositioning,Flow,andSentimentAnalysisinCommodityMarkets》(后称引用文献),设计了如下图的统计方式。 图3:CFTC数据(周二截面)于每周五发布|单位:无 数据来源:AdvancedPositioning,Flow,andSentimentAnalysisinCommodityMarkets华泰期货研究院 ■CFTC数据统计 具体而言, 1)记录每种商品在交易周开始和结束时(从周二到周二),各类别的净头寸(多头减去空头,套利头寸互相抵消)。 2)如果净头寸在交易周开始和结束时方向上相同(净多或净空),则假设该头寸在整个周方向上保持不变。请注意,我们只考虑了该位置的净方向,因为没有办法知道该位置的大小是否在周内发生变化,或如何发生变化。 3)如果在交易周结束时的净头寸有方向性差异,则从评估中忽略这一周,因为没有办法知道该头寸何时发生了变化。对于每一种商品,记录被忽略的总周数,并报告其占比,该指标说明了统计结果的可信度(对应图中覆盖率)。 4)记录交易周内各商品期货价格的变化率。我们使用复权期货价格,以消除任何与期货合约到期有关的问题。 5)根据各类别持仓的净方向以及各商品期货价格的变化率,计算收益率并累加。 表2:资管持仓收益丨单位:% 数据来源:CFTC华泰期货研究院 我们首先统计资管类型(MM)持仓表现。从结果来看,天然气以年平均44%的收益居于首位,注意到在引用文献中统计了2009年至2018年的数据,同样是天然气排名第一;而小麦与铂金在文献中分列倒数第二与倒数第四,在最近六年同样排名倒数一二。因此, 我们有理由认为资管类型持仓在不同商品上的表现具有持续性。 资管持仓在绝大多数品种上都能获得长期的正收益,如果构建等权组合,组合年化收益率12%,夏普达到1.2,除2020年全球疫情突发事件外,长期保持稳健收益。然而,考虑到CFTC实际在每周五才披露,因此如果跟踪CFTC数据构建持仓,将有长达8个交易日的延迟,实际跟踪收益显著下降。如果CFTC数据能够提前到每周二发布(即每周二公布最新持仓),也没有明显效果。 图4:持仓收益较高,跟踪收益减弱丨单位:% 数据来源:CFTC华泰期货研究院 除资管持仓外,我们还重点关注产业持仓(PMPU)。与资管持仓不同,产业持仓普遍收益为负,仅在天然气等个别品种上为正。另外,产业持仓与资管持仓常常收益刚好相反,如2号油、汽油、钯金等,均是产业长期亏损、同时资管长期盈利的商品。 表3:产业持仓收益丨单位:% 数据来源:CFTC华泰期货研究院 值得注意的是尽管产业持仓收益显著弱于资管持仓,但考虑到过去较长时间处于整体商品牛市,而产业天然倾向于做空,在牛市环境中较为不利,因此并不能简单认为资管持仓一定比产业持仓更能准确预测行情。 表4:资管与产业近5年平均净头寸丨单位:手 数据来源:CFTC华泰期货研究院 对于互换商(SD)、其他(OR)、非报告(NR)持仓,由于未见显著的特征,考虑到篇幅在此不赘述,仅列�持仓收益供参考。总体来看,SD、OR、NR持仓均与MM相似,但收益弱于MM。 图5:各类型持仓收益对比丨单位:% 数据来源:CFTC华泰期货研究院 除以上五类型的持仓数据外,CFTC也披露产业(PMPU)、资管(MM)、互换商(SD)、其他(OR)的交易商数量。与上文处理持仓数据类似,我们同样分五步骤来处理交易商数量。 整体来看,交易商数量非常有效,仅有育肥牛、活牛两个商品的平均收益为负,其他商品的平均收益均较高。组合平均年化收益率达到17%,夏普达到1.7。 另外,交易商数量在各商品上的收益与持仓数量类似,同时更为有效。该结论与引用文献中的结论一致。针对此现象,文献中并未给�明确的原因或猜想。我们将在本文第三部分CFTC解释性构建中,以及本系列后序报告中详细讨论交易商数量优于持仓数量这一特征。 表5:资管交易商收益丨单位:% 数据来源:CFTC华泰期货研究院 图6:MM持仓收益对比MM交易商收益丨单位:% 数据来源:CFTC华泰期货研究院 ■CFTC对行情解释性 我们参考引用文献,分别构建基于持仓数量、交易商数量以及二者皆有的决策树模型。第一步,我们根据模型判断持仓数量、交易商数量对商品价格的解释性。 模型具体数据如下: 1.训练时段:2019年01月至2022年10月; 2.验证时段:2022年10月至2024年5月; 3.商品品种:11号糖,1号铜,2号供热用油,钯金,白银,铂金,大豆,豆粕,豆油,黄金,咖啡,棉花,汽油(RBOB),轻质低硫原油,天然气,小麦,玉米; 4.训练因子:持仓:MM、PMPU、SD、OR、NR多、空、套利持仓数量;交易商:MM、PMPU、SD、OR多、空、套利交易商数量; 表6:持仓与交易商数据平均MSE丨单位:0.001 数据来源:CFTC华泰期货研究院 前文我们发现在收益上,净持仓<净交易商;根据决策树结果,在非线性的解释性上,持仓相关数据仍旧小于交易商相关数据。交易商平均MSE约比持仓平均MSE缩小15%。 下表展示了不同类型数据在不同商品上的重要性。特别值得注意的是,对于原油,我们更需关注资管多头交易商以及产业空头持仓(即意味着CTA多头机构数量以及大体量的原油产业空头套保);对于咖啡,我们更需关注产业多头交易商以及资管空头持仓。 当然,正如上文所述,由于CFTC数据延迟披露,因此其对未来的短期行情的指引性不强。我们将在后序的报告中,使用非延迟披露的中国数据对此问题做进一步分析。 表7:各商品交易商数量重要性丨单位:% 数据来源:CFTC华泰期货研究院 表8:各商品持仓数量重要性丨单位:% 数据来源:CFTC华泰期货研究院 免责声明 本报告基于本公司认为可靠的、已公开的信息编制,但本