您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:CTA金点子系列之二:基于日内高频博弈信息的商品CTA策略 - 发现报告
当前位置:首页/宏观策略/报告详情/

CTA金点子系列之二:基于日内高频博弈信息的商品CTA策略

2024-02-04赵妍、高智威国金证券高***
CTA金点子系列之二:基于日内高频博弈信息的商品CTA策略

-- CTA截面策略的新方法 CTA策略在2021年和2022年表现较好,但2023年,传统CTA策略收益有一定下滑,宏观干扰和纯资金驱动的摩擦与波动率走低对策略影响较大,部分长周期基本面因子效果逐渐变差,常见的趋势类策略也面临一定的拥挤困境。传统投资策略在信息获取和执行效率上逐渐显露出瓶颈,而高频交易信息的挖掘为投资者提供了全新的思路。本篇报告是CTA金点子系列的第二篇,我们对商品期货日内高频交易信息进行挖掘和特征提炼,探索了高频信息在截面策略上的应用。 商品期货市场高频数据的特征 高频快照数据包含了大量的细节信息,商品市场的数据包含了时间、交易量、价格、买卖盘情况等主要交易信息。区别于普通的快照数据,商品市场的快照数据有两个明显特征:第一,快照间隔理论为500ms,各交易所记录数据有略微差异;其次,每个品种每天的快照数据量也有所波动。交易规则的变化也对高频数据影响较大,需要区分不同规则下数据记录的特点,集合竞价的处理有所不同。 高频信息的因子挖掘 我们拆分了三个维度和五个核心因子,分别是买入意愿、流动性溢价、大单影响力、价格拐点和日内动量反转,对每个因子进行了IC测试和分位数组合测试,评估了因子的有效性和稳定性,通过对因子等权合成,合成因子IC值3.85%,T值6.84,合成因子的多空分位数组合年化收益率24.48%,最大回撤11.40%,净值曲线增长平稳。我们还额外讨论了因子相关性与因子衰减。 CTA截面稳健策略构建 基于风险分散的原则,我们可根据合成因子每日进行品种挑选,选择交易表现最好的品种进行做多,选择交易表现最差的品种进行做空,每一期持仓全市场品种可以从10%至100%,严格控制多空资金分配为1:1下,总体持仓风险小。当持有全市场组合时风险最低。 每个交易日我们计算当日日内特征的合成因子,通过因子排序选择交易表现最好的50%的品种进行做多,选择交易表现最差的50%的品种进行做空,每一期持仓全市场品种100%,不设置杠杆。因子的换手率缓冲设置为20%在没有杠杆设置的水平下,策略年化收益率为7.84%,夏普比率为1.08,卡玛比率为0.99,对比全市场等权多头和等权空头,策略优势明显,净值增长平稳。策略的双边换手率为52%,换手也同时得到有效控制。 分年度看,对比市场等权多头持仓和空头持仓,商品截面稳健策略在市场上行、下行和波动的不同区间均有较好表现,策略依赖于日内的交易信息和特征,不依赖整体市场的涨跌方向,对传统的时序趋势和反转策略是一个良好的补充。 风险提示 以上结果通过历史数据统计、建模和测算完成,历史规律未来可能存在失效。 内容目录 一、CTA截面策略的新方法4 二、商品期货市场高频数据的特征4 三、高频信息的因子挖掘5 3.1日内特征的构建与策略原理5 3.2因子测试方法5 3.3买入意愿因子6 3.4流动性溢价因子7 3.5大单影响力因子7 3.6价格拐点因子8 3.7日内动量反转因子9 3.8因子合成与因子衰减9 四、商品截面稳健策略构建11 4.1策略测试11 4.2策略构建与策略表现13 五、总结15 风险提示15 图表目录 图表1:交易规则区别梳理4 图表2:三个维度五个核心因子5 图表3:买入意愿因子IC测试6 图表4:买入意愿因子分位数组合净值7 图表5:买入意愿因子分位数组合年化收益率7 图表6:流动性溢价因子IC7 图表7:流动性溢价因子分位数组合净值7 图表8:流动性溢价因子分位数组合年化收益率7 图表9:大单影响力因子IC8 图表10:大单影响力因子分位数组合净值8 图表11:大单影响力因子分位数组合年化收益率8 图表12:价格拐点因子IC8 图表13:价格拐点因子分位数组合净值9 图表14:价格拐点因子分位数组合年化收益率9 图表15:日内动量反转因子IC测试9 图表16:日内动量反转因子分位数组合净值9 图表17:日内动量反转因子分位数组合年化收益率9 图表18:各因子sperman相关系数10 图表19:各因子多空分位数组合净值曲线10 图表20:合成因子IC测试(日频)10 图表21:合成因子分位数组合净值10 图表22:合成因子分位数组合年化收益率10 图表23:合成因子多空收益净值11 图表24:细分因子与合成因子IC衰减11 图表25:策略回测条件设置11 图表26:不同持仓比例下的策略指标12 图表27:不同手续费下持仓50%策略指标12 图表28:每一期50%持仓下各换手缓冲比率的策略表现指标12 图表29:25%缓换手冲下策略的收益表现13 图表30:策略回测净值曲线13 图表31:隔日开盘价成交策略指标14 图表32:策略指标14 图表33:策略的年度收益与市场等权组合年度收益14 一、CTA截面策略的新方法 CTA策略在2021年和2022年表现较好,但2023年,传统CTA策略收益有一定下滑,宏观干扰和纯资金驱动的摩擦与波动率走低对策略影响较大,部分长周期基本面因子效果逐渐变差,常见的趋势类策略也面临一定的拥挤困境。 传统投资策略在信息获取和执行效率上逐渐显露出瓶颈,而高频交易信息的挖掘为投资者提供了全新的思路。本篇报告是CTA金点子系列的第二篇,我们对商品期货日内高频交易信息进行挖掘和特征提炼,探索了高频信息在截面策略上的应用。 二、商品期货市场高频数据的特征 交易所 品种 夜盘交易时间 日盘交易时间 集合竞价申报(可报撤单) 夜盘交易时间集合竞价撮合(该时段不能报 撤单) 连续竞价 夜盘未成交申报单可取消 不可进行任何操作 连续竞价 郑州商品交易所 白糖、棉花、棉纱、甲醇、PTA、动力煤、玻璃、菜籽油、菜粕、短纤、 纯碱 20:55-20:59 20:59-21:00 21:00-23:00 8:55-8:59 8:59-9:00 9:00-10:15 10:30-11:3013:30-15:00 大连商品交易所 棕榈油、焦炭、焦煤、铁矿石、线型低密度聚乙烯、聚氯乙烯、聚丙烯、乙二醇、玉米、玉米淀粉、豆粕、豆油、豆一、豆二、粳米、苯乙烯、液 化石油气 20:55-20:59 20:59-21:00 21:00-23:00 8:55-8:59 8:59-9:00 9:00-10:15 10:30-11:3013:30-15:00 图表1:交易规则区别梳理 高频快照数据包含了大量的细节信息,商品市场的数据包含了时间、交易量、价格、买卖盘情况等主要交易信息。区别于普通的快照数据,商品市场的快照数据有两个明显特征:第一,快照间隔理论为500ms,但只有上期所和上能所的快照时点严格遵守500毫秒的间隔,并在整秒处进行记录(例如21:00:01:500ms,21:00:02:0ms),郑商所没有明确的快照间隔记录信息,大商所的快照间隔为非整数间隔;其次,每个品种每天的快照数据量也有所波动。影响数据量的具体因素有两点:1)市场的活跃程度差异会导致快照数据量的不同。部分流动性较差商品没有任何交易数据时不会触发快照数据返回,导致记录差异;2)交易时间的不同也会影响数据量的多少,夜盘交易品种交易时间明显长于仅日盘交易的品种。 交易规则的变化也对高频数据影响较大,需要区分不同规则下数据记录的特点,集合竞价的处理有所不同。自2023年5月26日起,上期所、上期能源和大商所对于开设连续交易 的品种(夜盘品种),在日盘开盘前5分钟(即8:55至9:00)增加集合竞价环节,其中指令申报时间为8:55至8:59;撮合成交时间为8:59至9:00,夜盘未成交申报单自动参与日盘集合竞价。郑商所对于夜盘品种增加“夜盘交易中的未成交申报单,可以在同一交易日上午8:55至8:59之间取消”的规定。 交易所 品种 夜盘交易时间 日盘交易时间 集合竞价申报(可报撤单) 夜盘交易时间集合竞价撮合(该时段不能报 撤单) 连续竞价 夜盘未成交申报单可取消 不可进行任何操作 连续竞价 上海期货交易所 黄金、白银铜、铝、锌、铅、镍、锡、不锈钢天然橡胶、螺纹钢、热轧卷板、燃料油、石油沥 青、纸浆 20:55-20:59 20:59-21:00 21:00-2:3021:00-1:00 21:00-23:00 上海国际能源交易中心 原油、国际铜20号胶、低硫燃料 油 20:55-20:59 20:59-21:00 21:00-2:3021:00-1:00 21:00-23:00 来源:郑州商品交易所,大连商品交易所,上海期货交易所,上海期货交易所,上海国际能源交易中心,国金证券研究所 三、高频信息的因子挖掘 3.1日内特征的构建与策略原理 高频数据中,及时的买卖双方的信息与价格成交信息都蕴含了很多交易内容,为了利用好这些信息从而得到有效的交易信号,我们拆分了三个维度和五个核心因子去描述商品日内的交易特征。 图表2:三个维度五个核心因子 来源:国金证券研究所 商品市场的多空便利为策略构建带来了更多的可能性,截面策略目标下构建的因子本身对单品种行情涨跌可能没有指向性,但是我们希望交易信息更优的品种能够获取相对收益,当持仓足够分散,相对收益明显,截面策略或能获取持续稳定的alpha收益。 3.2因子测试方法 为了评估选股因子的有效性,我们采用因子IC测试和构建分位数组合的方法进行研究。因子IC测试主要研究因子取值与下一期收益率的相关性。其中,Rank表示计算变量排序, 𝑋𝑡,�表示因子取值,𝑟𝑡+1,�表示下一期股票的收益率。IC的绝对值越高,因子的下期收益率的预测能力越强。 𝑅𝑎𝑛𝑘𝐼𝐶�=𝑐𝑜𝑟�(𝑅𝑎𝑛𝑘(𝑋𝑡,𝑚),𝑅𝑎𝑛𝑘(𝑟𝑡+1,𝑚)) 对于分位数组合测试,我们按照因子值从高到低,将商品分为5组,分别等权构建Top组 合至Bottom组合,做多组合Top同时做空组合Bottom,得到多空组合(L-S组合),通过该组合的表现来衡量因子的预测能力。回测频率为日频,回测时间区间为2018年1月1 日至2023年5月31日。 测试价格方面,我们使用的是各商品主力的后复权价,在确定主力合约时,我们使用成交量达到最大的合约作为主力合约,并且主力合约不会向前回切。 close𝑜𝑙𝑑,� 𝐴𝑑𝑗�=𝐴𝑑𝑗𝑖−1∗close 𝑛𝑒𝑤,� close𝑛𝑒𝑤,𝑡+1∗𝐴𝑑𝑗� 𝑅𝑡+1=close 𝑜𝑙𝑑,� −1 ∗𝐴𝑑𝑗𝑖−1 close𝑛𝑒𝑤,𝑡+1 =−1 close𝑛𝑒𝑤,� 其中,𝐴𝑑�表示复权因子,close代表期货收盘价,t代表主力切换时间,𝑅𝑡+1代表由期货收盘价计算的日收益率,从公式可以看出,后复权处理价格后,策略的收益率等于实际发生收益率。后复权时我们使用的基期日期为2010年1月1日,若品种上市时间晚于2010年,以上市日期为基准日期。 值得注意的是,为了保证截面策略交易特征提取的相互可比性,我们会剔除流动性过差而快照数据过少的品种。 3.3买入意愿因子 快照数据能够看出每一个快照瞬间的挂单细节,买一和卖一作为还未成交的挂单,如果买单持续多于卖单,代表买入的意愿更强,反之亦然。在这个因子中,我们用买单多于卖单的快照记录除以总快照记录,它代表在一天的交易时间中,买单多于卖单的时间所占的比例,该比例越大,说明市场对该品种买入意愿越强烈,而该品种后市相对优势的可能性就越大。 𝑏𝑢𝑦_𝑠𝑒𝑙�= count𝑏𝑢𝑦>𝑠𝑒𝑙� 𝑐𝑜𝑢𝑛� 𝑎𝑙� 其中𝑏𝑢𝑦_𝑠𝑒𝑙�为买入意愿因子,count𝑏𝑢𝑦>𝑠𝑒𝑙�是一个交易日内快照瞬间买一大于卖一的总快照数量,𝑐𝑜𝑢𝑛𝑡𝑎𝑙�是一个交易日内的所有快照数量。从测试结果看,整体上t值显著,并且因子排序的方向与因子构建的本身逻辑相符合。 买入意愿因子IC值相对不高,但对于截面的多空策略来说,分位数组合单调性和多空收益的稳定性也是非常重要的维度。买入意愿因子