您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰期货]:因子与指数投资揭秘系列二十六:豆粕基本面与量价择时多因子模型研究 - 发现报告

因子与指数投资揭秘系列二十六:豆粕基本面与量价择时多因子模型研究

2025-03-31虞堪、高宇飞国泰期货x***
因子与指数投资揭秘系列二十六:豆粕基本面与量价择时多因子模型研究

期货研究 二二五年度 国泰君安期货研究所 2025年4月1日 因子与指数投资揭秘系列二十六:豆粕基本面与量价择时多因子模型研究 虞堪投资咨询从业资格号:Z0002804yukan010359gtjascom 高宇飞(联系人)从业资格号:F03124155gaoyufei028920gtjascom 报告导读: 豆粕是大豆经过提取豆油后得到的一种副产品,在饲料生产中具有不可替代的地位,约70的豆粕用于家禽和猪的饲养。影响豆粕期货价格的因素复杂多样,我们可以考虑上游大豆供应和压榨量,中游豆粕自身的库存、仓单、基差和压榨利润,以及与菜粕的替代价格,下游的生猪存栏量等。基本面量化因子涵盖上述方向的9个因子,量价因子包括日内动量、双均线、考夫曼均线等9个因子。通过回测和筛选,设定回测时间、手续费、杠杆等参数,以简单等权相加的方式组合因子,输出趋势强度信号。 目前该模型总共包含9个基本面量化因子和9个量价因子。其中,基本面量化因子包括:1中国大豆压榨企业原料大豆库存;2大豆港口库存;3大豆压榨现货利润;4大豆压榨盘面利润;5豆粕基差;6豆粕仓单;7豆粕库存;8豆菜价差;9生猪存栏。 量价因子包括:1豆粕日内动量;2双均线;3中值双均线;4考夫曼均线;5顺势指标CCI;6TRIX 指标;7布林带;8波动趋势;9佳庆指标。 基本面多因子组合自2016年起年化收益率279,夏普比率259。量价多因子组合自2010年起年化收益率143,夏普比率135。在综合模型中,我们将所有单因子等权组合,自2010年起年化收益率173,夏普比率166。基本面因子与量价因子相关性低。我们还可以根据需求,构造仅做多和仅做空的多因子模型。 建议投资者可以根据目标收益和风险要求,调整综合模型中基本面类和量价类因子的比例。在基本面和量价因子的收益中,多头收益高于空头收益,但仅做空模型在样本内外的表现也相对稳定。综合模型则可以在提升择时效果的同时,降低模型过拟合的风险。 风险提示:关注海内外宏观情绪变化,注意地缘事件和政策上的扰动 目录 1豆粕单商品择时因子框架3 2豆粕基本面量化因子介绍及回测结果4 21中国大豆压榨企业原料大豆库存4 22大豆港口库存4 23大豆压榨现货利润5 24大豆压榨盘面利润5 25豆粕基差6 26豆粕仓单6 27豆粕库存6 28豆菜价差7 29生猪存栏7 210基本面多因子8 3豆粕量价因子介绍及回测结果8 31豆粕日内动量8 32双均线9 33中值双均线9 34考夫曼均线10 35顺势指标CCI。10 36TRIX指标11 37布林带12 38波动趋势12 39佳庆指标12 310量价多因子13 4基本面量化和量价多因子综合模型13 41全因子组合多空模型13 42仅做多模型14 43仅做空模型15 (正文) 1豆粕单商品择时因子框架 作为商品,豆粕在国民经济中是重要的农产品。豆粕期货是我国最重要的商品期货品种之一,也是上市最早的商品期货品种之一。上市以来其交易活跃,上下游产业链较为清晰。同时,豆粕也是ETF化较为成功的商品品种。 在我们的模型中,我们将其分为基本面量化因子和量价因子两大类。在基本面量化的部分,我们分别从库存、基差、上游库存、利润、豆菜价差和下游需求等维度寻找相关的基本面数据,构造因子。在量价因子的部分,我们分别从动量、均线、布林带、顺势、波动、技术指标等维度,基于日频级别的行情数据,构造因子。具体来说,可以用以下结构图表示: 图1:豆粕单商品择时因子框架结构图 资料来源:国泰君安期货研究 截至本文撰写时,该模型总共包含9个基本面量化因子和9个量价因子。 其中,基本面量化因子包括:1中国大豆压榨企业原料大豆库存;2大豆港口库存;3大豆压榨现货利润;4大豆压榨盘面利润;5豆粕基差;6豆粕仓单;7豆粕库存;8豆菜价差;9生猪存栏。 量价因子包括:1豆粕日内动量;2双均线;3中值双均线;4考夫曼均线;5顺势指标CCI;6TRIX 指标;7布林带;8波动趋势;9佳庆指标。 我们在回测和筛选因子时,作出如下一般性地设定: 1由于大部分基本面类的因子起始时间较晚,我们设定其回测时间为2016年1月起,量价类的因子回 测时间为2010年1月起。样本外回测时间为2022年1月起,回测时间至2024年12月终。 2手续费统一设置双边万三,杠杆为一倍杠杆。 3累计收益以累加的方式进行计算,使用主力连续合约计算收益。 4单因子均为时序因子,因子值最后映射为0,1,1输出(代表看平、看多、看空),以简单等权相加的方式进行多因子的组合,最终会输出一个阶梯式的趋势强度信号。 5策略基准收益指从回测起始日始终持有一份该合约,并在主力合约切换时展期。 6基本面信号有发布延迟的,会将数据整体向后平移,避免使用未来数据。 7基本面类因子使用数据更新频率为日频、周频、月频。量价类因子使用数据更新频率为日频。 8每日信号更新将在夜盘开盘前,产生的信号将作用于夜盘和第二天日盘。 9若因故某单因子当日未能及时更新(例如数据商未更新),该因子值设定为前值,其余因子继续更新。 2豆粕基本面量化因子介绍及回测结果 21中国大豆压榨企业原料大豆库存 当原料大豆库存充足时,压榨企业有足够的原料进行生产,豆粕的供应量会相应增加。如果此时市场对豆粕的需求没有同步增长,供大于求的局面会导致豆粕价格下跌。 该因子使用数据为“中国大豆压榨企业原料大豆库存”(卓创),次周周二公布上周数据。自2017年起,其回测绩效为年化收益率149,夏普105,卡玛059,胜率505,平均持仓周期435天,最大回撤255。累积收益曲线如下图: 图2:中国大豆压榨企业原料大豆库存累积收益曲线 资料来源:国泰君安期货研究、卓创 22大豆港口库存 大豆港口库存增加,意味着后续可供压榨的大豆数量增多,豆粕的供应预期会相应增加。在需求相对稳定的情况下,市场上豆粕供应充足,会使豆粕价格面临下行压力。例如,若巴西、美国等大豆主产国丰收,大量大豆到港,港口库存持续上升,而养殖业没有明显的扩张,豆粕需求稳定,那么豆粕价格往往会下跌。 该因子使用数据为“进大豆港口库存合计”(同花顺),每日公布当日数据。自2016年起,其回测绩效为年化收益率94,夏普06,卡玛025,胜率511,平均持仓周期35天,最大回撤378。累积收益曲线如下图: 图3:大豆港口库存累积收益曲线 资料来源:国泰君安期货研究、同花顺 23大豆压榨现货利润 当大豆现货压榨利润较高时,压榨企业有较强的动力增加压榨量,以获取更多利润。这会导致市场上豆粕的供应量增加,在需求相对稳定的情况下,供大于求,豆粕价格往往会受到下行压力。 该因子使用数据为“m加工利润现货压榨利润美豆”(国君期货数据库),次日公布昨日数据。自2019年起,其回测绩效为年化收益率175,夏普108,卡玛063,胜率500,平均持仓周期15天,最大回撤276。累积收益曲线如下图: 图4:大豆压榨现货利润累积收益曲线 资料来源:国泰君安期货研究 24大豆压榨盘面利润 具有较强的前瞻性,它反映的是市场对未来一段时间内压榨利润的预期。而现货压榨利润更注重时效性,它反映的是当前实际生产经营中的利润状况。 该因子使用数据为“m加工利润盘面压榨利润美豆”(国君期货数据库),次日公布昨日数据。自2019年起,其回测绩效为年化收益率109,夏普072,卡玛059,胜率471,平均持仓周期281天,最大回撤195。累积收益曲线如下图: 图5:大豆压榨盘面利润累积收益曲线 资料来源:国泰君安期货研究 25豆粕基差 当市场供应紧张,现货需求旺盛时,现货价格上涨速度快于期货价格,基差扩大,若原本基差为正,则正基差增大;若原本基差为负,则负基差减小。当市场供应过剩,需求疲软时,现货价格下跌速度快于期货价格或者上涨速度慢于期货价格,基差缩小,表现为负基差增大或正基差减小。 该因子使用数据为“商品基差主流现货基差豆粕m”(国君期货数据库),盘后公布当日数据。自2016年起,其回测绩效为年化收益率83,夏普04,卡玛02,胜率516,平均持仓周期61天,最大回撤419。累积收益曲线如下图: 图6:豆粕基差累积收益曲线 资料来源:国泰君安期货研究 26豆粕仓单 仓单数量增加,表明有更多的货物进入交割仓库并注册成仓单,意味着市场上可供交割的商品数量增多,通常反映出市场供应较为充足。相反,仓单数量减少,说明市场上可交割的商品减少,可能是因为上游生产减少、库存消耗等原因,反映出供应趋紧。 该因子使用数据为“m仓单”(国君期货数据库),盘后公布当日数据。自2016年起,其回测绩效为年化收益率149,夏普119,卡玛110,胜率513,平均持仓周期65天,最大回撤136。累积收益曲线如下图: 图7:豆粕仓单累积收益曲线 资料来源:国泰君安期货研究 27豆粕库存 高库存通常意味着市场供应充足甚至过剩。相反,低库存则可能表示供应紧张,企业库存不足以满足未 来一段时间的需求,可能需要增加采购或生产来补充库存。 该因子使用数据为“主要油厂:豆粕:库存合计:华东(周)”(钢联),次周周二公布上周。自2016年起,其回测绩效为年化收益率108,夏普073,卡玛043,胜率514,平均持仓周期245天,最大回撤251。累积收益曲线如下图: 图8:豆粕库存累积收益曲线 资料来源:国泰君安期货研究、钢联 28豆菜价差 当豆粕需求上升如生猪养殖业扩张,豆粕价格上涨,导致豆菜价差扩大,此时适合做多豆粕、做空菜粕。菜粕供应过剩菜粕供应过剩时价格下跌,豆菜价差扩大,适合做多豆粕、做空菜粕。 该因子使用数据为“豆粕、菜粕主力连续合约收盘价”(米筐),日度更新。自2016年起,其回测绩效为年化收益率248,夏普231,卡玛137,胜率521,平均持仓周期10天,最大回撤181。累积收益曲线如下图: 图9:豆菜价差累积收益曲线 资料来源:国泰君安期货研究、米筐 29生猪存栏 生猪是豆粕的重要下游,存栏量反应需求量的多少,供给不变的情况下,存栏量增多对于价格有支撑作 用。 该因子使用数据为“全国生猪存栏”(同花顺),次月中旬公布上月数据。自2016年起,其回测绩效为年化收益率109,夏普079,卡玛055,胜率513,平均持仓周期281天,最大回撤197。累积收益曲线如下图: 图10:生猪存栏累积收益曲线 资料来源:国泰君安期货研究、同花顺 210基本面多因子 我们将前述基本面单因子(19)按照等权方式组合,再映射成输出0,1,1的多空择时模型。2016年起回测年化收益率279,夏普259,卡玛205,胜率513,平均持仓周期52天,最大回撤136。累积收益曲线如下图: 图11:基本面多因子累积收益曲线 资料来源:国泰君安期货研究 3豆粕量价因子介绍及回测结果 31日内动量 日内动量定义为:当日最高价和最低价的平均值,除以当日开盘价。该值越大说明日内的价格相较于开盘价上涨较快,有一定的动量趋势。 自2010年起,回测年化收益率123,夏普105,卡玛048,胜率476,平均持仓周期127天,最大回撤258。累积收益曲线如下图: 图12:日内动量累积收益曲线 资料来源:国泰君安期货研究 32双均线 构造两条长短周期的移动平均线,短均线上穿长均线是做多信号,短均线下穿长均线是做空信号。 自2010年起,回测年化收益率96,夏普082,卡玛038,胜率501,平均持仓周期127天,最大回撤255。累积收益曲线如下图: 图13:双均线累积收益曲线 资料来源:国泰君安期货研究 33中值双均线 该因子与双均线定义类似,但产生均线的价格是当日最高价和最低价的中间值。 自2010年起,回测年化收益率89,夏普076,卡玛034,胜率499,平均持仓周期98天,最大回撤264。累积收益曲线如下图: 图14:中值双均线累积收益曲线 资料来源:国泰君安期货研究 34考夫曼均线 我们可以分以下