您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰期货]:因子与指数投资揭秘系列十八:热轧卷板基本面量化及数据分析的研究框架 - 发现报告
当前位置:首页/其他报告/报告详情/

因子与指数投资揭秘系列十八:热轧卷板基本面量化及数据分析的研究框架

2024-06-27虞堪、高宇飞国泰期货起***
因子与指数投资揭秘系列十八:热轧卷板基本面量化及数据分析的研究框架

期货研究 二〇二四年度 国泰君安期货研究所 2024年6月27日 因子与指数投资揭秘系列十八:热轧卷板基本面量化及数据分析的研究框架 虞堪投资咨询从业资格号:Z0002804yukan010359@gtjas.com 高宇飞(联系人)从业资格号:F03124155gaoyufei028920@gtjas.com 报告导读: 在之前的系列专题报告中,我们阐述了基本面量化数据选取的一些一般性的标准,并以铁矿石和螺纹钢这两个品种为例,阐述了其基本面量化和数据分析的研究框架(参见因子与指数投资揭秘系列十六和十七)。同时我们进一步分析了黑色系产业链之间的上下游关系。 因此,本文将进一步研究黑色系产业链的另一个重要品种:热轧卷板。热轧卷板期货自2014年在上期所上市交易以来,已经有十余年的历史了,可供回测的历史数据相对充足。它向上承接铁矿石、焦煤、焦炭等钢材制作的原材料,中游与螺纹钢、线材相呼应,向下承接车辆制造、船舶、桥梁等重点产业。分析热轧卷板的手段相对较多,同时因为其和螺纹钢都属于钢材的一种,价格的相关性高,许多中上游钢厂的相关指标可能同时对它们都有作用。可量化的数据和指标也较为丰富。在上游端,可以从原材料的占比和成本测算。中游端,可以考虑不同型号和规格的热卷现货价格,提取基差、价差等指标,也可以和相近的螺纹钢及其他钢材价格比较。钢厂一些指标,例如钢厂铁水产量、钢厂开工率、产能利用率等,亦可对后市期货价格的预测提供参考。下游端则可以提取热卷消费量、全国钢材贸易量、中国汽车月度产量、中国工业产品产量等指标。 本文将首先按照类别,对热轧卷板各相关指标进行梳理和介绍。然后,选择表现较好的指标并对其回测绩效进行结果展示,最后再结合结果以及近期热轧卷板的行情进行相关的总结。 特别感谢实习生李泽豪对于本文撰写、数据搜集的贡献。 风险提示:近期热轧卷板行情波动较大,注意关注政策面和情绪面的影响。 (正文) 1.热轧卷板产业链的介绍 热轧卷和螺纹钢类似,都是在我国应用较为普遍且常见的钢材。热轧卷板是以板坯为原料,经加热后由粗轧和精轧机组轧制而成的钢板。热轧板卷具有韧性好、强度高、易于加工的特点,以及良好的可焊接性等优良性能,因此它被广泛应用于汽车和船舶制造、桥梁、建筑、机械、压力容器等行业。热轧卷板按其材质、性能的不同可分为:普通碳素结构钢、低合金钢、合金钢。按其用途的不同可分为:冷成型用钢、结构钢、汽车结构钢、耐腐蚀结构用钢、机械结构用钢、焊接气瓶及压力容器用钢、管线用钢等。 和螺纹钢类似,热轧卷的上游是铁矿石、焦煤和焦炭这些原料。在我们之前的报告中提到,铁矿对于进口的依存度很高,主要从澳洲和巴西的四大矿山进口。因此作为主要原材料的铁矿的进口情况对于热轧卷的成本有一定影响。下游最大的应用是汽车制造行业,另外船舶制造、桥梁和基建行业等对上游的热轧卷需求有一定的影响。 同样地生产热轧卷也主要有以下两种流程,一种是以废钢为原材料的经过分选后进入电炉生产;另一种是使用铁矿石作为主要原料,加入石灰石和煤炭的高炉生产。不过,因为电炉生产没有煤炭的烧结环节,较为环保,在政策的鼓励下,未来可能会扩大产能。 我国热轧卷板的主要产能集中在华北地区以及东北地区,其中以国有企业居多。分省市来看,我国热轧卷板产量最大的省市分别是河北、辽宁和山东。总体来看,我国热轧产量整体呈现逐年增长的态势,但增速有所放缓,而出口占产量的比重在经历短暂的下降后又回归到4%以上的水平。反映我国热轧供应较为充足且出口仍然作为调节供应压力的有效手段。众所周知,钢铁产业在2015年前后,产能严重过剩,市场预期恶化,面临一系列挑战。此后确定了要对于钢铁和煤炭行业进行供给侧改革,因为这两个行业结构矛盾较为突出。在解决产能过剩问题的同时,又要对生产质量严格把控。因此从2016年开始,钢材的价格稳步提升,在后续的数据选取和因子测试中,我们将把重点放在供给侧改革之后。 图1:螺纹钢价格和热卷价格走势,相关性很高 资料来源:国泰君安期货研究 图2:热轧卷板产业链和上下游关系 资料来源:国泰君安期货研究 2.热轧卷板基本面数据举例 接下来,我们将分类别列举一些基本面数据。依照《因子与指数投资揭秘系列十五:探究量化基本面因子品种和数据的选取方法》文中提到的基本面数据选择标准,所选取数据应尽可能具有较长的历史长度,较频繁的更新频率(日度或周度),以及有较强的代表性。 2.1热轧卷板基差 本数据选自“商品基差-主流现货基差-热轧卷板-hc”,数据源为国泰君安期货数据库,更新频率为日度。主要选择期货贴水较大时择时做多,因为基差走扩,期货价格往往被低估,下一步可能反转走强;反之当期货价格升水较大时择时做空,由于商品交割机制的存在,基差往往会在临近交割时收敛。不过可以发现,近年来期货价格和基差的正相关性在削弱,甚至在一些时段有较强的负相关性。 图3:热卷价格和基差走势 资料来源:国泰君安期货研究 2.2热轧卷板库存 中游钢厂库存主要反应当前热卷的供应储备情况,往往和价格呈较为明显的负相关关系。北方钢厂较多,因此可以考虑北方大区加总数据。此外,还有热卷的社会库存、期货库存(仓单)等数据可供参考。 图4:热卷价格和钢厂库存 资料来源:国泰君安期货研究 图5:热卷价格和仓单 资料来源:国泰君安期货研究 图6:热卷价格和社会库存 资料来源:国泰君安期货研究 2.3产量和产能利用率 在2015年供给侧改革之后,钢材在全国的产能因调控而趋于固定,随时间没有太多波动。因此我们可以转而关注产能利用率,它是衡量企业生产能力的重要指标,它反映了企业在一定时期内的生产能力的利用程度,是衡量企业生产经营效率的重要指标,它的定义是实际产量与理论产量的比值。一般来说,产能利用率越高,企业的生产效率就越高,企业的经营效益也就越好。 一般来说,当热卷价格有上涨趋势时,钢厂会逐步提高产能利用率。而产能利用率的提升,则会增大钢材的供给,从而使得价格上涨趋势减缓甚至趋于稳定。由于钢材消费有季节性的规律,加之钢厂也有定期检修停产等,产能利用率呈现一定的季节性规律。除了研究全国性的指标,我们还可以分析在主要产区钢厂的生产情况。众所周知,热轧卷的主要生产集中在我国北方,而唐山是华北重要的工业城市和钢材生产基地,因此唐山钢厂的产能边际变化情况对其价格也有一定参考价值。其他供应类型的指标包括钢厂高炉的开工率,从原料端还可以参考铁水产量等。 由于钢厂的多数指标在上一篇关于螺纹钢的专题报告中已经讨论过,且螺纹钢价格和热卷价格有较强的相关性,因此本文不再赘述相同的指标。 图7:唐山钢厂热轧卷板产能利用率 资料来源:国泰君安期货研究、钢联 图8:唐山热轧板卷实际产量与期货价格 资料来源:国泰君安期货研究、钢联 图9:唐山钢厂产能利用率、产能与期货价格 资料来源:国泰君安期货研究、钢联 2.4热卷下游需求端指标 如前文所述,我们大致可以选取如下的一些螺纹钢需求端指标:热轧板卷:消费量:中国(周) 热轧板卷:出口数量合计:中国(月)热轧板卷:成交量:中国(日) 汽车:产量:中国(月) 中国:工业产品:产量:挖掘、铲土运输机械(月) 图10:热轧板卷:消费量:中国(周)图11:热轧板卷:出口数量合计:中国(月) 资料来源:国泰君安期货研究、钢联资料来源:国泰君安期货研究、钢联 图12:热轧板卷:成交量:中国(日) 资料来源:国泰君安期货研究、钢联 需要注意,一些制造业相关的数据和一些宏观数据类似,通常频率为月度,且经常滞后天数较长。因此此类指标在实际构建量化因子时难度较大,且由于样本点数目偏少,不易抓住短周期的行情波动变化。而像总体消费量、成交量等需求指标,与产能利用率类似,随着淡旺季的切换,有较强的季节性。 3.因子的构造与模型回测 3.1数据的处理和因子构造方法 我们提取单条时间序列数据,周度的数据向后填充到交易日中,例如某数据周五更新,则在更新之前均使用上周五的数据作为最新值。同时对于有缺失值的数据,也向后填充补足。我们对于得到的时间序列将进行一系列处理,最终将其映射为1(做多)、0(不持有合约,进行现金管理)、-1(做空)。当信号由0 变为1或者-1时,则选择开仓,从1或-1变为0时,则平当前仓位。由1变成-1或由-1变成1时,则先平当前仓位,再进行反向开仓。 对于基本面因子的处理方法通常有以下几种:1.取N周期的同环比,以此来衡量数据的增减变化情况。2.取N周期的差值,通常用在库存、开工率等数值常为正的情况。3.取N周期的移动平均,通常适用与数据变化剧烈或不够光滑的情况。4.设定阈值,例如当数据偏离N个标准差时触发信号,反之则不触发交易信号。5.构造特定规则,例如分别求较短的移动均线和较长移动均线,当短均线突破长均线触发信号,长均线突破短均线触发相反的信号。 3.2因子回测绩效展示 下面选取一些回测相对较好的因子进行展示,手续费设为双边万三。 图13:热卷基差,夏普比率0.69,卡玛0.43,其中2021图14:唐山热卷厂内库存,夏普比率1.64,卡玛1.15, 年后夏普0.42,卡玛0.442021年后夏普1.09,卡玛1.04 资料来源:国泰君安期货研究资料来源:国泰君安期货研究 图15:全国247家钢厂日均铁水产量,夏普1.16,卡玛图16:hc社会库存,夏普0.55,卡玛0.34,2021年后 0.76,2021年后夏普0.88,卡玛0.54夏普0.7,卡玛0.52 资料来源:国泰君安期货研究资料来源:国泰君安期货研究 图17:热卷产能利用率,夏普0.77,卡玛0.34,2021图18:热卷消费量:中国,夏普0.75,卡玛0.53,2021 年后夏普0.92,卡玛1.17年后夏普1.04,卡玛1.28 资料来源:国泰君安期货研究资料来源:国泰君安期货研究 3.3因子组合 下面我们将简单叙述一些因子组合的方法。我们首先研究较为简单的两因子组合情形。例如我们考虑库存和基差的两因子组合。我们设定库存阈值为X,若当期指标小于(大于)阈值X,我们则在下一期做多(做空)标的期货。我们设定基差阈值为Y,若当期指标大于(小于)阈值Y,我们则在下一期做多(做空)标的期货。总而言之,当我们认为只有两因子均满足开仓条件才会开仓,其余情况下均不开仓。我们可以检验 组合因子的绩效是否提升了单因子的绩效,从而检验组合是否有效。 对于多个因子,我们依然可以依此法进行组合,但随着因子数量的提升,条件限制越来越严格,开仓点将会变少,从而存在过拟合的风险。因此,可以采用多因子打分模型,例如当超过一半权重的因子满足开仓条件就进行开仓。也可以采用阶梯强度信号代表具体需要做多和做空的手数,当然在此情况下,多数情况下都非满仓操作。例如我们采用基差、厂内库存、日均铁水产量、产能利用率、消费量因子进行五因子组合,这些因子彼此相关性较低。 图19:基差、厂内库存、日均铁水产量、产能利用率、消费量五因子等权组合表现,总夏普2.16,卡玛比率1.4。2021年后夏普0.95,卡玛0.61 资料来源:国泰君安期货研究 4.总结 我们利用三篇专题报告因子与指数投资揭秘系列十六、十七、十八分别梳理了黑色系的三个重要的期货品种:铁矿石、螺纹钢和热卷。下面我们将之前梳理过的一些常见基本面数据进行归类并总结: 图20:铁矿石基本面数据整理归类 资料来源:国泰君安期货研究、钢联、wind、同花顺 图21:螺纹钢基本面数据整理归类 资料来源:国泰君安期货研究、钢联、wind、同花顺 图22:热卷基本面数据整理归类 资料来源:国泰君安期货研究、钢联、wind、同花顺 国泰君安期货有限公司(以下简称“本公司”)具有中国证监会核准的期货投资咨询业务资格(证监许可[2011]1449号)。 本报告的观点和信息仅供本公司的专业投资者参考,无意针对或打算违反任何地区、国家、城市或其它法律管辖区域内的法律法规。本报告难以设置访问权限,若给您造成不便,敬请谅解。若您并非国泰君安期货客户中的专业投资者,请勿阅读、订