中信期货研究|金融工程专题报告 2023-05-31 商品期货多因子收益模型实践 ——期货多因子系列八 投资咨询业务资格: 证监许可【2012】669号 中信期货商品数 报告要点 本文使用线性多因子模型,基于系列报告中的部分因子构建期货组合。在引入“波动率加权”及“动态仓位控制”后,组合年化收益率达到22.6%,夏普率达到2.1。 中信期货年期国期货数 中信期货商品数 中信期货300期货数 130 119 11 111 107 180 140 摘要: 本文从理论角度出发详细地介绍了多因子模型发展的历史背景以及搭建多因子模型的理论基础。具体到实践角度,本文尝试在国内期货市场上构建多因子收益模型用以解释截面上品种收益的差异并对下一期截面收益进行预测,我们选取在在之前系列报告中表现较为突出的8个收益类因子作为收益模型的回归自变量,经检验: 在每期使用最新因子收益率估计值时,策略效果最好。策略年化收益率达 24.48%,夏普比率1.70,Calmar比率1.58 波动率倒数加权能提高组合绩效。使用近3日波动率倒数作为权重系数时,策略达到最佳效益:年化收益率提升至25.45%,夏普比率提升至1.90,Calmar比率提升至1.77 引入25%ES以及12%DD进行仓位控制能进一步提高组合绩效。此时,等权配置时策略年化收益率为21.50%,夏普比率为2.01,Calmar比率为2.62;波动率倒数加权时,年化收益率为22.61%,夏普比率为2.09,Calmar比率为1.67。 风险提示:本报告中所涉及的资产配比和模型应用仅为回溯举例,并不构成推荐建议。 103 0/70/80/90/100/110/103/103/03/303/4 金融工程研究团队 研究员:周通 zhoutong@citicsf.com从业资格号F3078183投资咨询号Z0018055 100 重要提示:本报告难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本报告内容而视相关人员为客 目录 摘要:1 一、多因子模型基本理论3 (一)多因子模型的发展3 (二)截面多因子模型构建流程4 1.收益因子or风险因子?4 2.多因子模型构建5 二、多因子收益模型实践7 (一)因子选取及规整7 (二)收益模型回测8 1.样本选择与回测细节8 2.回测效果展示9 (三)动态仓位控制下的策略表现11 三、总结与思考13 附录14 图表目录 图表1:收益因子与风险因子4 图表2:多因子模型流程图5 图表3:因子表7 图表4:因子正交化前相关性系数8 图表5:因子正交化后相关性系数8 图表7:不同权重系数下的策略净值ß½(等权配置)10 图表8:不同权重系数下的策略表现(等权配置)10 图表9:�=1,不同的回看期n下策略净值ß½(波动率倒数加权)11 图表10:�=1,不同的回看期n下策略表现(波动率倒数加权)11 图表11:25%ES及12%DD水平下策略净值ß½对比13 图表12:不同ES与DD组合下策略(�=1,�=3波动率倒数加权)14 图表13:不同ES与DD组合下策略(�=1等权配置)15 一、多因子模型基本理论 多因子模型是当今量化投资中较为成熟的模型之一,经过学术界与业界长久以来的探索与发展,其在资产配置、收益预测、风险控制以及组合优化等等方面均大有作为。“一千个读者,就有一千个哈姆雷特”,多因子模型也是如此,至今已形成百花齐放,百家争鸣的态½。 (一)多因子模型的发展背景 20世纪资本资产定价模型(CaptialAssetPricingModel,CAPM)的问世,向人们阐释了收益与风险之间的关系。在CAPM的假设下,市场仅存在唯一的风险投资组合——市场投资组合(markertportfolio),且资产�的预期超额收益由市场组合的预期超额收益与资产对市场风险的暴露所决定: 𝐸[𝑅𝑖]−𝑅�=𝛽𝑖(𝐸[𝑅𝑀]−𝑅𝑓) 其中市场组合也可以视作市值因子,因此上式正是最简单的多因子模型。尽管CAPM的假设是高度理想而脱离实际的,但对现实的简化却也是提出后续复杂模型的必要条件。基于此,Ross于1964年提出了著名的套利定价理论 (ArbitragePricingTheory,APT),APT在CAPM的基础上进行了延伸,将决定资产收益率的风险来源扩充至多个因子(factor): � 𝐸[𝑅𝑖]−𝑅�=𝖰′� � 𝖰′∈ℝ1×�是资产�对于的�个因子的因子载荷或因子暴露(factorexposure),�∈ℝ1×�则表征这p个因子的因子溢价或因子收益率(factorreturn)。然而,实际的市场情况变化万千,影响资产的超额收益的因素也层出不穷,因此上式的左右两端的往往并不相等,而是存在一个定价误差𝛼𝑖: � 𝐸[𝑅𝑖]−𝑅�=𝖰′�+𝛼�, � 我们用𝐸[𝑅𝑒]=𝐸[𝑅𝑖]−𝑅�来代替资产�的超额收益可以得出: ⇒𝐸[𝑅𝑒]=𝖰′�+𝛼� �� 上式正是多因子模型(Multiple-FactorModel,MFM)的一般表达式。它定量地描述了风险与收益之间的线性关系,不同的因子则代表了对不同风险类型的解释变量,其中因子暴露描述了资产�在不同风险因素上的暴露程度,因子收益率则量化了某种风险因素对于资产�预期超额收益的驱动力。因此,我们可以将不同的资产或是他们的组合的收益率都归结于不同因子的组合,这就是多因子模型的便利以及意义。 (二)截面多因子模型构建流程 1.收益因子or风险因子? 在构建截面多因子模型(以下统称多因子模型)之前,我们首先区分收益因子(alpha因子)与风险因子的概念。从上节我们已经得知,因子代表资产背后的某种共同驱动因素,其中收益因子是多因子模型收益的主要来源,风险因子则主要用于风险控制。从实际表现上来说,收益因子的收益率在时序上的方向性一般比较明确且稳定,使用这类因子所构建的多因子组合对资产的收益率进行预测时,通常有较高的准确率。而风险因子的因子收益率在时序上的波动性较大且方向性不明确的。如果基于收益率的预测值构建组合,应该更多地使用收益因子而非风险因子。 尽管从统计学角度上来说可以将两者进行划分,但是从实际运用的层面上来说,收益因子与风险因子并不是一个完全互斥的概念。某些因子可能兼具两者的特性,对于这一类因子,将它视作收益因子或是风格因子就仁者见仁智者见智了,取决于使用者的个人偏好。下图给从因子收益波动率与绝对值的角度给出了两者大致的划分区间: 图表1:收益因子与风险因子 资料来源:中信期货研究所 2.多因子模型构建 图表2:多因子模型流程图 资料来源:中信期货研究所 完整的多因子模型涉及到以下4个步骤: 因子挖掘以及规整:从行情数据、基本面数据、另类数据等数据中以人工或是机器学习的方式挖掘并识别有效因子。对于逻辑上具有一定相似程度的因子进行合成,对合成后因子进行标准化、正交化。 构建多因子收益模型:参照Barra的做法,以当期收益因子为自变量,资产的下一期收益率为因变量进行截面多元线性回归: 𝑅1,�1 𝛽𝑓1 ⋯� 𝑓� 𝑓1 � ��1 𝛼1,� 𝑅2,�1 1,𝑡−1 1,𝑡−1 𝜆𝑓2 𝛼2,� [⋮]=[⋮]𝜆𝐶�+[ ⋮⋱⋮ 𝛽𝑓1⋯𝛽𝑓� ]� � I⋮ +[⋮] I� 𝑅N,�1 𝑁,𝑡−1 𝑁,𝑡−1 [𝜆𝑓𝑝] 𝑁,� 将上式写成向量的形式: 𝑹�=𝝀𝑪�+𝖰𝒕−𝟏𝝀�+𝑎� � 其中,𝑹�∈ℝ𝑁×1为N个资产在t时刻的收益率向量,𝖰𝒕−�∈ℝ𝑁×�表示t-1时刻N个资产在P个不同因子上的暴露1,�∈ℝ𝑝×1是p个因子在t时刻的因子收益率,𝝀𝑪�∈ℝ𝑁×1表示国家因子—即所有资产 1在股票市场中,Barra多因子模型中的𝖰𝒕−�往往会包含行业因子用以反映股票所在行业的行业特征;而在期市上,由于无法将商品期货或者金融期货归类于某一行业,所以暂时不考虑这一方面的影响。 对其的暴露都为1,同时也是线性回归模型里的截距项,最后的𝑎�∈ℝ𝑁×1,是线性回归模型中无法解释的残差部分。 �𝑪� 使用传统的OLS2即可对模型进行参数估计,求出𝝀̂和𝝀̂的值后便可以使用当期的因子𝝀̂�和𝝀̂𝑪�的历史序列值对t+1期的因子收益率进行估计,常见的方法有: 历史均值法(MA): 𝝀̂ 𝒕+� 1 =� 𝑖=� ∑𝝀̂� 𝑖=𝑡−𝑘+1 𝐸[𝝀𝒕+𝟏]=𝝀̂𝒕+� 数移动加权平均法(EWMA): 𝒚�=𝝀̂� 𝒚𝒕+�=�∗𝝀̂�+(1−𝜌)𝒚� 𝐸[𝝀𝒕+𝟏]=𝝀̂𝒕+�=𝒚𝒕+� 其中�∈(0,1)为权重系数,�越大表征预测值收到当期值影响越大,受到历史值影响更小,反之亦然。 在得到t+1期因子收益率的估计值𝝀̂𝒕+�后,将t期的因子暴露𝖰�带入到多因子模型的一般表达式中,即可得到t+1期资产的预期收益率 𝑹̂𝒕+𝟏: 𝑹̂𝒕+�=𝝀̂𝑪𝒕+�+𝖰�𝝀̂𝒕+� 构建多因子风险模型: 构建风险模型的步骤与收益模型基本一致,但两者的运用角度不同。收益模型的目的是为了通过因子组合解释资产预期收益率的截面差异,而风险因子的目的在于通过多因子降维,计算出资产之间的协防差矩阵: 𝑹�=𝝀𝑪�+𝖰𝒕−𝟏𝝀�+𝑎� 𝐸[𝑎𝒕]=0,𝑐𝑜𝑣(𝝀𝒕,𝑎𝒕)=0 ⇒𝜮𝑹� =𝖰𝒕−𝟏𝜮𝝀� 𝖰′+𝜮� 𝒕−� � 2经典OLS的基本假设要求残差项满足独立且同方差,但金融类数据往往不满足这一假设,由此造成的后果是OLS估计量不再是BLUE(bestlinearunbiasedestimator),OLS的估计量虽仍是无偏的,但OLS估计量的方差是有偏的,这对我们进行组合优化的时候估计资产的协方差矩阵会产生较大的影响。常见的解决办法是采用WLS、GLS、GMM等方法消除异方差带来的影响,由于本文暂时只考虑收益模型而不涉及风险模型,因此在进行截面回归时仍采用OLS法。 其中𝜮𝑹�为t时刻资产之间的协方差矩阵,𝜮𝝀�为t时刻因子收益率的协方差矩阵,𝜮𝑎�为t时刻回归残差的协方差矩阵。我们之所以要得 到资产间的协方差矩阵,是因为它是投资组合优化中必不可少的输入之一,我们可以通过组合优化中的不同目标函数使用𝜮𝑹�构建最优组合。 组合优化: 在计算出t+1期的资产预期收益率𝑹̂𝒕+�与资产间的协方差矩阵 𝜮̂𝑹𝒕+�后,我们可以结合组合的风险-收益目标,选择目标函数,通过求解目标函数得到最优的组合权重。如使用著名的均值-方差模型: max𝑹̂′ �′̂� 𝒕+��−2�𝜮𝑹𝒕+� 其中� 2 为风险厌恶系数。 二、多因子收益模型实践 在上一节中,我们简要的介绍了多因子模型的发展历程以及其构建流程,本节我们从实践的角度出发,探究多因子收益模型在国内期货市场上的表现。 (一)因子选取及规整 我们选取在在之前系列报告中表现较为突出的8个收益类因子作为收益模型的回归自变量,具体单因子的构建方式请参考之前的系列报告。 图表3:因子表 因子表达式 因子释义 因子参数 mom_d243 243日动量 过去243日 ols_d243 243日时序回归因子 过去243日 hp_d243 243日对冲压力因子 过去243日 cv_d5 5日变异系数因子 过去5日 amp_d63_g4 63日振幅因子 过去63日 corr_vp_5m 5min高频量价相关性因子 过去21日 trend_str_5m 5min高频趋½强度因子 过去243日 wh_d10_d126 10日仓单因子 过去126日 资料来源:Wind、中信期货研究所 由于各个因子的量纲不一致,为方便进行比较和回归,需要对因子进行标准化处理。