量化专题报告 基于随机优化的指数增强新方案 对收益估计的误差可能导致均值-方差模型表现不佳。虽然Markowitz的作者 证券研究报告|金融工程研究 2023年04月16日 均值-方差模型已得到了广泛的应用,但学界发现,均值方差模型中的参数估计误差对于结果影响非常明显,错误的参数估计方法可能导致投资者在使用均值-方差模型后,获得的真实投资收益与预期结果相差甚远。 传统指数增强模型框架下构建量价多因子1.0组合。使用国盛特色量价因 子作为因子暴露构建国盛量价多因子1.0组合,月度换仓频率下相比中证1000指数能够获得10.15%的年化超额收益,跟踪误差为4.29%,信息比率2.37,月度胜率73.47%。 利用随机优化可以在指数增强中加入低收益厌恶。将个股未来收益看作随机变量,构建带有随机项的低收益厌恶指数增强模型,能够描述投资者对组合未来收益较低的厌恶。引入分布鲁棒优化(DRO),可以通过构建模糊集求解带有随机项的低收益厌恶指数增强模型。 量价多因子2.0中证1000指数增强组合表现优秀。使用带有低收益厌恶的DRO指数增强模型构建国盛量价多因子2.0组合。在因子暴露及约束条件不变时,2.0组合表现相比1.0组合全面提升,组合对冲中证1000指数年化超额收益提升至12.57%,信息比率2.49,月度胜率81.63%。 因子失效时DRO指数增强模型能一定程度减小回撤。若回测期内存在因子失效严重的时段,DRO指数增强模型能够一定程度降低回撤,模型更加稳健。 风险提示:以上结论均基于历史数据和统计模型测算,如果未来市场环境发生变化,不排除模型失效的可能性。 分析师沈芷琦 执业证书编号:S0680521120005邮箱:shenzhiqi@gszq.com 分析师刘富兵 执业证书编号:S0680518030007邮箱:liufubing@gszq.com 研究助理赵博文 执业证书编号:S0680122070011邮箱:zhaobowen@gszq.com 相关研究 1、《量化分析报告:择时雷达六面图:技术面与资金面弱化》2023-04-15 2、《量化专题报告:基于分析师推荐的偏股基金指数增强》2023-04-13 3、《量化周报:中证500率先确认周线级别牛市》2023- 04-09 4、《量化分析报告:择时雷达六面图:技术面有所弱化 2023-04-08 5、《量化分析报告:ChatGPT引领全新AI革命,一键布局AI全产业链——华富中证人工智能产业ETF投资价值分析》2023-04-05 请仔细阅读本报告末页声明 内容目录 1.一个简单的案例—中证1000指数增强模型3 1.1传统中证1000指数增强模型3 1.2因子合成与模型因子暴露4 1.3国盛金工量价多因子中证1000指数增强1.0组合5 2.随机优化模型的解决方案6 2.1随机优化求解新方法——分布鲁棒优化(DRO)7 2.2Wasserstein距离与DRO的模糊集8 3.带有低收益厌恶的DRO指数增强模型8 3.1带有低收益厌恶的DRO指数增强模型构建与对偶转化8 3.2国盛量价多因子中证1000指数增强2.0组合10 4.其他重要讨论12 4.1DRO指数增强模型参数敏感性检验12 4.2不同样本空间下的DRO指数增强模型13 附录:国盛金工特色量价类因子列表14 参考文献14 风险提示14 图表目录 图表1:合成因子全A�分组多空对冲净值走势5 图表2:合成因子中证1000�分组多空对冲净值走势5 图表3:合成因子在全A和中证1000中�分组多空对冲绩效指标5 图表4:国盛量价多因子1.0组合及其对冲中证1000指数净值走势6 图表5:国盛量价多因子1.0组合及其对冲中证1000指数绩效指标6 图表6:随机优化的求解方案7 图表7:国盛量价多因子2.0组合及其对冲中证1000指数净值走势10 图表8:国盛量价多因子2.0组合及其对冲中证1000指数绩效指标11 图表9:国盛量价多因子1.0组合和2.0组合净值走势11 图表10:国盛量价多因子1.0和2.0组合对冲中证1000指数净值走势11 图表11:国盛量价多因子1.0和2.0组合绩效指标对比11 图表12:不同回看天数下2.0组合超额绩效指标12 图表13:不同模糊集半径下2.0组合超额绩效指标12 图表14:不同厌恶系数下2.0组合超额绩效指标12 图表15:不同收益参照点下2.0组合超额绩效指标13 图表16:沪深300组合对冲基准指数超额净值走势13 图表17:中证500组合对冲基准指数超额净值走势13 图表18:国盛金工特色量价类因子列表14 1952年,Markowitz在《PortfolioSelection》(参考文献[1])中提出了著名的均值-方差模型(Mean-VarianceOptimization),以平衡投资组合预期收益和风险,并借此获得了诺贝尔经济学奖。该模型经过70余年的发展,已经形成了一套较为成熟的现代投资组合管理体系,并运用于大类资产配置、Alpha股票组合等各种投资组合管理之中。 虽然均值-方差模型应用非常广泛,但模型仍存在一定的缺陷。传统的均值-方差模型中,最重要的参数之一,是各个资产在未来的预期收益率𝒓,根据预期收益率及各资产收益率之间的协方差矩阵,实现组合收益最大或波动率最小等相关目标。但各资产的预期收益率无法得知,投资者只能使用历史数据得到的估计值𝒓̂代替。 不幸的是,VijayKumar.Chopra,WilliamT.Ziemba(参考文献[2])等人验证了𝒓̂的参数估计误差对于模型结果影响非常明显,错误的参数估计方法可能导致投资者在使用均值-方差模型后,获得的真实投资收益与预期结果相差甚远。出现上述问题的主要原因在于, 若想获得最好的结果,模型应当基于未来各资产的收益来确定权重;然而未来的收益是随机的,模型是包含随机项的随机优化方程。若直接使用历史数据作为未来收益率的估计值,估计值与未来真实值之间的误差会导致模型表现不稳定。想要对传统模型进行改 进,势必要解决随机项对模型的影响,本文将要讨论的随机优化模型能够一定程度上解决这一问题。 本报告将从随机优化的角度出发,首先在传统指数增强模型的基础上,利用国盛特色量价类因子构造了“国盛量价多因子1.0”中证1000增强组合。接着,我们提出了目标函数带有随机项、且包含低收益厌恶的新指数增强模型方程,并给出求解方案。最后,基于新模型,我们构造了“国盛量价多因子2.0”中证1000增强组合。在不改变因子暴露的情况下,新模型的表现相比于传统模型明显提升。 1.一个简单的案例—中证1000指数增强模型 1.1传统中证1000指数增强模型 以传统中证1000指数增强模型为例,模型的目标函数一般为最大化因子暴露;同时为了控制组合的波动,对整个组合的行业暴露、风格暴露等进行了约束。具体来说,模型的一般形式如下: max𝑓�� 𝑠.𝑡.𝑥�≤𝑋(�−𝑤𝑏)≤𝑥ℎℎ�≤𝐻(�−𝑤𝑏)≤ℎℎ 𝑤�≤�−𝑤�≤𝑤ℎ 𝑏�≤𝐼𝑏�≤𝑏ℎ0≤�≤1 1𝑇�=1 目标函数中,�为因子暴露,�为待求解的组合中各股票权重;若合成因子IC为正,优化目标即为最大化组合因子暴露(反之目标应改为最小化组合因子暴露)。若因子值IC绝对值较高,即因子可以较好预测未来个股收益时,目标约等于最大化组合的Alpha。 约束条件1:组合风格暴露约束。其中𝑤�为基准指数的成份股权重,�为Barra风格因子暴露矩阵,𝑥�、𝑥ℎ为上下界。该约束条件限制了组合在各个Barra风格因子暴露上相对于基准指数的偏离程度,从而一定程度上控制跟踪误差。此处设置𝑥𝑙=𝑥ℎ=0%,即风格无偏。 约束条件2:组合行业暴露约束。其中𝑤�为基准指数的成份股权重,�为个股中信一级行业哑变量矩阵,ℎ�、ℎℎ为上下界。该约束条件限制了组合在中信一级行业上相对于基准指数的偏离程度,从而一定程度上控制跟踪误差。此处设置ℎ𝑙=-2%,ℎℎ=2%,即组合行业暴露允许有2%的偏离。 约束条件3:个股权重偏离约束。其中𝑤�为基准指数的成份股权重,𝑤�、𝑤ℎ为上下界。该约束条件限制了个股权重相对于基准指数成份股权重的偏离程度,允许在一定范围内对个股进行超配。此处设置𝑤𝑙=-0.5%、𝑤ℎ=0.5%。 约束条件4:成份股含量约束。其中𝐼�为个股是否属于基准指数成份股的示性函数,𝑏�、 𝑏ℎ为上下界。此处设置𝑏𝑙=85%、𝑏ℎ=100%,即组合至少有85%的仓位配置在基准指数成份股中。 约束条件5、6:个股权重上下限约束和组合权重之和约束,本文限制组合不允许卖空,且个股权重和为1(即满仓)。 在后续测试中,我们以201501-202303为回测区间,以中证1000指数为基准指数,进行月度换仓回测,且买入和卖出时均收取0.3%手续费。 1.2因子合成与模型因子暴露 指数增强模型的一个关键在于因子暴露的选择。我们使用国盛特色量价类因子进行合成做为模型使用的因子暴露。合成前,我们对因子进行了如下处理: MAD去极值:对某个截面所有股票的因子值(𝑓𝑖,�=1,2,…,𝑁),首先求所有股票因子的中位数𝑓𝑚𝑒𝑑𝑖𝑎�=𝑚𝑒𝑑𝑖𝑎𝑛(𝑓𝑖),之后求每只股票因子值相对于中位数的距离的中位数 𝑀𝐴�=𝑚𝑒𝑑𝑖𝑎𝑛(𝑓�−𝑓𝑚𝑒𝑑𝑖𝑎𝑛)。我们将超出𝑓𝑚𝑒𝑑𝑖𝑎�±5×𝑀𝐴�的因子值都拉回到 𝑓𝑚𝑒𝑑𝑖𝑎�±5×𝑀𝐴�。 中性化:为了尽可能剔除因子间相关性,我们对每个因子均进行了中性化处理。以市值中性化为例,每月末,我们以截面因子值为因变量,对数流通市值为自变量进行回归,取回归残差即为市值中性化后的因子值。 截面标准化:进行MAD去极值后,为了让不同因子能够进行合成,我们对各因子在截面上进行标准化。对某个截面所有股票的因子值(𝑓𝑖,�=1,2,…,𝑁),求因子值序列的均值 𝑓𝑚𝑒𝑎�和标准差𝑓𝑠𝑡𝑑,则标准化后的因子值为: 𝑓𝑛𝑜𝑟𝑚𝑎𝑙𝑖𝑧�=(𝑓�−𝑓𝑚𝑒𝑎𝑛)/𝑓𝑠𝑡� 合成过程中使用到的因子详见附录中的因子列表。对每个因子进行MAD去极值、中性化及截面标准化后,按照因子方向等权相加,即可合成为指数增强模型使用的因子暴露。我们首先在全A和中证1000中分别测试了合成因子的选股效果。 图表1:合成因子全A�分组多空对冲净值走势图表2:合成因子中证1000�分组多空对冲净值走势 资料来源:Wind,国盛证券研究所资料来源:Wind,国盛证券研究所 图表3:合成因子在全A和中证1000中�分组多空对冲绩效指标 全A 中证1000 年化收益 34.50% 31.90% 年化波动 11.39% 11.31% 信息比率 3.03 2.82 月度胜率 81.63% 80.61% 最大回撤 9.75% 14.39% IC均值 -0.09 -0.09 年化ICIR -3.00 -3.11 RankIC均值 -0.12 -0.13 年化RankICIR -4.19 -4.09 资料来源:Wind,国盛证券研究所 图表1、2展示了合成因子在全市场及中证1000成份股中进行回测后的�分组多空对冲净值走势,图表3展示了合成因子在不同样本空间中多空对冲绩效指标。根据测试结果,合成因子在全A和中证1000成份股中均有不错表现,如在中证1000成份股中的月度IC均值为-0.09,年化ICIR为-3.11,5分组多空对冲的年化收益为31.90%,信息比率为2.82,月度胜率为80.61%。接下来的所有测试,我们都使用此合成因子作为模型中的因子暴露𝑓,构造指数增强组合。 1.3国盛金工量价多因子中证1000指数增强1.0组合 前两小节分别介绍了传统指数增强模型、国盛特色量价因子及其处理细节,本小节我们使用合成后的国盛特色