股息率是国央企择优的一个简洁有效的单因子,但存在价值陷阱和风险控制不佳的弊端;本文我们探索了“市场”——这个最大的投票机器如何定价和审视国央企,以此构建了基于随机森林的国央企多因子打分模型,并针对策略有效性边界,通过价值和成长的风格轮动四象限框架实现较好的回撤控制效果。 α收益优化:股息率单因子 2023年3月12日中国移动、中国电信发布加大派息公告,市场重新审视股息率策略。2022年央企、中证国企、万得全A年度股息率为5.1%、4.3%、2.4%,国央企在建筑材料、电子、通信、汽车、煤炭等行业存在“超额股息率”。我们简单编制测试了国央企高股息50:2010年1月1日至2023年3月31日,年化收益率为7.4%,高于万得全A、红利全收益的4.3%、4.5%,超额收益主要来自于两个阶段:(1)2016-2018年,棚改货币化推升新一轮地产周期,叠加供给侧改革化解过剩产能;(2)2021-2022年,疫后供需错配、海外央行“大放水”、国内能耗双控、俄乌冲突等多重要素交织下,能源股迎来牛市。综合来看,国央企的股息率单因子提升了收益率,但在降低波动率和回撤方面尚有不足。 股息率=分红率/PE,高股息既可能来自于高分红也可能来自于低PE,而后者隐含了价值陷阱,即盈利能力偏弱而缺乏持续的利润增长,高股息因子需要结合其他因子进一步优化。 α收益优化:随机森林多因子 多因子打分模型的弊端在于,指标选择和权重设置上存在较大的人为干预空间,反复调试因子和打分模型而导致泛化能力可能不足。我们构建了随机森林模型来探索“市场”——这个最大的投票机器如何定价和审视国央企?特征重要性评分显示,2014至2022年市场对国央企的定价要素top5分别为净利润增速、市值、pb、股息率、研发强度,市场对国央企的定价明显异化,盈利因子(利润增速、ROE)的重要性在不断上升,市值、pb的重要性下降,2016年以来市场高度关注国央企的研发支出。自上而下的国央企经营考核体系和自下而上的市场定价表现出一定的共性。回测结果显示,多因子50年化收益率为13.5%,较高股息50、万得全A分别提高了6.1、9.2个百分点。 β收益优化:价值-成长风格轮动 (1)策略往往存在有效性边界,DDM模型简化来看,分母对应美债利率(全球资产机会成本之锚)、分子对应实际需求(国内利率),我们在国央企择优的基础上,基于中美利率周期构造价值-成长的风格轮动。高股息50和多因子50在结合风格轮动后,年化收益率分别提高了6.7、2.3个百分点至14.2%、15.8%,夏普比率显著改善至85.3%、93.3%,较好控制了三轮回撤,分别是2015年股市回调、2018年中美贸易摩擦、2022年美联储加息资本外流,但2022年满仓国债损失了大量的能源股收益。 (2)风格轮动在回测的优异表现往往在实盘难以奏效,一个重要原因在于使用到了未来数据,我们尝试单边HP滤波来予以规避,其在每一个时间点的过滤仅使用该时间点可获取信息,因此对趋势、拐点的识别存在一定的滞后性,我们容许一定的滞后期(比如1-2个月)来确认利率趋势项出现实质性拐点,调仓时点相应延后,损失一部分收益但符合策略要求。 全天候策略表现优异,2023Q2关注海外滞胀风险 首先,股息率是一个简洁而有效的单因子,但存在价值陷阱和风险控制不佳的弊端;2014年以来市场对国央企的定价明显异化,高度关注其盈利因子和创新因子,与国央企考核体系的演变具有共性,我们以此将股息率单因子优化为随机森林多因子模型、大幅增厚收益;其次,针对策略有效性边界,通过价值-成长风格轮动有效控制了回撤,整体来看具备了“固收+”属性。2023Q2可能为美债下行、中债上行的宏观组合,我们提示海外阶段性滞胀风险或在积聚,价值、红利资产的防御属性有望凸显。 风险提示:疫情扩散超预期,国内政策执行力度不及预期。 我们在《国企改革成效与中特估值下的投资思路》中指出,具有行业优势、改革力度、盈利成长性的央国企有估值重构空间,聚焦三条主线:绿色低碳、发展安全与科技创新,专业化整合,高股息高分红。 当下中特估的内涵挖掘、体系构筑仍处于初级阶段,市场上不乏各类角度的国央企优化思路,股息率是一个简洁有效的单因子,但存在价值陷阱和风险控制不佳的弊端;本文我们探索了“市场”——这个最大的投票机器如何定价和审视国央企,以此构建了基于随机森林的国央企多因子打分模型,并针对策略有效性边界,通过价值和成长的风格轮动四象限框架实现较好的回撤控制效果。 1、α收益:股息率单因子 2022年5月27日国资委发布《提高央企控股上市公司质量工作方案》,“鼓励符合条件的上市公司通过现金分红等多种方式优化股东回报”;2023年3月12日,中国移动、中国电信发布公告“以现金方式分配的利润提升至当年公司股东应占利润的70%以上”,高股息和国央企属性较为契合,因而近期市场广泛讨论股息率策略。 截至2022年A股上市国央企约为1258家,央企和地方国企分别为429、865家。央企指数、中证国企指数的年度股息率为5.1%、4.3%,几近倍增于万得全A的2.4%。分板块来看,国央企在建筑材料、电子、通信、汽车、煤炭等行业存在“超额股息率”,较板块均值分别提高了3.1、3.1、3.0、1.9、1.7个百分点。传统观点认为,国央企更多代表价值风格,高股息可能是国央企的单因子占优策略。 图1:国央企股息率显著高于板块平均水平 我们简单编制测试了高股息策略在国央企上的应用:区间限定于2010年1月1日至2023年3月31日,季度调仓,选取当季末股息率最高的50只国央企股票作为下一季度的组合。回测结果显示,国央企高股息50累计收益率为157.8%、对应年化收益率为7.4%,高于万得全A的4.3%和红利全收益的4.5%,表明国央企高股息策略具有一定的有效性。超额收益主要来自于两个阶段:(1)2016-2018年,棚改货币化推升新一轮地产周期,叠加供给侧改革化解过剩产能,银行地产、周期、消费白马等板块表现较好;(2)2021-2022年,疫后供需错配、海外央行“大放水”、国内能耗双控、俄乌冲突等多重要素交织下,能源股迎来牛市,煤炭、石油化工、电力等板块为高股息策略贡献丰厚收益。综合来看,国央企的股息率单因子提升了收益率,但在降低波动率和回撤方面尚有不足。 图2:国央企高股息50跑赢万得全A、红利指数 图3:超额收益主要来自于2016-2018、2021-2022 表1:国央企高股息50收益率提升、波动率改善有限 2、α收益:随机森林多因子 股息率=分红率/PE,高股息既可能来自于高分红也可能来自于低PE,而后者隐含了价值陷阱,即盈利能力偏弱而缺乏持续的利润增长。因此高股息因子需要结合其他因子进一步优化。常规的做法可能是在股息率的基础上增加成长、盈利等因子,国央企则可以参考国资委规划的“一利五率”经营指标评价体系,构建多因子打分模型。 图4:央企经营考核指标从“两利一率”到“一利五率” 需要指出的是,多因子打分模型的弊端在于指标选择和权重设置上存在较大的人为干预空间,基于反复调试因子、打分模型从而获得较好的回测表现,泛化能力可能略显不足。我们更关心的是,对于“市场”——这个最大的投票机器而言,国央企的核心定价因子是什么?定价因子在过去几年是否发生了变化?发生了何种变化?如何确定因子权重并实现国央企择优? 此处引入随机森林中的“特征重要性”概念,简单理解就是随机森林中使用哪些特征最能够有效地区分样本的类别或预测目标变量,从而减少特征数量、提高模型性能效率。衡量贡献的方式有两种,一种是基于袋外误差(Out-of-Bag error)的特征重要性:在构建随机森林时,每棵树都只使用了样本数据集的一部分来进行训练。 因此,可以使用剩余的样本数据来对每棵树进行测试,这些未被使用来构建该树的样本就被称为袋外样本。在进行袋外测试时,可以记录每个特征对袋外误差的贡献,通过计算每个特征在所有树的袋外测试中对误差的平均减少程度来计算特征重要性。 另一种是基于特征的重要性得分(例如sklearn):通过计算每个特征在每棵树中被用来分割样本的次数或减少基尼不纯度的程度来计算每个特征的重要性得分,然后计算所有树的平均得分来获得特征的最终重要性。 (1)特征构造:以“一利五率”经营指标体系为主,增加了估值、成长、市值、杠杆等维度共13个因子。 (2)特征预处理:(a)中位数绝对偏差去极值MAD:计算当期因子x与中位数之间的距离MD,以|MD|的中位数记为MAD,将偏离大于3倍MAD的重设为MD±3MAD;(b)缺失值处理:股息率和研发强度因子缺失率较高,不适合用SW一级的均值进行填充,此处直接删除缺失值;(c)标准化:将横截面上的因子进行标准化处理。 (3)回测区间:2014年1月1日至2023年3月31日。 (4)训练集和交叉验证集合成:随机分割样本,70%为训练集、30%为测试集,采用5折交叉验证。 (5)交叉验证调参:对5折交叉验证基于TPE贝叶斯优化。TPE(Tree-structured Parzen Estimator)贝叶斯优化是一种常用于超参数调优的方法,基于概率模型的序贯模型优化算法,不断地构建模型来对超参数空间寻优。与随机搜索、网格搜索等方法相比,它在相同的迭代次数下通常能找到更好的超参数组合,此处则是获取最大树深、决策树棵树等随机森林模型参数的最佳组合。 表2:模型涉及因子及其构建过程 2014至2022年,市场对国央企的定价要素top5分别为净利润增速、市值、pb、股息率、研发强度,特征重要性分别为0.103、0.099、0.093、0.091、0.090,有趣的是研发投入强度排名靠前、甚至高于roe等因子,与常规的认知有一定出入; 我们进一步细化,以3年为窗口期滚动构建随机森林模型,数据显示,市场对国央企的定价有所异化,盈利因子(利润增速、净资产收益率)的重要性在不断上升,市值、pb的重要性下降,且2016年以来市场高度关注国央企的研发支出(创新因子)。总结来看,国央企经营指标自上而下,而我们构建的随机森林模型则是自下而上探索市场对国央企的定价,两种思路表现出了一定的共性,即盈利因子的重要性在提高,同时高度关注国央企的研发和创新。 图5:全时序随机森林特征重要性TOP 10 图6:市值和市净率的重要性在下降 图7:盈利因子、创新因子的重要性持续上升 图8:窗口滚动随机森林显示,市场对国央企的定价有所异化 我们筛选了top5影响力因子(利润增速、市值、市净率、股息率、研发强度),并将随机森林的特征重要性确定为权重、构建打分模型,挑选上季末得分最高的50只国央企股票作为下个季度的组合。回测结果显示,2010年1月1日至2023年3月31日,国央企多因子50的累计收益率大幅提高至534.1%、对应年化收益率为13.5%,较高股息50、万得全A分别提高了6.1、9.2个百分点。 图9:多因子策略大幅提高收益率 图10:2015-2018、2021-2023年多因子表现优异 3、β收益:价值-成长风格轮动 3.1、中美利率周期下的价值成长轮动 如前述,单因子和多因子主要是筛选国央企个股以增厚收益,实际上多数策略存在有效性边界,需要根据宏观环境组合进行风格轮动、大类资产轮动。资产价格是未来现金流的永续贴现,DDM模型简化来看,分母对应美债利率(全球资产机会成本之锚)、分子对应实际需求(国内利率),我们在国央企α收益优化的基础上,基于中美利率周期构造价值-成长的风格轮动。 图11:中债利率主导价值风格 图12:美债利率主导成长风格 (1)美债下行、中债下行:利好全球风险资产尤其是成长股的估值修复,仓位配置70%成长、30%中债; (2)美债下行、中债上行:成长和价值均有利好,但对分母更敏感,成长和价值分别配置70%、30%; (3)美债上行、中债下行:美债利率上行推动美元进入强势通道而国内经济不振,呈现“东落西升”、资本回流美元资产,国内债市表现好于权益,典型的