相对定价类基本面因子挖掘 ——因子选股系列之一〇九 研究结论 相对定价类基本面因子构造方法 基本面指标本质都是以相对定价为核心,往往都是以比值的形式来构建,不可避免会遇到除数效应导致取值异常以及分子分母可比性的问题,我们将传统经典的个体除法调整 金融工程|专题报告 报告发布日期2024年10月11日 杨怡玲yangyiling@orientsec.com.cn 执业证书编号:S0860523040002 为截面整体回归的方式来重构这些基本面因子,重构后的因子普遍表现优于传统的版本,显示了回归版本基本面因子的显著优势。 传统的基本面因子往往以财务经验为主来构建,涉及到的财务科目较少,但是上市公司的财报中有上百个财务科目,这些科目我们并没有深入的研究了解和经验积累,而截面回归的形式从效果来看可以有效克服两个财务指标间的可比性问题。因此我们想把回归的结构作为一个挖掘基本面因子的有效算子,通过对不同财务科目之间进行截面回归的形式,以挖掘出新的有效的相对定价类基本面因子。 基本面因子挖掘 我们以三大报表利润表、现金流量表、资产负债表中满足截面覆盖度要求的所有字段作为可用的基础数据,加工为单季度、去年同期单季度、单季度同比变化等类型共515个字段,两两回归并剔除高相关因子后得到32个基本面因子,两两相关系数低于0.5,这些因子在样本内外均保持了稳定显著的选股能力,复合因子月度IC均值0.069,年化ICIR3.48,IC胜率87%,月均多头超额1.01%。 基本面衍生因子挖掘 我们进一步将盈余公告披露时衍生的量价数据也作为广义的基本面衍生指标,作为回归模型的输入来挖掘基本面衍生类相对定价因子,并用同样方式筛选得到2个低相关的有效因子,复合因子月度IC均值0.069,年化ICIR4.38,IC胜率91%,月均多头超额0.77%。 基本面类复合因子及指数增强组合 我们将挖掘得到的34个因子进行复合,复合因子在样本内外的表现较为一致,月度IC均值0.084,年化ICIR4.21,IC胜率89%,月均多头超额1.12%。将挖掘得到的因子加入传统26个基本面因子集合进行复合得到基本面类复合因子,月度IC均值0.103,年化ICIR达5.17,IC胜率93%,月均多头超额1.43%,在各个指数内均具有显著的选股能力,在沪深300、中证500、中证1000指数内的IC均值分别为0.085、0.094、0.106。 以基本面类复合因子构建的宽基指数增强组合同样具有稳健的超额收益: 沪深300指数增强组合年化超额收益12.01%,相对最大回撤-4.86%,信息比 2.78,年化跟踪误差4.11%,今年截止20240731超额达8.83%; 中证500指数增强组合年化超额收益21.22%,相对最大回撤-4.9%,信息比3.88,年化跟踪误差4.94%,今年截止20240731超额达10.82%; 中证1000指数增强组合年化超额收益23.99%,相对最大回撤-7.21%,信息比 3.39,年化跟踪误差6.43%,今年截止20240731超额达12.36%。 风险提示 1.量化模型失效风险。 2.极端市场环境可能对模型效果造成剧烈冲击,导致收益亏损。 KD-Ensemble:基于知识蒸馏的alpha因子挖掘模型:——因子选股系列之一〇八DFQ-XGB:基于树模型的alpha预测方案:——因子选股系列之一〇七 基于风险注意力的因子挖掘模型:——因子选股系列之一〇六 非线性市值风控全攻略:——因子选股系列之一〇五 型:——因子选股系列之一〇四DFQ-FactorVAE:融合变分自编码器和概 2024-05-14 率动态因子模型的alpha预测方案:——因子选股系列之一〇三基本面因子的重构:——因子选股系列之 2024-03-21 融合基本面信息的ASTGNN因子挖掘模 一〇二 2024-08-19 2024-08-15 2024-05-29 2024-05-27 2024-05-27 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、相对定价类基本面因子构造方法6 二、基本面因子挖掘7 2.1基本面数据及挖掘流程7 2.2挖掘的基本面因子表现9 2.3基本面复合因子表现28 三、基本面衍生因子挖掘29 3.1基本面衍生数据及挖掘流程29 3.2挖掘的基本面衍生因子29 3.3基本面衍生复合因子表现33 四、基本面类复合因子及指数增强组合34 4.1基本面类复合因子34 4.2基本面指数增强组合38 五、总结42 风险提示43 图表目录 图1:基本面指标的比值结构6 图2:基本面指标的重构方式6 图3:回归版基本面因子计算流程7 图4:单季EBIT同比变化比市值因子月度IC10 图5:单季EBIT同比变化比市值因子多空净值10 图6:单季EBIT同比变化比市值因子十分组月度超额收益均值10 图7:单季综合收益比市值因子月度IC11 图8:单季综合收益比市值因子多空净值11 图9:单季综合收益比市值因子十分组月度超额收益均值11 图10:单季未分配利润同比变化比市值因子月度IC12 图11:单季未分配利润同比变化比市值因子多空净值12 图12:单季未分配利润同比变化比市值因子十分组月度超额收益均值12 图13:单季其他收益比市值因子月度IC13 图14:单季其他收益比市值因子多空净值13 图15:单季其他收益比市值因子十分组月度超额收益均值13 图16:单季经营活动现金流净额比市值因子月度IC14 图17:单季经营活动现金流净额比市值因子多空净值14 图18:单季经营活动现金流净额比市值因子十分组月度超额收益均值14 图19:单季总资产比市值因子月度IC15 图20:单季总资产比市值因子多空净值15 图21:单季总资产比市值因子十分组月度超额收益均值15 图22:单季投资现金流出比市值因子月度IC16 图23:单季投资现金流出比市值因子多空净值16 图24:单季投资现金流出比市值因子十分组月度超额收益均值16 图25:应付职工薪酬比去年同期其他应付款因子月度IC17 图26:应付职工薪酬比去年同期其他应付款因子多空净值17 图27:应付职工薪酬比去年同期其他应付款因子十分组月度超额收益均值17 图28:单季所得税比去年同期单季EBIT因子月度IC18 图29:单季所得税比去年同期单季EBIT因子多空净值18 图30:单季所得税比去年同期单季EBIT因子十分组月度超额收益均值18 图31:单季购建长期资产支付现金比去年同期在建工程因子月度IC19 图32:单季购建长期资产支付现金比去年同期在建工程因子多空净值19 图33:单季购建长期资产支付现金比去年同期在建工程因子十分组月度超额收益均值19 图34:单季归母净利润比母公司综合收益因子月度IC20 图35:单季归母净利润比母公司综合收益因子多空净值20 图36:单季归母净利润比母公司综合收益因子十分组月度超额收益均值20 图37:单季营业总成本比去年同期流动负债因子月度IC21 图38:单季营业总成本比去年同期流动负债因子多空净值21 图39:单季营业总成本比去年同期流动负债因子十分组月度超额收益均值21 图40:单季营业税金比总资产因子月度IC22 图41:单季营业税金比总资产因子多空净值22 图42:单季营业税金比总资产因子十分组月度超额收益均值22 图43:盈余公积金比去年同期单季利息费用因子月度IC23 图44:盈余公积金比去年同期单季利息费用因子多空净值23 图45:盈余公积金比去年同期单季利息费用因子十分组月度超额收益均值23 图46:未分配利润比去年同期单季未分配利润因子月度IC24 图47:未分配利润比去年同期单季未分配利润因子多空净值24 图48:未分配利润比去年同期单季未分配利润因子十分组月度超额收益均值24 图49:半年固定资产折旧比去年同期单季利息费用因子月度IC25 图50:半年固定资产折旧比去年同期单季利息费用因子多空净值25 图51:半年固定资产折旧比去年同期单季利息费用因子十分组月度超额收益均值25 图52:单季经营活动现金流入同比增速因子月度IC26 图53:单季经营活动现金流入同比增速因子多空净值26 图54:单季经营活动现金流入同比增速因子十分组月度超额收益均值26 图55:现金等价物比去年同期其他综合收益因子月度IC27 图56:现金等价物比去年同期其他综合收益因子多空净值27 图57:现金等价物比去年同期其他综合收益因子十分组月度超额收益均值27 图58:基本面复合因子月度IC28 图59:基本面复合因子多空净值28 图60:基本面复合因子十分组月度超额收益均值28 图61:盈余公告开盘跳空超额因子月度IC29 图62:盈余公告开盘跳空超额因子多空净值29 图63:盈余公告开盘跳空超额因子十分组月度超额收益均值30 图64:盈余公告开盘跳空超额比公告后累计行业超额因子月度IC30 图65:盈余公告开盘跳空超额比公告后累计行业超额因子多空净值30 图66:盈余公告开盘跳空超额比公告后累计行业超额因子十分组月度超额收益均值31 图67:盈余公告次日换手率因子月度IC31 图68:盈余公告次日换手率因子多空净值31 图69:盈余公告次日换手率因子十分组月度超额收益均值32 图70:盈余公告次日换手率比公告后累计市场超额因子月度IC32 图71:盈余公告次日换手率比公告后累计市场超额因子多空净值32 图72:盈余公告次日换手率比公告后累计市场超额因子十分组月度超额收益均值33 图73:基本面衍生复合因子月度IC33 图74:基本面衍生复合因子多空净值33 图75:基本面衍生复合因子十分组月度超额收益均值34 图76:相对定价类基本面复合因子月度IC34 图77:相对定价类基本面复合因子多空净值34 图78:相对定价类基本面复合因子十分组月度超额收益均值35 图79:相对定价类基本面复合因子风格暴露均值35 图80:相对定价类基本面复合因子风格暴露时序值35 图81:基本面类复合因子月度IC37 图82:基本面类复合因子多空净值37 图83:基本面类复合因子十分组月度超额收益均值37 图84:基本面类复合因子风格暴露均值38 图85:基本面类复合因子风格暴露时序值38 图86:沪深300指数增强组合历史净值39 图87:中证500指数增强组合历史净值40 图88:中证1000指数增强组合历史净值41 表1:贵州茅台的部分现金流量表数据7 表2:相对定价类基本面复合因子在各域内的选股能力35 表3:传统基本面因子库36 表4:基本面类复合因子在各域内的选股能力37 表5:沪深300指数增强组合各年收益表现39 表6:中证500指数增强组合各年收益表现40 表7:中证1000指数增强组合各年收益表现41 一、相对定价类基本面因子构造方法 早在1934年本杰明·格雷厄姆在《证券分析(SecurityAnalysis)》中就提出了用PE来衡量股票的价值,此后从财务角度又涌现出例如ROE、股息率等各种衡量企业盈利能力、估值水平、分红能力、盈利质量等维度的基本面指标: 估值:BP、单季EP、单季SP、股息率TTM、… 盈利:单季ROE、单季ROA、… 成长:单季净利同比增速、单季营收同比增速、… 这些基本面指标往往都是以比值的形式来构建,本质都是以相对定价为核心。 图1:基本面指标的比值结构 数据来源:东方证券研究所 我们知道一旦涉及到除法这种比值形式,就会遇到除数效应的问题。当分母取值接近0时,可能会显著放大指标的取值从而造成取值异常,当分子为0时会使结果取值都为0,当分子和分母的数量级差距较大时也会导致异常的放大和缩小效应。并且这些基本面指标从其定义的出发点都是以绝对的定价为主,例如通过ROE、增速等对股票价格进行定价,并且更关注同一只股票某项指标的时序变化。但是当面临选股问题时,我们并不关注每只股票的ROE