基于财报的业绩超预期度量 ——因子选股系列之八十五 研究结论 本文基于公司公告的财务信息,尝试从多角度对业绩超预期进行度量,选取的角度依次是传统业绩超预期的刻画、业绩预告的补充应用、公告前后的市场反应与时序网络的使用。 对于传统业绩超预期的刻画,本文在“公告值减去预期值除以规模数”的框架下,应用随机游走模型对净利润、营业收入和毛利三个字段进行了因子构建。特别地,对于用新增字段毛利构建的SUG因子,它与常见的SUE、SUR的相关性较低、且RankIC更高。如不含漂移项的SUG1,其原始值在沪深300、中证全指里的RankIC分别为6.51%和4.16%,高于SUE1的5.72%和4.06%,也高于SUR1的4.99%和3.53%。 对于业绩预告的补充应用,本文尝试了从两个方向对业绩预告加以利用,分别是把业绩预告视为定期财报数据和财报发出前的预期值。针对前者,我们构建了含预告的SUE因子,并发现改进后的SUE因子在多头收益、夏普率和月胜率等方面要优于原始SUE因子。针对后者,我们构建了业绩偏离度因子EBIAS0和EBIAS1,虽然这两类因子的RankIC不高,但它们胜在回撤小、相关性低。 业内普遍采用公告前后的开盘价/前收盘价、最低价/前收盘价用于捕捉公告的超预期信息,本文新增了公告前后的(早盘)大单买入占比和(早盘)大单涨跌幅用于刻画公告的超预期。从因子表现来看,两类大单因子在公告日附近的表现要优于最低/前收、开盘/前收,如公告日前后三天的(早盘)大单买入占比因子,其原始值在沪深300和中证全指内的RankIC分别为4.09%和3.29%,且多空净值近期回撤较小。 传统的SUE系列因子从算法上看只是股票历史业绩序列的一种人为指定的时间序列整合方式,类似于量价序列数据,我们可以通过时序网络从股票历史业绩序列中学习对股票收益率的预测作为alpha因子。该因子原始值在沪深300和中证全指内的RankIC分别为5.69%和5.62%,多空最大回撤均控制在-20%以内。此外,其在中证全指上的多头年化超额收益为14.21%,且近期波动小于传统SUE系列因子。 将上述各描述因子按类别等权合成大类因子后,我们发现4种大类因子间的相关性均在70%以下。随后本文将上述大类因子进行等权合成,以充分利用基本面分析加市场反应“1+1>2”的效果。合成后的因子在沪深300和中证全指内的RankIC分别为6.69%和7.81%,且在中证全指上的多头年化超额收益为18.53%。 风险提示 量化模型失效风险 市场极端环境的冲击 基于财报的业绩超预期综合因子(原始值) 金融工程|专题报告 报告发布日期2022年10月25日 王星星021-63325888*6108 wangxingxing@orientsec.com.cn 执业证书编号:S0860517100001 栾张心怿luanzhangxinyi@orientsec.com.cn 分析师覆盖度因子改进——因子选股系列研究之八十四 2022-08-23 多模型学习量价时序特征——因子选股系 2022-06-12 列之八十三超大单冲击对大单因子的影响——因子选 2022-05-20 股系列之八十二 RankIC 多空组合 IC月度均值 IC_IR t值 年化收益 夏普率 月胜率 最大回撤多头月换手 沪深300 6.69% 1.68 4.03 20.52% 1.25 69.57% -26.07% 39% 中证500 8.67% 2.54 6.1 35.09% 1.94 73.91% -22.22% 38% 中证800 8.00% 2.29 5.5 32.91% 1.9 75.36% -22.82% 36% 中证1000 8.67% 2.92 7.01 43.51% 2.77 78.26% -22.26% 36% 中证全指 7.81% 2.94 7.06 35.54% 2.54 84.06% -17.34% 35% 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、传统业绩超预期的直接度量5 1.1不同算法5 1.2不同字段5 1.3因子测试6 二、业绩预告对业绩超预期度量的补充10 2.1业绩预告视为定期财报数据10 2.2业绩预告视为财报发出前的预期值11 三、财报公告前后的市场反应13 3.1财务公告前后的开盘(最低)涨跌幅13 3.2与公告日结合的大单因子16 四、机器学习捕捉财务时序的alpha19 4.1基于时序网络的因子构建方法19 4.2基于时序网络的因子选股表现19 五、基于财报业绩超预期的综合度量21 六、结论23 风险提示23 参考文献24 图表目录 图1:六类业绩超预期因子的相关性(20091231-20220930)6 图2:SUE0在各个样本空间因子表现汇总7 图3:SUE1在各个样本空间因子表现汇总7 图4:SUE0在中证全指内选股表现(原始值)7 图5:SUE1在中证全指内选股表现(原始值)7 图6:SUR0在各个样本空间因子表现汇总8 图7:SUR1在各个样本空间因子表现汇总8 图8:SUR0在中证全指内选股表现(原始值)8 图9:SUR1在中证全指内选股表现(原始值)8 图10:SUG0在各个样本空间因子表现汇总9 图11:SUG1在各个样本空间因子表现汇总9 图12:SUG0在中证全指内选股表现(原始值)9 图13:SUG1在中证全指内选股表现(原始值)9 图14:含预告前后SUE因子相关性(20091231-20220930)10 图15:业绩预告类因子的相关性(20091231-20220930)10 图16:SUG0(含预告)在各个样本空间因子表现汇总10 图17:SUG1(含预告)在各个样本空间因子表现汇总10 图18:SUG0(含预告)在中证全指内选股表现(原始值)11 图19:SUG1(含预告)在中证全指内选股表现(原始值)11 图20:EBIAS0在各个样本空间因子表现汇总12 图21:EBIAS1在各个样本空间因子表现汇总12 图22:EBIAS0在中证全指内选股表现(原始值)12 图23:EBIAS1在中证全指内选股表现(原始值)12 图24:八类公告日前后因子的相关性(20131231-20220930)13 图25:公告当天的最低/前收在各个样本空间因子表现汇总14 图26:公告当天的开盘/前收在各个样本空间因子表现汇总14 图27:公告当天的最低/前收在中证全指内选股表现(原始值)14 图28:公告当天的开盘/前收在中证全指内选股表现(原始值)14 图29:公告前后三天的最低/前收在各个样本空间因子表现汇总15 图30:公告前后三天的开盘/前收在各个样本空间因子表现汇总15 图31:公告前后三天的最低/前收在中证全指内选股表现(原始值)15 图32:公告前后三天的开盘/前收在中证全指内选股表现(原始值)15 图33:公告当天的大单买入占比在各个样本空间因子表现汇总17 图34:公告当天的大单涨跌幅在各个样本空间因子表现汇总17 图35:公告当天的大单买入占比在中证全指内选股表现(原始值)17 图36:公告当天的大单涨跌幅在中证全指内选股表现(原始值)17 图37:公告前后三天的大单买入占比在各个样本空间因子表现汇总18 图38:公告前后三天的大单涨跌幅在各个样本空间因子表现汇总18 图39:公告前后三天大单买入占比在中证全指选股表现(原始值)18 图40:公告前后三天大单涨跌幅在中证全指选股表现(原始值)18 图41:基于时序网络构建业绩超预期因子的过程19 图42:时序网络算法下的因子表现(20161230-20220930)20 图43:业绩超预期的综合度量框架21 图44:各大类因子间的相关性(20161230-20220930)21 图45:大类加权算法下的综合因子表现(20161230-20220930)22 一、传统业绩超预期的直接度量 业绩超预期一般有两种度量方式,一种通过业绩公告值与预期值的预期差直接度量业绩超预期,一种通过业绩公告前后的投资者行为间接表征业绩超预期。前者的难点在于业绩预期值的估计,目前业内常用的产生业绩预期值的方式包括通过业绩历史序列生成、截面回归估计和分析师一致预期等,后者的难点在于找到合理的第三方代理变量,目前常用的是股票公告前后的市场行为(代表市场参与者整体)和卖方分析师行为(代表机构投资者)。受篇幅限制,本篇报告聚焦基于业绩历史时间序列的超预期直接度量和基于业绩公告前后市场反应的间接度量。 我们早在2018年5月的专题报告《业绩超预期类因子》中已经初步讨论过基于业绩历史序列的业绩超预期度量,本文在前序报告的基础上做了一些拓展。传统业绩超预期直接度量的因子化构建一般采用“公告值减去预期值除以规模数”的方式,下面将分别讨论产生预期值与规模数的不同算法,以及财报中可用于体现公司业绩的不同字段。 1.1不同算法 在计算预期值与规模数时,常见的算法是对表示公司业绩的某财报字段构建季节性随机游走模型进行估计,如Bartov等(2000)和Jegadeesh等(2006)。以净利润字段为例,其标准化预期外盈利在公司i、季度t上的取值可以表示为: ∆𝑄𝑖,�−𝐸(∆𝑄𝑖,𝑡) 𝑆𝑈𝐸𝑖,�= 𝜎(∆𝑄𝑖,� (1) ) 其中,∆𝑄𝑖,�表示公司财报公告的净利润单季同比增长,𝐸(∆𝑄𝑖,𝑡)、𝜎(∆𝑄𝑖,𝑡)分别表示公告前的预测值和预测标准差。根据季节性随机游走模型是否含漂移项,我们可以得到两种不同的时间序列模型: 𝑄𝑖,�=𝑄𝑖,𝑡−4+𝐶𝑖,�+𝜀𝑖,𝑡(含漂移项)(2) 𝑄𝑖,�=𝑄𝑖,𝑡−4+𝜀𝑖,𝑡(不含漂移项)(3) ∑� ∆𝑄𝑖,𝑡−� ∑� (∆𝑄𝑖,𝑡−𝑗−𝜇)2 在含漂移项的随机游走模型假设下,𝐸(∆𝑄𝑖,𝑡)=𝑖=1,𝜎(∆𝑄𝑖,𝑡)=√𝑖=1;在不 �𝑛−1 ∑�∆𝑄𝑖,𝑡−𝑗2 𝑛−1 含漂移项的随机游走模型假设下,𝐸(∆𝑄𝑖,𝑡)=0,𝜎(∆𝑄𝑖,𝑡)=√𝑖=1(n默认取8)。因此, 在随机游走模型假设下,我们可以得到两类SUE因子。 除去上文展示的算法外,我们还可以对∆𝑄𝑖,�构建AR(1)、MA(1)等时序模型等方法来计算超预期因子。但经测算,发现不同算法间因子的相关性较高,为避免冗余,我们只保留随机游走模型下的两类算法。 1.2不同字段 学术界对业绩超预期的研究主要集中在净利润与营业收入这两个财报科目,并以此派生出对 EarningsSurprise和RevenueSurprise的系列研究,如Kinney等(2002)和Manikas等 (2016)。 事实上,除去净利润与营业收入,毛利在利润表中也是一项重要科目。下面公式展示了营业收入、毛利与净利润在利润表中的简化勾稽关系1。其中,营业收入与毛利的主要区别在于是否包含营业成本,而净利润与毛利的主要区别在于是否包含销售、管理、研发、财务费用等。因此,毛利这个字段可以提供不同于净利润与营业收入的业绩信息、拓宽我们对于业绩刻画的角度。相对营业收入,毛利多了一些成本的考虑,相对净利润,毛利少了一些更容易操控的会计项目。 营业收入−营业成本=毛利 毛利+投资收益−销售费用−管理费用−研发费用−财务费用=营业利润营业利润+营业外收入−营业外支出−所得税=净利润 综上,我们在业绩超预期因子“公告值减去预期值除以规模数”的框架下,分别采用了两种 算法(是否含漂移项的随机游走模型)与三个字段(净利润、营业收入与毛利),总共构建了六类业绩超预期因子。为了表述方便,我们用SUE0、SUE1表示两类净利润因子(0表示含漂移项、1表示不含漂移项,下同),用SUR0、SUR1表示两类营业收入因子,用SUG0、SUG1表示