您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开源证券]:开源量化评论(95):海外分析师一致预期的A股应用 - 发现报告
当前位置:首页/其他报告/报告详情/

开源量化评论(95):海外分析师一致预期的A股应用

2024-06-29魏建榕、胡亮勇开源证券林***
开源量化评论(95):海外分析师一致预期的A股应用

金融工程专题 2024年06月29日 海外分析师一致预期的A股应用 金融工程研究团队 ——开源量化评论(95) 魏建榕(首席分析师) 魏建榕(分析师)胡亮勇(分析师) 证书编号:S0790519120001 张翔(分析师) weijianrong@kysec.cn 证书编号:S0790519120001 huliangyong@kysec.cn 证书编号:S0790522030001 证书编号:S0790520110001 傅开波(分析师) 证书编号:S0790520090003 高鹏(分析师) 证书编号:S0790520090002 苏俊豪(分析师) 证书编号:S0790522020001 胡亮勇(分析师) 证书编号:S0790522030001 王志豪(分析师) 证书编号:S0790522070003 盛少成(分析师) 证书编号:S0790121070009 苏良(分析师) 证书编号:S0790121070008 何申昊(研究员) 证书编号:S0790122080094 陈威(研究员) 证书编号:S0790123070027 蒋韬(研究员) 证书编号:S0790123070037 相关研究报告 《雪球大V用户发帖行为深度挖掘》 -2024.3.10 《扎堆效应的识别:以股东户数变动为例》-2022.11.22 《一叶知秋:在线平台销售数据的前瞻作用》-2022.11.06 海外分析师不断增加对A股上市公司的覆盖数量 S&PGlobal的分析师预期数据库主要涵盖三类表,分别是核心表(CoreTables)、数据表(DataTables)和引用表(ReferenceTables)。 分析师一致预期数据库中,主要包含周期型数据(Periodic)和非周期型数据 (Non-Periodic)两大类。周期型数据主要是关于上市公司财务报表中各维度指标的预测,常见的指标有EPS、净利润和ROE等。非周期类数据主要涵盖上市公司的目标价预测和投资评级等。 当前外资分析师针对A股上市公司盈利预测数据的覆盖范围逐年提升,以EPS (GAAP)为例,2023年度4月财报披露期最高样本覆盖数量为1754家,约占全市场A股数量1/3左右。 分析师预期数据的官方衍生指标样本数量分布不够均匀 一致预期分析表中包含83个指标,其中43个指标在A股有对应的数值结果。其中周期性指标有23种,非周期性指标20种。根据分类统计结果,数据差值 (Difference)、惊喜(Surprise)和标准化未预期盈余(StandardizedUnanticipatedEarnings)是周期性的指标,而增长率(Growth)则为非周期性指标。 官方衍生指标中收益稳定性相对占优的为EPSNormalizedDifference。整体而言,EPS差值指标(EPSDifference)优于惊喜指标(EPSSurprise)。 多维度分析师预期数据融合能有效提升选股表现 盈利预期调整因子(ECA)全区间内RankIC均值仅为2.14%,年化RankICIR为 1.11。 目标价收益率因子(TPR)RankIC均值为2.27%,年化RankICIR为1.09。在回测前期,预测效果优异,中期波动增大,胜率下降,后续有所恢复,最近一年又开始转弱。 投资评级因子(RT)RankIC均值为1.72%,年化RankICIR为1.34。2022年以来累计RankIC出现较大回撤,但近期开始转好。 复合分析师因子(MA)RankIC均值为2.36%,年化RankICIR为1.65。2022年 9月后累计RankIC持续回撤了近一年时间,后续开始反弹转好。 复合分析师因子多头端年化收益率为9.24%,多空超额年化收益率为7.11%,最大回撤为-7.84%,月度胜率约70%。 复合分析师因子在不同宽基指数中均有优异的增强效果。在超额收益率稳定性上,中证500指数的增强表现最优,收益波动比为1.59,但超额收益率回撤亦是最大水平,达到-10.46%。 风险提示:模型基于历史数据统计,未来存在失效风险。 金融工程 研究 金融工程 专题 开源证券 证券研究报 告 目录 1、S&PGlobal预期数据概览4 1.1、数据结构4 1.2、数据内容6 1.3、数据概览8 2、官方衍生数据测试10 2.1、指标明细10 2.2、指标表现12 3、一致预期自定义因子构建13 3.1、盈利预期调整因子14 3.2、目标价收益率因子15 3.3、投资评级变动因子16 3.4、多维度合成18 4、复合分析师因子应用21 风险提示22 图表目录 图1:S&PGlobal分析师预期数据结构5 图2:公司、证券及交易股票的关联关系6 图3:一致预期数据表内容结构7 图4:周期类指标列表7 图5:非周期类指标列表7 图6:A股上市公司各指标样本覆盖数量呈温和上升趋势8 图7:市值越大的宽基指数样本覆盖度越高9 图8:样本覆盖度占比最高的行业为钢铁,数量最高的行业为医药生物9 图9:上市公司财报披露期间预期数据更新频率更高10 图10:不同统计周期下的样本数量对比10 图11:季频口径下的EPS差值(Difference)表现好于EPS惊喜(Surprise)13 图12:EPS(GAAP)Difference指标具有稳健的选股表现13 图13:盈利预期调整因子2021年以来预测效果减弱14 图14:盈利预期调整因子多空超额收益2022年9月后出现较大回撤14 图15:目标价收益率因子年化RankICIR为1.0915 图16:目标价收益率因子超额收益波动较大16 图17:不同个股目标价收益率分布不同16 图18:不同评级推荐次数分布17 图19:投资评级因子2023年下半年以来表现回暖18 图20:投资评级下调的个股未来收益表现具有更高的区分度18 图21:复合分析师因子年化RankICIR为1.6519 图22:复合分析师因子的超额收益稳定性有显著提升19 图23:复合分析师因子在预测显著性和稳定性上均有所改善20 图24:沪深300指数增强收益近期波动加大21 图25:中证500指数增强收益出现阶段性回撤22 图26:中证1000指数增强表现优异22 表1:周期类数据中关于预测周期的类型8 表2:涉及A股的衍生指标明细11 表3:官方指标最近更新日期及样本数量12 表4:投资评级数据样例17 表5:复合分析师因子多空超额月度胜率约70%20 表6:不同因子IC统计量对比20 表7:不同宽基指数增强效果绩效对比22 无论是主动投资抑或量化研究,分析师预期数据始终是绕不开的话题。分析师预期数据既可以帮助我们判断上市公司业绩超预期与否,亦能辅助我们感知当前市场不同分析师对指定个股观点的变化趋势。 以往我们审视A股分析师预期数据的时候,更多是站在国内分析师视角,引用的数据均来自国内分析师的相关研究成果。随着A股市场重要性的与日俱增,优秀的上市公司体量逐渐增加,海外券商对A股上市公司进行分析覆盖的密度与频率也在逐步增加。 S&PGlobal作为业内领先的基础数据提供商,凭借其丰富的数据覆盖、及时的数据更新和快速的服务响应,深受全球主流市场参与者的认可。本篇报告,我们尝试以S&PGlobal数据库中分析师预期数据为基础,从海外分析师视角来观察A股上市公司预期数据的结构、特征和表现。 本篇报告,我们尝试从四个方面进行展开。第一部分,我们针对S&PGlobal一致预期数据库的设计架构进行简要说明,尝试厘清各表之间的关联关系,便于定位我们所需数据。在此基础上,我们对海外分析师视角下的A股一致预期数据进行了描述性分析统计。第二部分,我们测试了S&PGlobal数据库中基于一致预期数据所构建的衍生因子的选股表现。衍生因子涵盖周期性和非周期性两个维度,在每个维度下面存在多种统计指标。第三部分,我们根据海外分析师针对A股上市公司提供的盈利预期、目标价和投资评级三类数据,构建了相应的选股因子,并分别测试了各自的选股表现。此外,我们对不同维度的分析师预期数据进行融合,构建了复合分析师因子,整体选股效果有所提升。第四部分,我们根据复合分析师因子构建了主流宽基指数增强策略,整体表现优异。 1、S&PGlobal预期数据概览 S&PGlobal数据库整体设计理念轻量高效,很少有冗余信息存储,各表之间的关联关系通过架构图能够清晰了解掌握,但是无法所见即所得,为了找到所需的完整信息跨表匹配查询通常是必备操作。国内数据提供商设计理念则倾向于简单直观,其会在一张表中提供足够的数据字段,尽量让投资者在一张表中找到所需的信息。这么做的好处是数据直观易获取,但当表的数量非常多时,容易造成部分字段重复存储,耗费更多存储空间。到底哪种设计方案更优,根据使用场景的变化因人而异。 S&PGlobal分析师预期数据库(S&PCapitalIQEstimates)作为一个透明的、高质量的、标准化的全球数据库,包括实时对全球上市公司进行投资评级的调整、目标价的修订、跟踪上市公司动态新闻或重大事项,以及基于分析师、经纪人和公司本身的预测、建模和分析。其估算数据主要来自研究报告、研究员和新闻稿。 1.1、数据结构 从分析师预期数据表结构的设计来看,其主要包含三类表,分别是核心表(CoreTables)、数据表(DataTables)和引用表(ReferenceTables)。 核心表格提供了所有评估表所需的基础数据,许多字段都表示为整数,可以通过链接到数据表和引用表来进一步定义。数据表格提供了与每个估算表相关的数据。引用表提供了估算数据的额外细节,表名通常包含单词“Type”。引用表定义了核心表和数据表中的id,并允许您进一步检索描述该数据的文本项。引用表只能通过连接核心表和数据表来访问。 图1:S&PGlobal分析师预期数据结构 资料来源:S&PGlobal、开源证券研究所 除了上述主要类型的表结构外,S&PGlobal中还存在一类数据表,即基础文件 (BaseFiles),基础文件是所有其他数据集的基础。这些基础文件将所有数据集中的公司、证券、股票和其他基本对象联系起来。 由于S&PGlobal数据涵盖全球主流交易市场,面向多维度资本市场,通常存在的一个场景是某个综合类型的集团,旗下包含多个上市公司和非上市公司主体,在不同交易所同时有多种类型的金融产品在交易,如证券、债券等。 以上海市北高新集团为例,如何通过跨表查询找到该集团对应的在A股上市的公司的相关信息,而非在其它交易所交易的其它类型标的,便成了一件关键的事情。可以看到,上海市北高新集团在上海交易所交易的证券有三种,不仅有最基础的A股上市公司,还有基于美元交易的B股和沪股通标的,而tradingItemId是唯一能识别彼此差异的字段。 图2:公司、证券及交易股票的关联关系 资料来源:S&PGlobal、开源证券研究所 1.2、数据内容 当前S&PGlobal数据库中关于分析师预期数据主要包含以下五张表,分别为一致预期数据(ConsensusEstimatesData,CED)、明细估计数据(DetailEstimatesData,DED)、分析师覆盖数据(AnalystsCoverageData,ACD)和公司指引数据(CompanyGuidanceData,CGD)以及基于原始估计数据衍生得到的一致预期分析数据 (ConsensusAnalysisData,CAD)。 一致预期数据(CED)通过对不同分析师的预测做整理计算,提供了对一家上市公司的总体估计,和许多不同数据点的历史一致预期估计值。 明细估计数据(DED)提供特定交易主体或公司分析师级别的历史和当前估计值,这些估计值反映了个别分析师的研究或分析成果。每个分析师和经纪人都被分配了唯一的标识符以便我们能够随时跟踪个别分析师和独立的经纪商。 分析师覆盖数据(ACD)表明了哪些经纪商提供了哪家公司的覆盖研究。该表通过将经纪商和分析师与