金融工程 专题报告 基于财报文本的竞争关系与股票收益 ——“学海拾珠”系列之一百一十九 主要观点: 报告日期:2022-12-7 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 分析师:吴正宇 执业证书号:S0010522090001邮箱:wuzy@hazq.com 相关报告 1.《隐藏在日历异象背后的市值效应 ——“学海拾珠”系列之一百一十一 2.《基金公司内部的竞争与合作——“学海拾珠”系列之一百一十二》 3.《明星分析师能否在糟糕的信息环境中做出好的覆盖决策?——“学海拾珠”系列之一百一十三?》 4.《基金经理能选出好的“投机性”股票吗?——“学海拾珠”系列之一百一十四》 5.《BAB增强版:与包含定价噪音的Beta为敌——“学海拾珠”系列之一百一十�》 6.《ETF的资金流动是否蕴含独特信息——“学海拾珠”系列之一百一十六》 7.《技术相似性对股票收益的预测能力——“学海拾珠”系列之一百一十七》 8.《基金投资者的真实择时能力如何?——“学海拾珠”系列之一百一十八》 本篇是“学海拾珠”系列第一百一十九篇,由于投资者无法充分分析企业年报中有关竞争对手的文本信息,这可能导致错误定价。本文首先使用谷歌的PageRank算法进行文本分析来构建企业层面的C-Rank竞争 排名,研究发现C-Rank可以正向预测股票收益,买入高C-Rank股票和 做空低C-Rank股票的多空策略每月可以产生1.35%的α收益(每年约16%)。产生的原因是,如果某个企业被竞争对手提及次数多,则表明该企业的商业环境对市场很有吸引力,然而由于投资者对该信号反应缓慢,因此导致了定价错误。回到A股市场,财报数据几乎被挖掘殆尽,而文本信息则是相对鲜活的另类数据源,如何基于合适的算法挖掘财报文本信息构建因子是未来的一个重要方向。 在其他公司的年报中被高度提及的竞争对手往往表现更好并且也会被大量的分析师关注 如果一个特定的公司被许多企业视为竞争对手,这种认可表明其有很高的商业价值,那么,如果研究该公司的分析师横跨多个行业,特别是如果他们也研究所提及的公司,投资者就更有可能知道这一信息,进而带来更高的回报。 与竞争相关的高回报主要来自于被跨行业竞争对手的提及所驱动 作者将投资组合分为全市场、跨行业和行业内三类,研究发现,基于 全市场的投资组合的超额收益在0.77%到1.35%之间,基于跨行业的α在0.78%到1.30%之间,两者具有统计学意义且是显著相关的,但是行业内的投资组合超额收益不显著,这说明一个公司的有效竞争状态主要由 本行业以外的公司竞争所驱动。 被竞争对手高度提及公司的高回报与基于竞争的系统风险无关 本文首先研究了C-Rank的变化,发现对冲投资组合的收益在显著上升的几个月里大幅下降超过3%;其次通过研究C-Rank的系统定价发现高C-Rank贝塔系数的公司表现优于低C-Rank贝塔系数的公司。总的来说,被竞争对手高度提及公司的高回报与基于竞争的系统风险无关。 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 敬请参阅末页重要声明及评级说明证券研究报告 正文目录 1引言4 2构建竞争排名指标6 3C-RANK分布和相关性7 4C-RANK和股票收益9 4.1投资组合分类9 4.2FM回归12 4.3错误定价和分析师的覆盖13 5对风险补偿解释的测试14 6结论17 风险提示:17 图表目录 图表1提及的竞争对手的分布情况7 图表2C-RANK的统计情况和最大公司的主要竞争对手8 图表3C-RANK与公司特征之间的相关性9 图表4按C-RANK分类的投资组合的收益10 图表5累积收益11 图表6基于C-RANK分类的投资组合及稳健性检验12 图表7C-RANK的FM回归结果13 图表8分析师关注的影响14 图表9对冲组合收益和C-RANK变化15 图表10按C-RANK因子Β值排序的投资组合的收益率16 图表11按C-RANK和C-RANK因子Β值双重排序的投资组合的6因子Α值17 1引言 企业财务报表所含的信息已经有众多的专家学者对其进行了研究。从早期关于预期外净收入对股票收益的影响的研究(如Ball和Brown(1968)以及Beaver、Clarke和Wright(1979))开始,到最近更复杂的研究程序,如文本分析(如Cohen 和Frazzin(i2008),Hoberg和Phillips(2010,2016)以及Cohen、Malloy和Nguyen (2019))。这些研究的共同目标是评估投资者能从企业财务报表的信息中了解到什么。 本文研究的问题是投资者能从一家公司的竞争对手的财务报表中了解到什么。这种发布通常会包含一个竞争板块,公司可以将竞争对手在这个板块中列出。本文 假设,一个被许多其他公司列为竞争对手的企业极有可能是一个强大的竞争对手。 然而,仅仅计算这种被提及的次数是不够的,因为不是所有的提及都是平等的:一个 主要竞争对手被提及的次数应该比一个次要竞争对手更多。因此,要想很好地衡量竞争“实力”,就需要解决一系列的联立方程,即一个企业的实力是提及它的企业实力的函数。 笔者使用一种先进的文本分析技术来获取财务报表中的竞争者名单。然后,笔者按照Page等人(1999)的方式使用了谷歌的PageRank算法,即利用每个月所有公司的最新年度报告中的交叉提及来产生公司层面的竞争排名或竞争信息(称为"C-Rank")的衡量标准。本文的C-Rank强调的是企业的竞争实力不能仅仅根据企业自身的特点来评估,如企业规模或产品的市场份额。相反,它需要一个公司的所有竞争对手的集体观点。 本文进一步假设,C-Rank标志着一个公司的未来商业机会,由其他公司确定,但由于投资者的注意力有限或其计算的复杂性,C-Rank可能不被投资者完全理解。这可能导致对高C-Rank股票的错误定价,反映在异常高的未来收益上。本文的第一个测试证明了C-Rank竞争排名具有预测未来股票回报的能力。由于C-Rank与企业规模正相关,本文首先通过对当前企业规模进行C-Rank的月度横截面回归,并使用回归残差作为主要分类变量(控制规模的非参数规格产生了类似的结果)。因此,这个残差反映了公司“预期”的竞争力水平。本文发现,C-Rank可以正向预测股票收益;一个买入高C-Rank股票和做空低C-Rank股票的投资策略可以产生1.35%的月度阿尔法(每年约16%)。这种效应对各种子样本和投资期限都是稳健的,并可以通过FM回归和各种控制来证实。 C-Rank对股票收益的正向影响似乎是单调的,但又是非线性的,因为股票收益的分离主要是由高C-Rank的企业导致的。这一结果与C-Rank的偏态分布相一致,这也是典型的竞争环境的特征,即少数公司被认为是主要的竞争对手,而大多数公司不被认为是主要竞争对手。然而,本文证明了C-Rank的截面收益预测性并不完全反映非竞争性企业和竞争性企业之间的差异,而且它还能解释竞争性企业内部的截面差异。 值得注意的是,虽然较大的公司可能是较强的竞争对手,但本文的竞争衡量标准包含了公司规模所不能反映的相关信息。首先,在对C-Rank信息含量的所有测试中,本文控制了公司规模的影响。其次,市场上最大的公司不一定是最强的竞争对手。此外,本文发现,高竞争地位与高回报有关,与之相反的是,大公司在一段时间内的平均表现不佳。 鉴于同一行业的企业有相互竞争的自然趋势,本文研究了跨行业和行业内的C-Rank。具体来说,本文产生了一个跨行业的C-Rank以及一个行业内的C-Rank。本 文通过分析发现,主要的结果在跨行业的C-Rank上成立,而在行业内的C-Rank上则不成立。这表明,一个公司的有效竞争状态主要来自于本行业以外的公司的竞争。C-Rank预测收益的能力支持这样的假设:投资者并不完全了解公司未来的商业 机会,但这些机会其他公司是认可的。如果说像谷歌认为某个公司是竞争对手,这可能表明谷歌认为该公司的商业环境很有吸引力,从投资者的角度看,这是一个重要的信号。在这种情况下,高C-Rank公司的表现与之前基于劣质信息的错误定价是一致的,因为投资者会慢慢的更新信息。这种解释与最近的研究一致,即投资者可能无法有效地处理财务报表中包含的相关文本信息(例如,见Cohen和Frazzini (2008)以及Cohen、Malloy和Nguyen(2019))。 为了进一步对错误定价进行解释,本文利用了分析师覆盖率数据。如果一个特定的公司被其行业以外的其他公司视为竞争对手--这种认可代表着商业潜力--那么,如果研究该公司的金融分析师横跨多个行业,特别是如果他们也研究被提及的公司,投资者就更有可能知道这一信息。本文发现这些情况的确减少了C-Rank的影响,支持了高度竞争的公司被低估的猜想。 作为对股票错误定价的另一种解释,本文假设C-Rank可以识别影响公司风险状况的某个要素。如果许多大型公司将某一公司视为竞争对手,他们就有可能调整其战略,与该公司进行更激烈的竞争。因此,一家公司的高C-Rank可能表明,该公 司是强大竞争对手的目标,这可能会增加公司未来业绩和价值的不确定性。如果这种风险是不可分散的,那么高C-Rank公司的表现可能体现了对风险的补偿。 本文进行了几组测试来探究对风险的解释。首先,本文研究了C-Rank的变化。如果C-Rank与系统性风险有关,那么股票价格应该对C-Rank的大幅意外增长做出负面反应。事实上,平均而言,在跨行业C-Rank显著增加的月份,公司股票价格下降了大约3%,这表明投资者对这些股票赋予了更高的贴现率。其次,本文研究了C-Rank投资组合收益差值的定价情况,发现贝塔值较高的企业的后继表现要优于贝塔值较低的股票。然而,C-Rank贝塔系数只解释了C-Rank组合收益差值的一小部分。因此,虽然有一些证据支持与竞争力有关的系统风险定价,但回报率的可预测性在很大程度上与错误定价相一致,因为投资者对财务报表中的有价值信息反应较慢。 关于这里使用的C-Rank衡量标准的一些说明。它有两个重要的特点。(a)某一 公司的竞争力不仅由其自身的财务报表来定义,而且也由其他公司在其财务报表中对该公司的评价来定义;(b)它对较强的公司(即那些有更多公司提到它们是竞争对手的公司)给予更高的权重。本文发现这两个特点都很重要。 首先,如果企业只考虑在自己的报告中所确定的竞争对手,那么公司所面临的威胁就几乎没有那么大。例如,本文发现公司提到的竞争对手的过去业绩对公司的 回报有正向预测,特别是跨行业的竞争对手。这一结果与Cohen和Frazzin(i2008) 记载的客户-供应商的可预测性和Lee等人(2019)记载的技术关联概率相似,但与 C-Rank的结果形成了对比:被跨行业表现不佳的企业(过去一年)所提及的高C- Rank公司往往在未来表现更出色。 其次,如果本文不使用C-Rank,而是简单地统计该公司被其他公司作为竞争对手提及的报告数量,预测能力就会大大下降。因此,C-Rank不仅在经济上是一个合理的衡量标准,而且其独特的特征也共同促成了本文所记录的结果。 本文与使用文本分析来提供经济洞察力的文献有关。Cohen和Frazzin(i2008) 从10-Ks中确定了供应商-客户的联系,并表明对客户的冲击可以预测供应商的股票收益。Hoberg和Phillips(2010,2016)对10-Ks中的产品描述部分进行了文本分析,以衡量每对公司的产品之间的相似性。Garcia和Norli(2012)从年报中提取美 国各州的名称计数,发现州分化程度较低的公司可获得较高的股票收益。Cohen、Malloy和Nguyen(2019)表明,当公司在报告实践中做出积极改变时,这传达了关于未来公司运营的重要信号(也见Froot等人(2017))。 与此密切相关的研究是Li,Lundholm,andMinnis(2013);他们使用文本分析,通过与