NBER工作文件系列 (几乎)200年的基于新闻的经济情感JulesH.vanBinsbergen SvetlanaBryzgalovaMayukhMukhopadhyayVarunSharma 工作文件32026http://www.nber.org /papers/w32026 国家经济研究局 马萨诸塞州大道1050号剑桥,MA02138 2024年1月 任何错误或遗漏都是作者的责任。对于有用的评论,讨论和建议,我们感谢PedroBordalo(讨论者) ,WillCog,JigyHe(讨论者),MaishJha(讨论者),JigYagJag,AsgerLde(讨论者),AlaMoreira(讨论者),MaximiliaSchleritzo(讨论者)和LaraVeldamp。我们还感谢伦敦商学院、香港中文大学、萨里大学、2023年亚当·斯密研讨会、宏观金融学会第22届研讨会、第五届金融计量经济学国际研讨会、佐治亚州金融科技会议、2023年东方金融协会、CFA学会和雅各布斯利维股权管理中心的研讨会和会议参与者。我们,作者,关于这项研究没有相关的利益冲突要报告。本文表达的观点是作者的观点,不一定反映国家经济研究局的观点。 NBER工作文件出于讨论和评论目的而分发。它们没有经过同行评审,也没有经过NBER官方出版物随附的NBER董事会的评审。 ©2024作者JulesH.vanBinsbergen,SvetlanaBryzgalova,MayukhMukhopadhyay,andVarunSharma.Allrightsreserved.Shortsectionsoftext,notexplicitlypermission,maybequotedwithoutexplicitpermission,such©notice,isgiv (几乎)200年的基于新闻的经济情绪 JulesH.vanBinsbergen,SvetlanaBryzgalova,MayukhMukhopadhyay,andVarunSharmaNBERWorkingPaperNo.32026 2024年1月 JEL编号E2,E3,E4,E40,E43,E44,G01,G1,G10,G14,G17,G18,G40 摘要 使用2亿页的13,000份美国本地报纸和机器学习方法,我们在国家和州层面构建了一个长达170年的经济情绪衡量标准,该标准扩展了时间序列(超过一个世纪)和横截面的现有衡量标准。我们的措施预测GDP(国家和地方),消费和就业增长,即使在控制了常用的预测指标以及货币政策决策之后。我们的措施与专家预测中的信息不同,并引领其共识价值。有趣的是,在过去的半个世纪中,所有州的新闻报道都变得越来越负面。 宾夕法尼亚大学沃顿商学院 3620蝗虫步道 费城,PA19104和NBER julesv@wharton.upen.edu 摄政公园SvetlanaBryzgalova伦敦商学院 伦敦NW14SAsbryzgalova@london.edu MayukhMukhopadhyaySussexPlace 摄政公园 伦敦商学院伦敦NW14SA 英国 VarunSharma印第安纳大学vs12@iu.edu Introduction 尽管经济情绪的度量已经被广泛研究,1由于时间序列跨度短和缺乏粒度,它们的应用受到了一定的限制。本文利用机器学习方法,从过去170年出版的美国地方报纸版面构建了一种新的经济情绪测度。我们表明,经济情绪对于理解地方和国家层面的商业周期都很重要。我们发现,经济情绪a)预测国家和州一级的经济基本面 ,b)领先于一致的GDP预测,c)各州表现出较大的横截面变化,全国部分仅驱动州变化的35%。 为此,我们使用了170年数字化报纸的历史收藏,其中包括来自13,000家当地报纸的2亿个报纸页面的文本。我们的语料库包括大约10亿篇报纸文章,是华尔街日报语料库的主要增量,这是经济学和金融学中广泛使用的文本数据源,包含大约100万篇文章。事实上,我们的数据大约是英文维基百科条目总数的95倍。通过利用本地报纸的集合,我们可以在更高的粒度上衡量情绪,例如县或州一级。 为了衡量基于文本的经济情绪,我们定制了由Sigla和Mhopadhyay(2022)开创的机器学习技术。我们利用Word2vec(一种基于神经网络的算法)创建了一个完全自动化的主题特定词典,它允许我们从使用单词和短语的上下文中捕获它们的含义(Miolov,Stsever,Che,Corrado和Dea(2013)和Miolov,Che,Corrado和Dea(2013))。我们没有使用二元的正/负内涵,而是按照Hamilto,Clar,Lesovec和Jrafsy(2016)对字典中的每个单词和短语进行连续的情感度量。因此,我们的方法自动克服了简单单词计数技术所面临的许多常见挑战,例如检测否定和测量单词/短语强度。我们的测量在时间序列和横截面上都表现出很大的变化。此外,我们的方法发现,自1970年代以来,整体新闻情绪呈明显下降趋势。我们表明,经济新闻的报道并没有推动这一趋势。相反,它涉及经济和非经济新闻的一般报道。将这种整体情绪与经济新闻 分开,可以让我们构建一个经济情绪的衡量标准。 被报纸如何改变其整体基调的变化所污染。2 1参见洛佩兹-萨利多、斯坦和扎克拉耶克(2017年)、博达洛、根奈奥利和施莱弗(2018年)和博达洛、根奈奥利、马和施莱弗(2020年)。 2在1992年美国大选的报道之后,许多先前的研究都集中在媒体中明显的负面偏见上,参见Damstra和 Boukes(2021),Fogarty(2005),Soroka(2006)和Soroka(2014))。 在继续之前,一个重要的资格是有序的。与NLP的最新进展一致,我们将情绪衡量为大众媒体中经济新闻报道的(广泛定义的)积极性/消极性。结果,我们的措施可以反映(a)经济新闻的纯粹事实报道,(b )非理性繁荣或两者的某种组合。将此放在最近的资产定价文件的语言中,我们的措施可以反映现金流预期和折现率的变化。从这个意义上讲,我们论文中的“情绪”一词更多地涉及英语单词的一般含义,而不是最近在行为经济学和金融学中对其进行的更具体的解释。 我们将情绪度量与各种信息集一起嵌入到预测性回归中,以查看它们是否跨越它。我们的测试没有建立因果关系。相反,它们提供了基于新闻的经济情绪的信息内容及其与经济基本特征的经验关系的诊断:基本面和代理人预期的商业周期波动。 我们的措施预测了未来的人均GDP增长,即使控制了当前的GDP增长:在1850年至2017年的样本期内,情绪增加了一个标准差,相当于下一年的GDP增长了2%。此外,在1947Q1-2019Q4的样本期内,当我们还观察到收益率曲线的斜率(标准衰退预测指标)时,我们发现情绪增加一个标准差会导致0.29%的额外GDP增长提前一个季度(对应于1.1%的年化增长)。此外,即使在控制了“专业预报员调查”中的共识预测之后,这种可预测性仍然存在,这意味着我们的措施捕获了此类共识预测未涵盖的重要信息。值得注意的是,正如我们所显示的,我们的措施实际上领先于调查,因为它预测了下一季度的共识值。总体而言,我们的结果表明情绪在理解商业周期方面的重要性。 该方法的灵活性使我们能够进一步探索我们的措施的可预测性的来源。报纸文章涵盖时事,但也有关于未来的观点和看法。为了区分这两种新闻来源,我们创建了与现在和未来相关的特定主题词典,并在每个报纸页面上测量该语言的强度,以将其分类为与当前或未来事件相关。我们使用这种分类来创造当前和未来的经济情绪。我们发现,我们所有的可预测性结果都是由情绪的前瞻性,未来部分驱动的,而从当前事件中创建的措施对宏观经济变量几乎没有预测能力。这表明我们的措施反映了有关经济基本面的前瞻性新闻。 GiventhatourmeasurepredicturesGDPgrowth,onecouldwonderwhichinputstoGDParepredictedbyoureconomicfeelingmeasure.Weshowthatourmeasureoperationsmainly 通过劳动力渠道而不是资本渠道。它预测了就业,消费和服务,但既不是投资也不是工业生产。同样,我们表明我们衡量经济情绪的指标与实体经济有关,并不预测通货膨胀。 接下来,我们评估基于新闻的经济情绪在商业政策决策中的反映程度。为此,我们量化了情绪在解释联邦基金利率相对于Romer和Romer(2004)提出的前瞻性泰勒规则规范所暗示的变化方面的重要性。我们发现,情绪对关键政策利率有很大影响:过去两个季度情绪下降一个标准差,导致经济衰退期间政策利率下降25个基点(5个基点)。此外,我们发现,即使在控制了事前(通过Tealboo预测衡量)和事后(已实现)GDP增长的预测能力之后,在经济衰退期间,情绪对原始基金利率也具有显着的预测能力。 我们的方法还允许我们在更细粒度的水平上衡量情绪,我们在州一级实施,揭示各州之间显著的横截面异质性。各州之间的共同成分仅驱动约35%的州一级情绪变化。即使在控制了国民情绪以及国家和州GDP增长之后,州一级的情绪也可以预测州GDP的增长。此外,使用各州之间的情绪分散作为异质性的度量,我们发现,在控制了国民情绪和当前国家GDP增长之后,较高的分散预测了较低的国家未来GDP增长。 我们的论文涉及Shapiro,Sdhof和Wilso(2022),他们研究了1980年至2015年期间从经济和金融报纸文章中得出的国家经济情绪时间序列。这个样本期与密歇根州消费者情绪调查的可用性大致吻合。使用与我们不同的方法,作者发现在此期间,他们的情绪度量对消费者情绪具有预测能力。这些情绪冲击会对消费、产出、利率和通胀产生积极的脉冲响应。我们发现我们的情绪指标对工业生产和通货膨胀的预测能力很小,但确实对就业,消费和服务具有重要的预测能力。 该领域最近的另一篇相关论文是Macalay和Sog(2022),研究了2014-2021年样本期内媒体对通货膨胀的描述与消费者情绪之间的关系。这些作者还使用自然语言处理来对比与金融变量相关的通货膨胀新闻和与实际(而不是金融)变量定价相关的通货膨胀。他们将通胀新闻与Twitter的社交网络数据联系起来,发现接触强调通胀与实体经济之间联系的文章会显著降低市场情绪,尤其是在高通胀时期。 我们的论文还涉及研究基本面和/或金融预期扭曲的文献,并评估它们对实际结果的重要性。例如,Maxted(2022)将诊断预期纳入具有金融中介部门的一般均衡宏观经济模型。在他的模型中,情绪与金融摩擦的相互作用会产生短期放大效应,然后产生长期反转效应,他将其称为行为摩擦对金融摩擦的反馈。 Krishnamurthy和Li(2021)在这一领域做出了相关贡献,他们开发了一种金融危机模型,该模型既具有金融放大机制(通过摩擦中介),又具有通过对流动性不足状态的时变信念对情绪的作用。他们认为,情绪渠道对pre-资产价值的危机行为。最后,这个领域的第三个贡献是Hirshleifer,Li和Y(2015),他们将外推偏差引入具有递归偏好的基于生产的标准模型中,并调和了关于商业周期的显着程式化事实(例如:Procedre,相对于产出而言,低消费波动和高投资波动)和金融市场(高股权溢价,波动的股票收益以及低而平稳的无风险利率)具有合理的风险厌恶水平和替代的时间弹性。此外,他们的模型基于股息率、Q和投资捕获了回报可预测性。他们模型的关键驱动因素是,消费外偏差增加了财富-消费比率的变化 ,而财富-消费比率的定价很高。 在递归偏好下,从而有助于解释金融市场效应。 这些贡献构成了与我们论文中发现相关的重要背景。情绪可以通过两个渠道表现出来:贴现率渠道和/或 (预期)现金流渠道。前者通过金融市场运作,在金融市场中,较高的公司估值伴随着较低的折现率(从而降低了未来的回报),