金融工程 专题报告 基金定期报告中的文本语气能否预测未来业绩? ——“学海拾珠”系列之一百�十九 报告日期:2023-09-20 主要观点: 分析师:严佳炜 执业证书号:S0010520070001邮箱:yanjw@hazq.com 联系人:钱静闲 执业证书号:S0010522090002邮箱:qianjx@hazq.com 相关报告 1.《人工智能可以读懂企业高管的想法吗?——“学海拾珠”系列之一百 �十二》 2.《Alpha与风格因子的综合风险评价策略——“学海拾珠”系列之一百 �十三》 3.《信息不确定性、投资者情绪与分析师报告——“学海拾珠”系列之一百�十四》 4.《通胀是否会影响会计信息-股票价格间的相关性?——“学海拾珠”系列之一百�十�》 5.《使用机器学习识别基金经理投资能力——“学海拾珠”系列之一百�十六》 6.《基于隐含波动率和实际波动率的系统风险指标——“学海拾珠”系列之一百�十七》 7.《因子投资中所蕴含的宏观经济风险——“学海拾珠”系列之一百�十八》 本篇是“学海拾珠”系列第一百�十九篇,文献探讨了权益基金定期报告中的文本语气(积极/消极)与基金未来业绩之间的关系。研究发现基金定期报告中的语气能够一定程度预测未来业绩并反映基金经理的选股能力,这一效应主要由积极语气词驱动,而负面语气词影响较小。我们可以扩展进行类似的文本研究,挖掘基金经理在定期报告策略分析与展望部分的更多应用,例如基金投资策略与实际投资的吻合度,基金经理预判市场的准确度等。 定期报告中的语气指标构建 根据证监会要求,公募基金在定期报告中有一个单独部分描述其投 资策略和业绩,以及对宏观经济和证券市场的简要展望,文献提取具体讨论基金业绩和未来经济前景的部分,使用积极词和消极词相对于总词数的百分比差异来衡量基金经理的语气,此外,也追踪了单边的积极词和消极词占比。 基金经理语气对未来业绩有预测效果 具有最积极语气的基金组合的Fama-French三因子alpha比具有 最消极语气的基金组合年化高出约2.4%,在控制往期业绩和其他基金特征后,基金经理的语气对未来业绩的积极预测能力依然十分显著,这种预测能力主要由积极词占比的部分驱动,消极词占比的预测效果不显著。 根据Treynor-Mazuy(TM)模型和Henriksson-Merton(HM)模型将超额基金回报分解为选股能力和择时能力,具有积极语气的基金经理在选股能力方面表现出色。在择时方面,具有不同语气的基金经理之间没有明显的差异。 基金经理语气的影响因素与投资者反应 基金经理的往期语气、基金业绩、规模、费用比率和净资金流入会 对基金经理的语气产生重大影响。投资者会显著增加对具有积极语气的基金的投资,减少对具有负面语气的基金的投资。 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建 议。 敬请参阅末页重要声明及评级说明证券研究报告 正文目录 1简介4 2数据与变量5 2.1基金样本5 2.2定期报告的语气分析5 2.3描述性统计6 3实证结果7 3.1投资组合结果7 3.2回归结果10 3.3通过TM和HM模型揭示基金经理的能力12 3.4基金经理选股能力的进一步分析13 3.5业绩持续性15 4进一步分析17 4.1影响语气的因素17 4.2投资者的反应18 5总结19 风险提示:19 图表目录 图表1词频统计6 图表2描述性统计7 图表3投资不同语气组合的回报8 图表4基金经理语气与未来业绩:投资组合10 图表5基金经理语气与未来业绩:预测回归11 图表6TM和HM模型对基金经理能力的评估12 图表7股票层面-探究基金经理的语气预测能力14 图表8业绩持续性16 图表9基金经理语气的影响因素17 图表10基金经理语气与未来资金流向的关系18 1简介 近年来,许多文献试图解析在共同基金的披露文件中,基金经理的语气所包含的信息内容(Chu和Kim,2019;Du等,2019;Abis等,2021;Hillert等,2021;Sheng等,2022),文献以国内权益基金为研究目标,探究基金经理语气与业绩的关系。 在过去的六年里,中国的公募基金市场规模扩大了三倍,达到了大约3.5万亿美元。市场投资者多为个人投资者,这些非专业投资者可能相对不擅长分析定量数据(Sheng等,2022),并且对基金披露文件等定性信息更为敏感(Hillert等,2021),这可能对市场产生重大影响。 理论上,基金定期报告中的信息是否能够预测未来业绩尚不确定。一些研究认为,基金经理的定期报告提供了与投资者沟通的机会(Hillert等,2021;Abis等,2021;Sheng等,2022)。诚实的基金披露有助于提高基金规模(Hillert等, 2021),详细的基金披露使得规模波动性降低(Abis等,2021)。另一方面,基金报告可能并不包含可靠的信息,因为分析基金业绩和未来市场的内容不能被有效监测,基金经理可能故意使用积极的语言来防止投资者赎回。此外,即使基金经理对未来持有积极看法,也不意味着他们有能力抓住投资机会并获得超额回报 (Treynor,1965;Sharpe,1966;Jensen,1968)。 本文献使用文本分析方法来衡量基金报告的语气(managers’tones)。与美国的共同基金披露要求类似,中国的公募基金受证监会要求,在定期报告中的一个单独部分描述其投资策略和业绩,以及对宏观经济和证券市场的简要展望,提取具体讨论基金业绩和未来经济前景的部分,然后,使用积极词和消极词相对于总词数的百分比差异来衡量基金经理的语气。此外,还使用积极词和消极词相对于总次数的百分比来分别衡量单边积极和消极的语气。 在基础分析中,发现积极语气与未来业绩存在正向关系,语气积极的基金具有 更高的Fama-French三因子α,年化超额回报要比具有消极语气的高出2.4%。其次,通过对基金的三因子α做回归,发现基金经理的语气可以显著预测下个月的α,即使在控制了基金特征后仍然如此。将基金经理的语气分解为单边积极语气和单边消极语气时,发现仅单边积极语气与基金业绩有关,单边消极语气则不相关。 其次,探讨了基金经理语气变化是否反映了他们的能力差异。通过使用两种经典模型,将基金的异常回报分解为选股和市场择时两部分,结果表明具有积极语气的基金经理展现出了更出色的选股技能,而市场择时能力没有明显差异。 为进一步检验基金经理的选股能力差异,按照Jiang和Verardo(2018)的方法构建了股票层面的基金经理语气的测量方法。结果显示,具有积极语气的基金经理持有的股票表现相对出色,在Fama-French三因子模型中比具有消极语气的基金经理持有的股票年化超额回报高约5.1%左右,在经济和统计学中都具有显著意义,表明语气积极的基金经理具有更好的选股能力。还跟踪了基金投资组合的业绩,发现这种业绩差距持续存在,即使持有期延长到24个月,这表明基金经理的语气与业绩之间的联系不是偶然的。 最后,为了加深对基金语气的理解,也研究了影响基金经理语气的因素,发现当前报告中的语气受到过去报告中的语气、当前和往期基金业绩、以及基金规模、 费用和净流量等因素的影响。其次,探讨了投资者对基金经理语气的反应,结果显示,投资者显著增加了对积极语气的基金的投资,减少了对消极语气的基金的投资。投资者更可能是受到对积极语气的喜好和对消极语气的厌恶的影响,而不是对语气 对未来业绩的预测能力的发现。 2数据与变量 2.1基金样本 此研究样本包括来自WIND数据库中的公募权益基金,时间跨度为2011年1月至2021年6月。从WIND数据库中获取基金月度回报数据,基金的特征信息则来自于中国股票市场与会计研究(CSMAR)数据库,包括基金规模、成立年限、换手率、费率以及净资金流入等数据。剔除以下样本:(1)指数基金,(2)有不同份额类别的基金,(3)成立时间不足12个月的基金,(4)关键变量数据缺失的基 金。最终研究样本包括了1053只基金。 2.2定期报告的语气分析 从CNINFO(中国证券监督管理委员会指定的财务报告披露数据库)下载了这些共同基金的定期报告,包括年度报告、半年度报告和季度报告。证监会在2004年发布了具体指南,规范了共同基金的信息披露要求。根据这些指南,基金经理需要在报告中描述他们对宏观经济、证券市场、行业趋势、基金业绩以及投资策略的看法,但不允许详细讨论特定证券的预期或持仓情况。然而,我们注意到,尽管对宏观事件的共识可能相似,不同基金经理的语气存在显著差异。这种多样性可能源于两个方面:一方面,即使在面对相同宏观事件时,不同基金经理可能表达不同的语气;另一方面,在相同经济和行业条件下,基金经理可能关注不同的宏观事件,因此他们的语气也会有所不同。 将下载的PDF格式报告转换为文本格式,并提取报告中描述基金经理对宏观经济、证券市场、行业趋势、基金业绩以及投资策略看法的部分来进行定期报告的语气分析。 使用Python中的JieBa库(用于中文分词的Python模块)将文本分割为词语与词语计数的格式。基于Yao等人(2021)编撰的中国金融情感词典,Yao等人使用机器学习方法调整DLUTSD、HOWNET、清华情感词典(三个通用的汉语情感词典),以及Loughran和McDonald(2011)字典的中文翻译,获得中文的金融情感词典。 基于词典构建了积极和消极词汇表,计算在定期报告中出现的积极和消极词汇的数量,语气指标的构建方式如下: 其中,𝑃𝑜𝑠𝑖𝑡𝑖𝑣�𝑊𝑜𝑟𝑑�𝑁𝑢𝑚𝑏𝑒𝑟𝑖,𝑡,𝑁𝑒𝑔𝑎𝑡𝑖𝑣�𝑊𝑜𝑟𝑑�𝑁𝑢𝑚𝑏𝑒𝑟𝑖,�和 𝑇𝑜𝑡𝑎�𝑊𝑜𝑟𝑑�𝑁𝑚𝑏𝑒𝑟𝑖,�分别表示基金�在时期�中积极词汇的数量、消极词汇的数量和总词汇数量。通过这些变量,计算了一个综合的语气指标,即净积极语气 𝑷𝒐�−𝑵𝒆�𝑻𝒐𝒏𝒆𝒊,𝒕,该指标是由积极词汇数量减去消极词汇数量,再除以总词汇数量得到的。较大的净积极语气值表示报告整体语气更积极。𝑃𝑜�𝑇𝑜𝑛𝑒𝑖,�等于积极 词汇数量除以总词汇数量,代表报告中的单向积极语气。𝑁𝑒�𝑇𝑜𝑛𝑒𝑖,�等于消极词汇数量除以总词汇数量,代表报告中的单向消极语气。 2.3描述性统计 图表1列出了出现率最高的20个积极(消极)词汇,以及它们的英文翻译, 并按照它们在报告中出现的频率进行排列。结果显示,出现率前20的积极词汇占所有积极词汇的约40%,而出现率前20的消极词汇占所有消极词汇的约63%。所有这些排名靠前的词汇反映了基金经理的积极或消极情感,例如“增长”、“优质”和“提升”表示积极情感,而“风险”、“下降”和“放缓”表示消极情感。值得注意的是,Loughran和McDonald(2011)发表的金融情感词典包含了其中超过60%的英文对应词汇,表明此处的词汇表与经典的金融情感词典是可比的。 图表2面板A列出了每年包含在样本中的基金数量。基金数量逐年增长,样本中的平均基金每月回报率为1.7%,成立时间为4年,规模为19.3449亿元人民币,年度费用率为3.9%,每季度吸引1.6%的净资金流入。面板C列出了从定期报告中 提取的内容以及语气测量变量的描述性统计数据。从报告中提取的内容平均有241 个词,其中包含29个积极词汇和11个消极词汇。平均𝑃𝑜�−𝑁𝑒�𝑇𝑜𝑛�值为0.076。 平均𝑃𝑜�𝑇𝑜𝑛�值为0.118,意味着报告中有11.8%的词汇是积极的。平均𝑁𝑒� 𝑇𝑜𝑛�值为0.042,意味着报告中有4.2%的词汇是消极的。总体而言,积极词汇多于消极词汇,表明报告总体上具有积极的语气。 图表1词频统计 资料来源:《Dofundmanagers'tonespredictfutureperformance?EvidencefromChina》,