
主要观点: 执业证书号:S0010520070001邮箱:yanjw@hazq.com 分析师:吴正宇执业证书号:S0010522090001邮箱:wuzy@hazq.com ⚫MD&A部分的长度与公司未来盈余呈负相关 与更复杂的情绪模型相比,管理层讨论与分析(MD&A)或风险因素(RF)章节的词汇长度能够更好地预测未来公司的表现。实证发现,具有较低的MD&A长度的公司显著优于具有较高MD&A长度的公司。 ⚫词袋模型无法从过去公告中“学习”预测未来盈余 文章实证表明,通过训练机器学习算法的词袋模型无法识别未来的积极或消极的盈余惊喜。作者认为传统的NLP方法失败的部分原因是公司公告日益增加的长度和复杂性。 相关报告 1.《动量、反转和基金经理过度自信——“学海拾珠”系列之一百四十四》 ⚫经过财务目标训练LLM模型可以有效预测未来盈余 2.《股票因子个性化:基于股票嵌入的因子优化——“学海拾珠”系列之一百四十五》 依据下个季度的预期盈余惊喜,在月底分为五组投资组合。经过财务目标训练的LLM模型在所有的多空投资组合策略都具有经济和统计上的显著并且预测盈余符号正确,显著优于情绪模型和词袋模型。 3.《盈余公告披露的现象、方法和目的——“学海拾珠”系列之一百四十六》 ⚫风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 4.《基金抛售资产时的选择性偏差——“学海拾珠”系列之一百四十七》 5.《投资者情绪能预测规模溢价吗?——“学海拾珠”系列之一百四十八》 6.《基于强化学习和障碍函数的自适应风险管理在组合优化中的应用——“学海拾珠”系列之一百四十九》 7.《运用少量ETF可以复制主动基金的业绩吗?——“学海拾珠”系列之一百五十》 8.《A股流动性、波动性及其溢出效应——“学海拾珠”系列之一百五十一》 正文目录 1引言........................................................................................................................................................................................................42数据........................................................................................................................................................................................................73NLP方法................................................................................................................................................................................................93.1词汇(情感-得分)方法..............................................................................................................................................................93.2词袋模型.....................................................................................................................................................................................103.2.1基本机器学习方法..........................................................................................................................................103.2.2线性回归...........................................................................................................................................................103.2.3LM回归.............................................................................................................................................................103.2.4惩罚线性回归..................................................................................................................................................103.2.5梯度提升回归树和随机森林模型.................................................................................................................113.2.6支持向量回归..................................................................................................................................................113.2.7前馈神经网络..................................................................................................................................................113.2.8模型微调...........................................................................................................................................................123.3大型语言模型(LLM):层次转换器方法..........................................................................................................................123.3.1输入编码...........................................................................................................................................................143.3.2BERT层............................................................................................................................................................143.3.3Transformer层...............................................................................................................................................143.3.4池化层...............................................................................................................................................................153.3.5线性预测器.......................................................................................................................................................153.3.6预测目标与损失函数......................................................................................................................................154实证分析:模型绩效比较...............................................................................................................................................................164.1投资组合分类.............................................................................................................................................................................174.1.1动态跨期投资组合绩效..................................................................................................................................214.2预测股票回报:线性回归法....................................................................................................................................................214.3事件研究回归:盈余公告........................................................................................................................................................225结论........