-- 情感分析是自然语言处理(NLP)的一个重要分支,在金融领域,情感分析在金融论坛评论上的分析有重要应用,因为金融论坛的情绪很大程度上反映了投资者的集体心态,投资者的心态、预期和信心可以对股票价格产生重大影响。 本报告采用子长科技提供的金融论坛股民情绪数据。子长科技基于公开社交媒体信息,包括股民及股市大V的各类言论,结合公司,行业,产品,相关技术等数据,运用AI知识模型LKM,准确将股民情绪关联及定位到相关股票。并根据情绪表达,产生实时的量化情绪分数及统计信息。 2018年1月1日至2023年6月30日,子长科技跟踪的金融论坛一共有超过1300万条主帖数据和超过480万条评论 数据,每周平均可对应沪深300中超过260只股票。金融论坛数据有多样性和高度情绪化、信噪比低、随事件波动和受到特定类型评论影响等特征。主帖数据与评论数据在情感表达方面有明显区别。 在定位到相关股票的金融论坛数据之上本篇报告通过FinGPT其进行了情感分析,通过验证论坛情感与股票价格之间的关系探索了大语言模型模情感分析在量化策略上的直接应用。 FinGPT是由AI4Finance-Foundation开发的一个开源项目,专注于金融领域的大型语言模型,其“V3.1”版本是在中 文能力较强的ChatGLM-6B基础上进行LoRA微调训练而来,FinGPT在情感打分任务上相比ChatGLM-6B又有进一步的提升。FinGPT优秀的中文能力和情感分析能力都很适合在金融论坛评论之上进行应用。 情感打分体系主要包含三个方面,情感表达、情感分歧与情感变化。利用大语言模型进行情感分析,我们能准确地识别和量化每一条评论中的正面、负面或中立情感,为每位投资者的发言赋予一个情感得分。 从打分体系的因子测试结果看,投资者对某只股票情感越乐观情况下,该只股票更有可能获得超额收益。其中乐观情 感和因子单因子IC达到3.68%,分位数组合单调性良好,多空组合年化收益率为12.71%,多空净值增加平稳,是有效评价情感与选股的指标。 大模型舆情情感因子与基本面因子相关性低,而情感和因子与市值相关性为0.55但是区别于市值因子其为降序因子, 能够证明金融论坛评论情感分析是独立于基本面的另类有效选股指标。 我们以乐观情感总和因子构建大模型金融论坛舆情增强策略。每一期选择因子排名最靠前的20%的股票等权构造策略组合。策略为月频调仓,在千分之三的手续费下策略年化收益率为6.69%,夏普比率为0.32,策略的超额年化收益率为8.02%,信息比率为1.58,策略的超额最大回撤仅为6.94%。金融论坛评论确实带来了额外增量信息。 以上结果通过历史数据统计、建模和测算完成,历史规律未来可能存在失效;大语言模型基于上下文预测进行回答,不能保证回答准确性。 内容目录 一、另类数据情感分析的新方法5 二、金融论坛评论的数据特征5 2.1数据来源5 2.2什么是LKM(LargeKnowledgeModel)5 2.3论坛的主帖和评论的区别7 三、大语言开源模型落地8 3.1利用大语言模型进行情感分析8 3.1.1大模型强大的语言理解和更好的泛化能力8 3.1.2GPT情感分析效果最佳,但成本过于高昂9 3.2本地化部署的开源模型9 3.2.1开源模型9 3.2.2ChatGLM与FinGPT10 四、情绪打分体系构建11 4.1因子测试方法12 4.2为什么要选择金融论坛评论数据12 4.3大模型舆情情感因子13 4.4因子相关性与因子收益15 五、大模型金融论坛舆情增强策略16 5.1策略构建16 5.2策略表现16 六、总结18 七、附录18 7.1FinGPT的推理代码样例18 7.2推演的算力需求与微调的算力需求18 7.3模型输入的“参数敏感性”19 风险提示21 图表目录 图表1:LKM知识模型的核心5 图表2:大知识模型的模型构建流程6 图表3:LKM的情感打分优势6 图表4:LLM与LKM的推导区别7 图表5:人工智能的发展周期7 图表6:金融论坛主帖与评论的区别8 图表7:自回归语言模型的输出步骤9 图表8:HELM大语言模型情感分析排行榜9 图表9:ChatGPT情感分析得分比较9 图表10:ChatGPTAPI调用价格9 图表11:开源LLM时间线10 图表12:ChatGLM的英文能力10 图表13:ChatGLM的中文能力10 图表14:FinGPT架构11 图表15:FinGPT在情感打分任务上表现优异11 图表16:国金金工股票情感打分体系12 图表17:主帖内容示例12 图表18:金融论坛评论的不同类型样例12 图表19:主帖与评论相同构造情感因子的IC测试统计指标13 图表20:评论数量分布13 图表21:评论数最多的20只股票13 图表22:评论的FinGPT情感打分分布13 图表23:评论的LKM情感打分分布13 图表24:大模型舆情情感因子含义与计算14 图表25:大模型舆情情感因子IC测试统计结果14 图表26:乐观情感和因子分位数组合测试统计指标15 图表27:乐观情感和因子分位数组合年化收益率15 图表28:乐观情感和因子分位数组合净值曲线15 图表29:大模型舆情情感因子与大类因子相关性15 图表30:情感因子与市值因子相关性16 图表31:常见基本面与技术因子的IC测试16 图表32:大模型金融论坛舆情增强策略条件设置16 图表33:大模型金融论坛舆情增强策略指标17 图表34:大模型金融论坛舆情增强策略分年度收益17 图表35:大模型金融论坛舆情增强策略净值曲线17 图表36:FinGPT的推理demo18 图表37:大语言模型训练的硬件与训练时间19 图表38:没有任何input结构的LLaMA2输出19 图表39:Alpaca-input结构下的LLaMA2输出19 图表40:财联社新闻标题20 图表41:不同提示词20 图表42:不同提示词下博迁新材新闻的情感分析20 图表43:不同提示词下酱香咖啡新闻的情感分析21 情感分析是自然语言处理(NLP)的一个重要分支,通过运用NLP技术和机器学习算法,可以对文本的语义、情感表达和上下文进行分析,判断文本所表达的情感,从而得出文本的情绪例如正面、负面或中立的结论。在金融领域,情感分析在金融论坛评论上的分析有重要应用,因为金融论坛的情绪很大程度上反映了投资者的集体心态,投资者的心态、预期和信心可以对股票价格产生重大影响。 我们从多个学术假设和结论拆解了情绪对股票价格产生影响的背后逻辑: 情绪与决策制定:投资者在决定买卖股票时,除了基于对公司基本面和技术分析的认知,还会受到其他投资者情绪的影响。乐观情绪往往促使投资者采取积极的投资行为,而消极情绪可能导致他们采取保守或逃避策略。 从众心理:当大部分投资者在论坛上显示乐观情绪时,其他投资者可能会受到影响,从而产生相同的投资决策,导致股价上涨。相反,当论坛上的情绪普遍不乐观时,股价可能会受到压力并下跌。 信息扩散:金融论坛通常是投资者获取和分享信息的平台。这些信息,无论其真实性如何,都可能引起市场反应。如果论坛上传播的信息让投资者感到乐观,股价可能上涨;相反,如果信息是消极的,股价可能会下跌。 注意力偏差:当某个特定的股票或事件在论坛上被大量讨论,这会导致更多的投资者将注意力集中在这个话题上,或者由于注意力偏差,投资者可能会过于专注于论坛上热门的话题,而忽视其他同样重要但未被广泛讨论的信息。这可能会导致投资者做出基于不完整信息的决策,强化了情绪反应或者忽视了其他重要信息。 本篇报告是Alpha掘金系列的第八篇,我们通过开源的大语言模型FinGPT对子长科技公司提供的大量金融论坛评论进行了情感分析,通过验证论坛情感与股票价格之间的关系探索了大语言模型模和大知识模型情感分析在量化策略上的直接应用。 2.1数据来源 子长科技创建于2018年,创始团队包括前路透社,亚马逊,谷歌等人工智能及金融数据专家。公司创立以来,以包括知识图谱和自然语言处理的知识模型LKM为核心技术,始终致力于打造垂直金融行业的人工智能核心能力,推出多款数据及金融终端产品,有效服务投研、量化和风控等多个场景。 本报告采用子长科技提供的金融论坛股民情绪数据。子长科技基于公开社交媒体信息,包括股民及股市大V的各类言论,结合公司,行业,产品,相关技术等数据,运用AI知识模型LKM,准确将股民情绪关联及定位到相关股票。并根据情绪表达,产生实时的量化情绪分数,及统计信息。从而充分体现个股的股民情绪,关注变化,捕捉市场信号。 基于知识模型LKM体系的数据,具有精准,实时,可溯源等优势。通过知识模型,AI准确进行实体对齐,将股民评论精准定位到相关股票,准确产生情绪数据。效果远超于基于情绪关键词的上一代技术。 图表1:LKM知识模型的核心 来源:子长科技,国金证券研究所 2.2什么是LKM(LargeKnowledgeModel) 对于金融论坛评论数据而言,自然语言处理的难点之一在于如何确认股票与评论之间的联 系,一方面,股票的代称可能会复杂,完全通过人工维护的方式是困难的,例如“宁德时代”对应“宁王”;另一方面,评论中可能完全没有提到股票的名字。而LKM大知识模型可以通过不断地评论学习学会这样地代称和复杂对应逻辑,能够更好得完成评论对应上市公司的标注。进一步地,因为大知识模型“学到”的知识不仅限于上市公司,在另类数据拆解产业链上下游信息、寻找非线性景气度关系时都有重要应用。 图表2:大知识模型的模型构建流程 来源:子长科技,国金证券研究所 从技术路线上来说,LKM属于决策智能,LLM属于生成型人工智能。 生成型人工智能(GenerativeAI)主要用于生成新的、未见过的数据或内容,如图像、文本或音乐。它的核心目标是学习和模拟特定数据集的分布。其可以进行创作(例如画作、音乐、文本、代码)、数据增强、模拟和虚拟现实内容生成等。常见的技术包括生成对抗网络(GANs)、变分自编码器(VAEs)和特定的深度学习架构如Transformer(ChatGPT采用)。主要解决的是“如何从现有的数据中学习并生成新的、相似但独特的内容”。 决策智能(DecisionIntelligence)是一个跨学科的领域,目标是帮助组织或个人做出更有根据和更好的决策。它结合了决策科学、人工智能和数学建模等领域的知识。其可以优化业务流程、增强策略决策、提高资源分配的效率、预测和风险评估和供应链管理等。常见的技术包括决策树、优化算法、模拟、风险分析、复杂的系统建模等。主要解决的是“如何结合多种数据和知识源来做出最佳或最有根据的决策”。 在金融领域,如将股票与金融评论进行映射,当需要高度的可解释性、实时反馈以及从系统整体视角进行考量时,决策智能会是一个更为合适的选择。决策智能不仅提供了对数据的深入分析,还允许我们理解背后的决策逻辑和推理过程。实时反馈能够确保我们迅速地应对变化,调整策略,而从系统视角考虑则意味着我们不仅关注局部的最优解,而是寻求整体的最佳方案。这种综合性的分析和全局视野有助于制定更为全面、均衡和持久的决策策略。 图表3:LKM的情感打分优势 来源:子长科技,国金证券研究所 在另类数据情感打分能力上,LLM与LKM各有优劣,LLM解释性差但是拥有令人惊讶的0 样本和少样本的分析能力,LKM解释性强并且能够通过全局视角进行实时反馈,但其对数据的质量要求会更高。 图表4:LLM与LKM的推导区别 来源:子长科技,国金证券研究所 图表5:人工智能的发展周期 来源:Gartner,子长科技,国金证券研究所 2.3论坛的主帖和评论的区别 金融论坛的数据主要可以分为两种类型,主帖和评论。两者数据主要有以下共同特征: 信噪比低:由于每个人都可以发表意见,结果不一定都是基于事实或深入的分析,会出现很多“无关评论”、“段子评论”等。 随事件波动:特定的金融事件或新闻可能引发大量的帖子和情感反应,如股市大涨或大跌、 重大并购