您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:CTA金点子系列之一:基于ChatGPT新闻情感分析的原油期货策略 - 发现报告
当前位置:首页/其他报告/报告详情/

CTA金点子系列之一:基于ChatGPT新闻情感分析的原油期货策略

2023-06-02高智威国金证券自***
CTA金点子系列之一:基于ChatGPT新闻情感分析的原油期货策略

NLP在金融领域的应用 情感分析在金融领域具有重要的应用,在这一领域中,ChatGPT超越了其他传统情感分析方法,往往能够提供更准确的预测结果。本篇报告通过ChatGPT对OPEC官方发布的新闻进行情感分析,通过验证OPEC新闻与原油期货价格之间的关系探索了ChatGPT的情感分析效果。 不同模型的情感分析方法 使用传统的NLP模型“SentimentIntensityAnalyzer”,从事件驱动的角度看,评分较高的新闻发布前后60个交易日内收益率并未明显高于评分较低的新闻的对应收益率。新闻的事件驱动收益不明显,模型打分无法细节区分新闻情绪,分析效果存在一定局限性。 “GPT-3.5-turbo”模型情绪打分效果明显更优,模型能够根据输入文本生成高质量的输出,并且可以理解复杂的意图、因果关系。模型的情绪打分有了明显区分度,在比较滞后的日频维度与滞后较少的分钟维度,打分超过10次的新闻单调性均良好,最高情绪打分的新闻事件可能获得较好的超额收益。 应用ChatGPTAPI时,用户输入的参数不同,模型对角色的识别和分类、对不同角色所需回答的分析和生成也是不同的。我们详细测试了各关键参数的敏感性,角色参数最直接对结果造成影响,甚至会出现不同角色相反结论;Temperature参数与Top_p参数共同控制结果的随机性,我们应该根据不同的分析目标设定Temperature参数与Top_p参数,当需要“创意“结果时,可以相应设定更高的自由度,但为了保持新闻事件分析结果的严谨性,我们在新闻事件情感分析时应该给与模型尽量少的自由度,检验设置的参数建议为0。不同Top_p参数下模型输出结果相对平稳;不同Temperature参数下模型结果波动较大。 ChatGPT-4在fewshot和zeroshot上的结果表现上进一步提升了,ChatGPT4在逻辑分析和内容解读上均有明显进步。但是ChatGPT4无法通过对话的方式去设置Temperature和Top_p参数,无法按照ChatGPT3.5API调用的方式保证情绪分析输出结果的稳定性,输入相同内容得到的情绪打分分数会出现明显波动,这导致我们还无法将ChatGPT4直接应用于情感分析打分的相关金融策略。 GPT情感分析驱动策略 情感分析驱动的CTA策略是一种较新颖的交易策略,它结合了情感分析和传统的CTA策略。大语言模型的发展提供的更加准确的分析结果使此策略有更多的应用空间,结合此前我们对OPEC新闻的分析打分结果,我们构建了GPT情感分析驱动策略。 策略具体规则为新闻事件发生且情感分析打分大于等于0.7,进行买入;新闻事件发生且情感分析打分小于0,进行卖空。当价格偏离2倍ATR时进行平仓。策略的年化收益率为22.72%,策略最大回撤为14.22%。 对比buyandhold和随机信号的策略结果来区分是新闻情绪信号带来的收益还是因为期货本身的波动带来的收益。在新闻出现的相同时间点,我们生成三组随机情感分数,第一组为0到1的随机数,第二组为-1到1的随机数,第三组为与GPT打分同均值方差分布的随机数。在相同的开平仓规则下GPT情感分析驱动策略显著跑赢各类随机信号策略,也显著跑赢buyandhold策略,结果证明新闻情绪信号确实能带来明显的增量信息。 风险提示 以上结果通过历史数据统计、建模和测算完成,历史规律未来可能存在失效的风险。 内容目录 内容目录2 图表目录2 一、NLP在金融领域的应用4 二、OPEC新闻的情感分析4 2.1NLP技术发展迅速,ChatGPT模型降低量化情感分析成本4 2.2OPEC新闻来源5 2.3OPEC新闻词云分析6 2.4原油期货的国际定价7 三、不同模型的情感分析方法7 3.1“SentimentIntensityAnalyzer”模型8 3.2“GPT-3.5-turbo”模型9 3.2.1模型介绍9 3.2.1“GPT-3.5-turbo”模型参数的情感分析结果10 3.2.1.1思维链与提示词10 3.2.1.2模型输出结果10 3.2.1.3分钟级的事件驱动收益13 3.2.2“GPT-3.5-turbo”模型的参数敏感度14 3.2.2.1角色参数敏感度14 3.2.2.2Temperature和Top_p的参数敏感度16 3.2.2.3不同提示词的参数敏感度19 3.3ChatGPT4情感打分与插件的使用20 3.3.1ChatGPT4情感打分的进步与问题20 3.3.2ChatGPT4插件在情感打分领域的应用21 四、GPT情感分析驱动策略22 4.1GPT情感分析驱动策略22 4.2事件驱动策略的收益来源24 五、总结25 风险提示25 图表目录 图表1:ChatGPT模型架构与微调训练方式图5 图表2:新闻发布数量5 图表3:新闻事件在事件序列上的分布5 图表4:新闻类型和分布6 图表5:2023年4月3日的新闻示例6 图表6:OPEC新闻的词云统计7 图表7:各交易所原油期货价格(美元/桶)7 图表8:“SentimentIntensityAnalyzer”模型情感评分8 图表9:“SentimentIntensityAnalyzer”模型打分分类8 图表10:“SentimentIntensityAnalyzer”模型不同打分的事件驱动收益8 图表11:SentimentIntensityAnalyzer”模型不同打分的5个交易日内事件驱动收益9 图表12:OpenAI对ChatGPT-3模型的对比描述10 图表13:GPT-3.5-turbo”模型参数名称及解释11 图表14:“GPT-3.5-turbo”模型参数设置11 图表15:“GPT-3.5-turbo”模型输入参数设置11 图表16:“GPT-3.5-turbo”模型情感评分12 图表17:“GPT-3.5-turbo”模型情感评分分布12 图表18:“GPT-3.5-turbo”模型不同打分的事件驱动收益12 图表19:情绪得分超过10次的事件5个交易日驱动收益12 图表20:分钟级的OPEC新闻事件驱动收益13 图表21:分钟级的OPEC新闻事件驱动收益的单调性14 图表22:“GPT-3.5-turbo”模型情感评分分布14 图表23:角色参数15 图表24:不同角色设定的情感打分15 图表25:新闻具体内容16 图表26:乱码结果示例17 图表27:Temperature参数的参数敏感性17 图表28:Top_p参数的参数敏感性18 图表29:不同“Temperature”重复训练20次(Top_p=1)18 图表30:不同“Top_p”重复训练20次(Temperature=1)18 图表31:网页对话时模型所用参数19 图表32:“GPT-3.5-turbo”模型输入参数设置19 图表33:GPT模型逻辑理解的强大分析能力19 图表34:“GPT-3.5-turbo”模型逻辑评分分数分布20 图表35:“GPT-3.5-turbo”模型逻辑评分各分数数量20 图表36:不同模型fewshot的学习能力20 图表37:不同模型zeroshot的学习能力20 图表38:新闻事件分析结果20 图表39:连接互联网后ChatGPT4的情感打分应用21 图表40:GPT情感分析驱动策略所用参数23 图表41:GPT情感分析驱动策略交易规则与收益23 图表42:GPT情感分析驱动策略指标23 图表43:GPT情感分析驱动策略净值24 图表44:不同策略净值对比24 一、NLP在金融领域的应用 情感分析在金融领域具有重要的应用,特别是在市场调研、舆情监控和社交媒体分析等方面。通过对金融新闻、社交媒体帖子和其他文本数据进行情感分析,可以帮助分析师和投资者更好地理解市场情绪和舆论趋势,从而做出更准确的决策。 情感分析是自然语言处理(NLP)的一个重要分支,它通过运用NLP技术和机器学习算法,对文本的语义、情感表达和上下文进行分析,从而判断文本所表达的情感,得出文本的情绪结论例如正面、负面或中立。在金融领域,我们可以情感分析的方法来探究新闻事件和投资回报之间的关系。在这一领域中,ChatGPT超越了其他传统情感分析方法,能够提供更准确的预测结果。目前,金融领域的NLP正处于发展阶段,该行业本身具有高度的专业性,其中许多金融术语在金融背景下具有独特的含义。每个子问题都有其独特的解读方式,金融行业对处理结果的评估方法也与其他领域不同。此外,事件对金融资产价格的影响逻辑可能会随着市场环境的不同而发生变化,资产价格还受到交易行为 (如反应不足或反应过度)的干扰。 本篇报告是CTA创金渐进系列的第一篇,我们通过ChatGPT对OPEC官方发布的新闻进行情感分析,通过验证OPEC新闻与原油期货价格之间的关系探索了ChatGPT的情感解读效果。 二、OPEC新闻的情感分析 2.1NLP技术发展迅速,ChatGPT模型降低量化情感分析成本 自然语言处理(NaturalLanguageProcessing,简称NLP)是计算机科学、人工智能 (AI)和语言学交叉领域的一部分。它主要关注如何使计算机能够理解、解释和生成人类语言。NLP已经成为人工智能领域的关键组成部分,涉及到许多不同的任务,包括机器翻译、情感分析、自动文摘、问答系统、对话系统等。 NLP的起源可以追溯到20世纪50年代,当时研究人员开始尝试开发机器翻译系统。随着计算能力的提高和大量文本数据的可用性,NLP领域取得了显著的进展。在过去的几十年里,我们已经从基于规则和基于统计的方法转向了基于深度学习的方法。 深度学习在NLP领域的突破性进展,主要归功于神经网络的发展,特别是循环神经网络 (RNN)、长短时记忆网络(LSTM)和门控循环单元(GRU)。这些网络结构能够捕捉文本数据中的长期依赖关系,使得NLP任务的性能得到显著提高。 21世纪以来NLP发展的核心技术进步迅速,分别有Neurallanguagemodels(神经语言模型,2001),Multi-tasklearning(多任务学习,2008),Wordembeddings(词嵌入,2013),NeuralnetworksforNLP(NLP神经网络,2013),Sequence-to-sequencemodels(序列到序列模型,2014),Attention(注意力机制,2015),Memory-basednetworks(基于记忆的网络,2015),Pretrainedlanguagemodels(预训练语言模型,2018)。2018年至今,预训练的语言模型如BERT(BidirectionalEncoderRepresentationsfromTransformers)、GPT(GenerativePre-trainedTransformer)已经在NLP任务中取得了令人瞩目的成绩。这些模型通过预训练和微调阶段的组合,可以在各种NLP任务中实现高性能。 ChatGPT作为一个面向对话任务的通用语言模型,拥有出色的中英文文本情感判断能力,具有识别文本复杂、隐含情感倾向的能力。ChatGPT在zero-shot(零样本学习)和few-shot(小样本学习)方面表现出它强大的性能,相对于其他基于词典法构建的金融领域NPL模型,ChatGPT无需专门构建和重新训练,可以直接应用于金融文本的情感分析,能够有效降低成本。 图表1:ChatGPT模型架构与微调训练方式图 来源:《Improvinglanguageunderstandingbygenerativepre-training》,国金证券研究所 ChatGPT在预训练中采用无监督学习,通过Transformer结构对语言的通用表示进行学习。左侧的Transformer结构实际上共包括12个解码器和编码器,其中解码器用于对单词的语义和所处句子内位置的信息进行解码,并通过多头注意力机制对信息进行加权,获取上文信息,最终得到由向量构成的语义编码信息;解码