证券分析师 金融工程专题 了解GPT:投资篇 ——德邦金工文献精译第十三期 肖承志 资格编号:S0120521080003 邮箱:xiaocz@tebon.com.cn 研究助理 相关研究 1.《了解GPT:应用篇——德邦金工文献精译第十二期》2023.07.25 2.《了解GPT:训练篇——德邦金工文献精译第十一期》2023.06.29 3.《ChatGPT能够预测股票价格的走势吗?收益可预测性和大型语言模型 ——德邦金工文献精译第十期》 2023.04.22 4.《训练语言模型以遵循带有人类反馈的指令——德邦金工文献精译第八期》2023.03.16 证券研究报告|金融工程专题 深度报告 2023年08月19日 投资要点: 《了解GPT:投资篇》在训练篇和应用篇的基础上,梳理了目前大模型重点解决“投资”问题的研究进展和方式方法。大语言模型在金融领域也有着广泛的应用潜力,例如分析财经新闻、预测股票走势、生成投资建议等。我们从以下四个方面进 行介绍: ChatGPT构建投资策略的学术论文:我们介绍了4篇使用ChatGPT探索金融投资策略构建方法的论文。目前学术界的研究已使用多种方式将ChatGPT融入到生成因子、交易信号等构建量化策略的环节中,发挥在投资领域应用大模型的想象 空间。我们从中找到了一些共通点和使用技巧,但如何更有效的发挥大模型的潜力,提高模型表现,仍需要进一步的深入研究。 金融大模型:我们介绍了BloombergGPT、FinGPT、AlphaBox、FinVis-GPT等金融大模型项目,针对不同的金融场景和需求提供了独特的功能和服务。目前, FinGPT是最火爆的支持情感分析、量化交易、金融问答等领域任务的开源大模型环境,FinVis-GPT是新颖的识别K线图给出投资建议的金融大模型。部分国内企业已经在金融大模型上有所布局,凭借其在数据和技术积累方面的多重优势,能够为金融机构提供个性化、全面化的服务,具备应用前景和发展潜力。 ChatGPTPlugins投资插件:截至2023年8月11日,ChatGPTPlugins平台共计817款插件,我们统计其中24款具有供投资相关功能服务的插件。这些插件可用于获取投资组合建议、分析股票新闻情绪、优化投资者组合等功能。其中,我 们认为AFinChat是最具有使用价值的插件,可以被用来分析A股新闻和行情数据。 OpenAI代码解释器:OpenAI代码解释器于2023年7月向ChatGPTPlus会员开放,提供基于python语言处理用户自定义数据,具备数据分析、作图等功能。由于算力有限,OpenAI并未提供可自定义下载的python库,数据较大时存在运 行崩溃的问题,因此目前只能进行简单的数据分析等应用。对投资问题,我们测试了单因子检验、股权激励数据分析、ETF投资组合配置3个案例,代码解释器均取得了良好的表现,能够清晰准确地完成用户的要求并阐述其解决思路,并能够在代码报错的情况下进行自主调试。 大型语言模型在金融投资领域应用是一个有前景但也有难度的课题,需要多学科的合作和创新。大型语言模型面临的挑战包括如何有效地结合多模态数据(如股价、新闻、社交媒体等)、如何提高模型的可解释性和可信度、如何防止模型的滥 用和误用等。相信随着更多的研究、算力和插件能力的提升,将更大程度发挥LLM 的能力,对解决更复杂的问题有质的提升。 风险提示:数据不完备和滥用风险,信息安全风险,算法伦理风险 请务必阅读正文之后的信息披露和法律声明 内容目录 1.借助大模型解决投资问题6 2.应用ChatGPT构建投资策略的论文6 2.1.大语言模型可以预测股价A股走势吗?更大参数的模型效果一定更优吗? Erlangshen-RoBERTa-110M-Sentiment模型的情感分析能力强于ChatGPT6 2.2.新视角:结合图神经网络和ChatGPT预测股票走势8 2.3.结合股价和推特文本数据供ChatGPT预测涨跌10 2.4.第二版:ChatGPT能够预测股票价格的走势吗?收益可预测性和大型语言模型132.5.小结14 3.金融大模型15 3.1.BloomBergGPT15 3.2.FinGPT16 3.3.AlphaBox17 3.4.MINDSHOW18 3.5.无涯Infinity18 3.6.轩辕19 3.7.FinVis-GPT20 4.ChatGPTPlugins与投资有关的插件21 5.OpenAI代码解释器23 5.1.单因子检验23 5.2.股权激励分析25 5.3.投资组合构建26 6.总结29 7.参考文献30 8.风险提示30 信息披露31 图表目录 图1:"UnveilingthePotentialofSentiment:CanLargeLanguageModelsPredictChineseStockPriceMovements?”文章的数据来源7 图2:"UnveilingthePotentialofSentiment:CanLargeLanguageModelsPredictChineseStockPriceMovements?”文章的提示词设计和回答样例7 图3:"UnveilingthePotentialofSentiment:CanLargeLanguageModelsPredictChineseStockPriceMovements?”文章的3种不同大语言模型策略相对沪深300超额净值8 图4:"UnveilingthePotentialofSentiment:CanLargeLanguageModelsPredictChineseStockPriceMovements?”文章的Erlangshen因子分3组回测相对沪深300超额收益率8 图5:"UnveilingthePotentialofSentiment:CanLargeLanguageModelsPredictChineseStockPriceMovements?”文章的三种不同大语言模型策略回测结果统计8 图6:"UnveilingthePotentialofSentiment:CanLargeLanguageModelsPredictChineseStockPriceMovements?”文章的3种不同大语言模型策略的日均持股数量和换手率8 图7:"ChatGPTInformedGraphNeuralNetworkforStockMovementPrediction”文章的模型框架9 图8:"ChatGPTInformedGraphNeuralNetworkforStockMovementPrediction”文章的提示词设计9 图9:"ChatGPTInformedGraphNeuralNetworkforStockMovementPrediction”文章的模型效果10 图10:"ChatGPTInformedGraphNeuralNetworkforStockMovementPrediction” 文章的策略收益率走势10 图11:“TheWallStreetNeophyte:AZero-ShotAnalysisofChatGPTOver MultimodalStockMovementPredictionChallenges”文章的推特数据集11 图12:“TheWallStreetNeophyte:AZero-ShotAnalysisofChatGPTOver MultimodalStockMovementPredictionChallenges”文章的预测效果11 图13:"TheWallStreetNeophyte:AZero-ShotAnalysisofChatGPTOver MultimodalStockMovementPredictionChallenges"文章的思维链零样本提示示的例子12 图14:"CanChatGPTForecastStockPriceMovements?ReturnPredictabilityand LargeLanguageModels"文章的模型预测次日日均收益率(%)14 图15:"CanChatGPTForecastStockPriceMovements?ReturnPredictabilityandLargeLanguageModels"文章的策略评价14 图16:"CanChatGPTForecastStockPriceMovements?ReturnPredictabilityandLargeLanguageModels"文章的策略净值曲线(不考虑交易成本)14 图17:"CanChatGPTForecastStockPriceMovements?ReturnPredictabilityandLargeLanguageModels"文章的ChatGPT多空策略考虑交易成本下的净值曲线14 图18:BloombergGPT15 图19:BloombergGPT如何在两大类NLP任务中执行:特定金融任务和通用任务15 图20:使用BloombergGPT生成有效的彭博查询语言。在少数镜头设置中只使用几个例子,该模型可以利用其关于股票行情和金融术语的知识,在自然语言的请求下,组成有效的查询来检索数据。在每种情况下,模型都有3个示例(未显示),后面跟着“Input”和 “Output:”提示16 图21:使用BloombergGPT在三镜头设置中生成短标题建议。彭博新闻社每天发送许多需要这些标题的时事通讯。BloombergGPT可以通过从文本中建议初始标题来帮助编辑过程16 图22:FinGPT框架16 图23:FinGPTv3系列是在新闻和推文情绪分析数据集上使用LoRA方法进行微调的大语言模型,在大多数金融情绪分析数据集上表现最佳16 图24:FinGPT项目中构建的ChatGPT交易智能体17 图25:FinGPT项目中ChatGPT对公告给出建议的部分代码17 图26:AlphaBox于2023年7月11日在微信公众号发布上线17 图27:AlphBox展示其简单但强大的功能17 图28:AlphaBox帮助快速梳理研报18 图29:AlphaBox支持pdf、视频和音频等上传解析18 图30:MINDSHOW支持输入不超过3000字的内容,可选精简内容制作PPT18 图31:MINDSHOW制作PPT效果,支持自定义模板18 图32:无涯Infinity大模型基础因子集19 图33:无涯Infinity框架19 图34:金融领域效果测评19 图35:与不同大模型比较19 图36:FinVis-GPT的训练过程20 图37:FinVis-GPT的K线图描述示例21 图38:FinVis-GPT的K线图股价趋势预测示例21 图39:利用PortfoliosLab获取投资组合建议22 图40:利用PortfolioPilot获取投资组合建议22 图41:利用AFinChat分析中国中免、宁德时代和贵州茅台最近的新闻,并预测短期股价最能上涨的股票23 图42:利用DAIZY分析特斯拉、谷歌和微软最近的新闻,并预测短期股价最能上涨的股票23 图43:上传因子数据和收益率数据24 图44:因子IC结果输出24 图45:因子ICIR结果输出24 图46:单因子检验结果汇总25 图47:因子IC时序累计图25 图48:上传股权激励数据25 图49:A股股权激励公告年度统计26 图50:A股股权激励公告统计:是否公布激励对象数量26 图51:输入ETF基金净值数据27 图52:标准化后的ETF基金净值曲线27 图53:ETF基金收益率分布情况28 图54:ETF基金收益率相关性矩阵热力图28 图55:马科维茨投资组合有效前沿28 图56:马科维茨投资组合权重配置及回测结果28 图57:马科维茨投资组合回测净值曲线29 图58:解释配置单只基金的原因29 图59:改进模型的展望29 表1:“T