证券分析师 金融工程专题 了解GPT:投资篇 德邦金工文献精译第十三期 肖承志 资格编号:S0120521080003 邮箱:xiaoczteboncomcn 研究助理 相关研究 1《了解GPT:应用篇德邦金工文献精译第十二期》20230725 2《了解GPT:训练篇德邦金工文献精译第十一期》20230629 3《ChatGPT能够预测股票价格的走势吗?收益可预测性和大型语言模型 德邦金工文献精译第十期》 20230422 4《训练语言模型以遵循带有人类反馈的指令德邦金工文献精译第八期》20230316 证券研究报告金融工程专题 深度报告 2023年08月19日 投资要点: 《了解GPT:投资篇》在训练篇和应用篇的基础上,梳理了目前大模型重点解决“投资”问题的研究进展和方式方法。大语言模型在金融领域也有着广泛的应用潜力,例如分析财经新闻、预测股票走势、生成投资建议等。我们从以下四个方面进 行介绍: ChatGPT构建投资策略的学术论文:我们介绍了4篇使用ChatGPT探索金融投资策略构建方法的论文。目前学术界的研究已使用多种方式将ChatGPT融入到生成因子、交易信号等构建量化策略的环节中,发挥在投资领域应用大模型的想象 空间。我们从中找到了一些共通点和使用技巧,但如何更有效的发挥大模型的潜力,提高模型表现,仍需要进一步的深入研究。 金融大模型:我们介绍了BloombergGPT、FinGPT、AlphaBox、FinVisGPT等金融大模型项目,针对不同的金融场景和需求提供了独特的功能和服务。目前, FinGPT是最火爆的支持情感分析、量化交易、金融问答等领域任务的开源大模型环境,FinVisGPT是新颖的识别K线图给出投资建议的金融大模型。部分国内企业已经在金融大模型上有所布局,凭借其在数据和技术积累方面的多重优势,能够为金融机构提供个性化、全面化的服务,具备应用前景和发展潜力。 ChatGPTPlugins投资插件:截至2023年8月11日,ChatGPTPlugins平台共计817款插件,我们统计其中24款具有供投资相关功能服务的插件。这些插件可用于获取投资组合建议、分析股票新闻情绪、优化投资者组合等功能。其中,我 们认为AFinChat是最具有使用价值的插件,可以被用来分析A股新闻和行情数据。 OpenAI代码解释器:OpenAI代码解释器于2023年7月向ChatGPTPlus会员开放,提供基于python语言处理用户自定义数据,具备数据分析、作图等功能。由于算力有限,OpenAI并未提供可自定义下载的python库,数据较大时存在运 行崩溃的问题,因此目前只能进行简单的数据分析等应用。对投资问题,我们测试了单因子检验、股权激励数据分析、ETF投资组合配置3个案例,代码解释器均取得了良好的表现,能够清晰准确地完成用户的要求并阐述其解决思路,并能够在代码报错的情况下进行自主调试。 大型语言模型在金融投资领域应用是一个有前景但也有难度的课题,需要多学科的合作和创新。大型语言模型面临的挑战包括如何有效地结合多模态数据(如股价、新闻、社交媒体等)、如何提高模型的可解释性和可信度、如何防止模型的滥 用和误用等。相信随着更多的研究、算力和插件能力的提升,将更大程度发挥LLM 的能力,对解决更复杂的问题有质的提升。 风险提示:数据不完备和滥用风险,信息安全风险,算法伦理风险 请务必阅读正文之后的信息披露和法律声明 内容目录 1借助大模型解决投资问题6 2应用ChatGPT构建投资策略的论文6 21大语言模型可以预测股价A股走势吗?更大参数的模型效果一定更优吗? ErlangshenRoBERTa110MSentiment模型的情感分析能力强于ChatGPT6 22新视角:结合图神经网络和ChatGPT预测股票走势8 23结合股价和推特文本数据供ChatGPT预测涨跌10 24第二版:ChatGPT能够预测股票价格的走势吗?收益可预测性和大型语言模型1325小结14 3金融大模型15 31BloomBergGPT15 32FinGPT16 33AlphaBox17 34MINDSHOW18 35无涯Infinity18 36轩辕19 37FinVisGPT20 4ChatGPTPlugins与投资有关的插件21 5OpenAI代码解释器23 51单因子检验23 52股权激励分析25 53投资组合构建26 6总结29 7参考文献30 8风险提示30 信息披露31 图表目录 图1:UnveilingthePotentialofSentimentCanLargeLanguageModelsPredictChineseStockPriceMovements”文章的数据来源7 图2:UnveilingthePotentialofSentimentCanLargeLanguageModelsPredictChineseStockPriceMovements”文章的提示词设计和回答样例7 图3:UnveilingthePotentialofSentimentCanLargeLanguageModelsPredictChineseStockPriceMovements”文章的3种不同大语言模型策略相对沪深300超额净值8 图4:UnveilingthePotentialofSentimentCanLargeLanguageModelsPredictChineseStockPriceMovements”文章的Erlangshen因子分3组回测相对沪深300超额收益率8 图5:UnveilingthePotentialofSentimentCanLargeLanguageModelsPredictChineseStockPriceMovements”文章的三种不同大语言模型策略回测结果统计8 图6:UnveilingthePotentialofSentimentCanLargeLanguageModelsPredictChineseStockPriceMovements”文章的3种不同大语言模型策略的日均持股数量和换手率8 图7:ChatGPTInformedGraphNeuralNetworkforStockMovementPrediction”文章的模型框架9 图8:ChatGPTInformedGraphNeuralNetworkforStockMovementPrediction”文章的提示词设计9 图9:ChatGPTInformedGraphNeuralNetworkforStockMovementPrediction”文章的模型效果10 图10:ChatGPTInformedGraphNeuralNetworkforStockMovementPrediction” 文章的策略收益率走势10 图11:“TheWallStreetNeophyteAZeroShotAnalysisofChatGPTOver MultimodalStockMovementPredictionChallenges”文章的推特数据集11 图12:“TheWallStreetNeophyteAZeroShotAnalysisofChatGPTOver MultimodalStockMovementPredictionChallenges”文章的预测效果11 图13:TheWallStreetNeophyteAZeroShotAnalysisofChatGPTOver MultimodalStockMovementPredictionChallenges文章的思维链零样本提示示的例子12 图14:CanChatGPTForecastStockPriceMovementsReturnPredictabilityand LargeLanguageModels文章的模型预测次日日均收益率()14 图15:CanChatGPTForecastStockPriceMovementsReturnPredictabilityandLargeLanguageModels文章的策略评价14 图16:CanChatGPTForecastStockPriceMovementsReturnPredictabilityandLargeLanguageModels文章的策略净值曲线(不考虑交易成本)14 图17:CanChatGPTForecastStockPriceMovementsReturnPredictabilityandLargeLanguageModels文章的ChatGPT多空策略考虑交易成本下的净值曲线14 图18:BloombergGPT15 图19:BloombergGPT如何在两大类NLP任务中执行:特定金融任务和通用任务15 图20:使用BloombergGPT生成有效的彭博查询语言。在少数镜头设置中只使用几个例子,该模型可以利用其关于股票行情和金融术语的知识,在自然语言的请求下,组成有效的查询来检索数据。在每种情况下,模型都有3个示例(未显示),后面跟着“Input”和 “Output:”提示16 图21:使用BloombergGPT在三镜头设置中生成短标题建议。彭博新闻社每天发送许多需要这些标题的时事通讯。BloombergGPT可以通过从文本中建议初始标题来帮助编辑过程16 图22:FinGPT框架16 图23:FinGPTv3系列是在新闻和推文情绪分析数据集上使用LoRA方法进行微调的大语言模型,在大多数金融情绪分析数据集上表现最佳16 图24:FinGPT项目中构建的ChatGPT交易智能体17 图25:FinGPT项目中ChatGPT对公告给出建议的部分代码17 图26:AlphaBox于2023年7月11日在微信公众号发布上线17 图27:AlphBox展示其简单但强大的功能17 图28:AlphaBox帮助快速梳理研报18 图29:AlphaBox支持pdf、视频和音频等上传解析18 图30:MINDSHOW支持输入不超过3000字的内容,可选精简内容制作PPT18 图31:MINDSHOW制作PPT效果,支持自定义模板18 图32:无涯Infinity大模型基础因子集19 图33:无涯Infinity框架19 图34:金融领域效果测评19 图35:与不同大模型比较19 图36:FinVisGPT的训练过程20 图37:FinVisGPT的K线图描述示例21 图38:FinVisGPT的K线图股价趋势预测示例21 图39:利用PortfoliosLab获取投资组合建议22 图40:利用PortfolioPilot获取投资组合建议22 图41:利用AFinChat分析中国中免、宁德时代和贵州茅台最近的新闻,并预测短期股价最能上涨的股票23 图42:利用DAIZY分析特斯拉、谷歌和微软最近的新闻,并预测短期股价最能上涨的股票23 图43:上传因子数据和收益率数据24 图44:因子IC结果输出24 图45:因子ICIR结果输出24 图46:单因子检验结果汇总25 图47:因子IC时序累计图25 图48:上传股权激励数据25 图49:A股股权激励公告年度统计26 图50:A股股权激励公告统计:是否公布激励对象数量26 图51:输入ETF基金净值数据27 图52:标准化后的ETF基金净值曲线27 图53:ETF基金收益率分布情况28 图54:ETF基金收益率相关性矩阵热力图28 图55:马科维茨投资组合有效前沿28 图56:马科维茨投资组合权重配置及回测结果28 图57:马科维茨投资组合回测净值曲线29 图58:解释配置单只基金的原因29 图59:改进模型的展望29 表1:“TheWallStreetNeophyteAZeroShotAnalysisofChatGPTOver MultimodalStockMovementPredictionChallenges”文章的3个子问题10 表2:AlphaBox功能18 表