您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:Beta猎手系列之七:追上投资热点:基于LLM的产业链图谱智能化生成 - 发现报告
当前位置:首页/其他报告/报告详情/

Beta猎手系列之七:追上投资热点:基于LLM的产业链图谱智能化生成

2024-01-15高智威国金证券匡***
Beta猎手系列之七:追上投资热点:基于LLM的产业链图谱智能化生成

本篇报告是国金证券金融工程团队围绕大语言模型开展的多项深度前瞻研究第八篇。在本报告中,我们借鉴智能体 (Agent)这一概念,将大语言模型应用到产业链梳理任务中,并实现了对投资概念的拆解以及相关标的个股的推荐。 OpenAI在首届开发者大会上推出GPTs功能,它们能自主寻找多步解决问题的方案并行动。我们将具有以上功能的模型称为“智能体”。智能体核心要素可以表示为“大语言模型+规划+工具+记忆”:大语言模型作为内核提供理解、推理与生成能力;规划给智能体带来问题逐步求解能力,实现从“一问一答”向“自主思考”转变;工具赋予智能体与环境交互的能力;记忆则帮助它完成多轮的思考与行动。 基于大语言模型的智能体决策逻辑可以简化为“感知→规划→行动”。其中,感知是指智能体收集信息并整合为模型输入,规划是指智能体做出具体决策并给出行动指令,行动则是按照规划行动的步骤。智能体观察到行动的反馈并放入记忆,成为下一轮感知的基础,构成完整的决策过程。 在此之前,AutoGPT与Langchain等项目已成功实现了单一智能体的部署并给出了智能体的设计蓝图,当前的研究前沿方向是多智能体交互部署。我们借鉴AutoGPT的思路构建了应用于产业链梳理的“产业链Agent”。 尽管大语言模型能掌握基础的产业链知识,但无法直接梳理完整产业链。我们为产业链Agent完善产业链推理的框架,包括上/下游供需关系的推理、末端产品判断以及产品重要性判断,让智能体自我迭代,最终完成对所有节点的推理与判断。以智能手机上游为例,产业链Agent梳理结果与Wind智能手机产业链二者整体结构一致。 我们还赋予产业链Agent新闻检索的能力,增强模型对专业知识的掌握。智能体可以综合新闻信息与自有知识进行回答,给出的答案更加细致且贴近市场实际情况;挂载不同时间范围的新闻还可以观察出产业链随时间变化的趋势。更进一步,我们以产业链梳理为核心,给出了对相关投资标的进行筛选以及对投资主题进行拆解的解决方案。最终,我们可以完整分析给定投资主题对应的细分产业链结构以及相关的投资标的。我们以“华为供应链”为例,对比展示了基于GPT4模型以及基于GPT3.5叠加新闻两种模型的结果,并给出相关投资标的推荐,对各功能进行完整展示。 使用大语言模型来实现产业链梳理以及标的推荐等功能,一方面是为了能更好利用大数据优势,从量化视角给出产业链的归纳结果,以期能够为主观投资带来增量信息;另一方面,在面对全新的投资主题或产业结构出现变化时,模型能够更快地给出回答,帮助投资者们及时做出反应。 从结果上来看,目前产业链梳理以及个股推荐的等功能虽已有雏形,但仍可能存在一定问题,包括:产业链结果不稳定、结构可能存在冗余、叠加新闻效果不稳定。整体来说,本篇在产业链梳理主题上对Agent技术做了充分的尝试,不过与应用实际落地之间仍有一定差距。当前大语言模型及其相关技术依旧在快速发展中,伴随能力更强大的模型登场,在可预见的未来智能体将真正为金融投资领域带来新的视野。 大语言模型输出结果具有一定随机性的风险;模型迭代升级、新功能开发可能会导致结论不同的风险;人工智能模型得出的结论仅供参考,可能出现错误答案的风险。 内容目录 一、从大语言模型到“智能体”4 1.1如何理解智能体(Agent)?5 1.2LLM-BasedAgents的运行机制6 二、LLM-BasedAgent的应用与实践8 2.1单一智能体的部署——以AutoGPT为例8 2.2多智能体的交互部署10 2.3人与智能体的交互部署10 三、利用LLM-BasedAgent快速梳理产业链,捕捉投资热点10 3.1方法介绍10 3.2产业链梳理智能体的构建12 3.3基于新闻数据进行产业链知识的拓展14 3.4产业链梳理细化——相关投资标的推荐15 3.5如何针对投资主题梳理其产业链信息?16 四、产业链梳理案例展示——以“华为供应链”主题为例17 4.1投资主题梳理结果展示17 4.2投资标的梳理结果展示20 五、总结21 风险提示21 图表目录 图表1:GPT商店界面5 图表2:自定义GPTs界面5 图表3:OpenAI提供的DataAnalysis应用案例4 图表4:智能体技术演变6 图表5:LLM-BasedAgent运行机制示例6 图表6:智能体运行流程示意图7 图表7:LLM-BasedAgent三大应用场景8 图表8:AutoGPT整体逻辑流程与模块调用概念图8 图表9:AutoGPT生成Prompt的模板9 图表10:多智能体交互模式示例10 图表11:大语言模型拥有充足的产业链知识11 图表12:手机产业链推导示意图12 图表13:产业链Agent运行流程示意图12 图表14:大语言模型产业链梳理结果展示13 图表15:Wind智能手机产业链梳理结果展示13 图表16:智能手机-显示屏高相关新闻示例14 图表17:智能手机-显示屏上游(GPT3.5未叠加新闻)14 图表18:智能手机-显示屏上游(GPT3.5+202303-202306新闻)15 图表19:智能手机-显示屏上游(GPT3.5+202303-202310新闻)15 图表20:智能手机-显示屏上游投资标的推荐案例16 图表21:投资主题拆解结果展示17 图表22:“华为供应链”梳理(GPT4)18 图表23:“华为供应链”梳理(GPT3.5+新闻)19 图表24:“华为供应链”投资标的梳理结果20 OpenAI的首届开发者大会上公布了一系列新成果,但其中给人们带来最大冲击的不是全新的大语言模型,而在于一个新的功能:GPTs和GPT商店。自ChatGPT推出以来,人们一直在寻找方法让它成为适应特定使用目标的定制化产品,而GPTs正是为此而来。简单来说,在GPTs中任何人都可以创建自己想要的定制功能,从而让GPT进行“角色 扮演”。当前GPTStore也已正式上线,包含超300万个用户设计的GPTs。 OpenAI官方也推出了一些调试好的GPTs供大家体验。以DataAnalysis为例,它能使用本地上传的数据进行较复杂的计算。从下图的回答中我们可以看出GPTs会将复杂任务拆解为小的步骤,同时调用代码工具辅助运算,经过多轮的运算思考之后给出最终答案。 图表1:OpenAI提供的DataAnalysis应用案例 来源:OpenAI,国金证券研究所 我们也可以创建自己的GPTs,通过给出Instructions指定GPTs的具体行动内容,还可以在Knowledge中上传需要给模型补充的相关信息,再通过Capabilities赋予GPTs调用代码或其他接口的能力,GPTs将其结合为一体以实现更复杂的功能。我们尝试构建了“数学老师”GPT并题问,它会自主地调用编程软件并求解,直到它认为我们给出的问题已得到解答。 图表2:GPT商店界面图表3:自定义GPTs界面 来源:OpenAI,国金证券研究所来源:OpenAI,国金证券研究所 实际上,类似的思路早已有雏形。之前火爆一时的AutoGPT项目可以实现用户提问后大模型自主寻找解决方案,包括由模型规划解决问题的步骤、使用哪些工具、以及得到反馈后自动进行下一步思考,在这一框架下模型获得了一定的自主能力,并能够独立实现 被赋予的目标。我们称这样的模型为智能体(Agent)。 1.1如何理解智能体(Agent)? 人工智能领域的“智能”概念与传统理解有所不同,它更强调的是行使意志、做出选择和采取行动的能力,强调物体不是单纯被动地受外部刺激而做出反应。智能体则是泛指满足上述行动要求的实体。 历史上的智能体实践经历了多轮迭代。最初智能体仅停留在概念的层面,强调符号逻辑与反应速度。伴随深度强化学习的发展,基于深度学习的智能体(RL-BasedAgents)开始发展,AlphaGo等广为人知的项目获得成功标志着智能体开始进入实际应用环境。不过,强化学习作为核心也带来训练时间长、采样效率低以及稳定性问题。大语言模型快速兴起为智能体的发展也带来了丰富想象,越来越多的人开始尝试将大语言模型作为内核,来构建LLM-BasedAgent。大语言模型天生自带的多模态感知、推理能力以及强大的泛化能力,为智能体带来了丰富的应用场景。 图表4:智能体技术演变 来源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,国金证券研究所 在大语言模型背景下,智能体概念可以理解为: 智能体=大语言模型+规划+工具+记忆 大语言模型作为模型内核,为智能体提供理解、推理与生成能力,也是其他所有功能的实现基础。规划步骤帮助智能体获得对问题求解步骤进行拆分的能力,实现从“一问一答”向“自主思考”转变,其本质上依赖于大语言模型的推理能力。工具赋予智能体与环境交互的能力,是智能体行动的载体;记忆则记录智能体每一轮的思考、行动以及获取的反馈,帮助它在多轮迭代中保持思考的连贯。以下我们对这类基于大语言模型的智能体进行更详细的介绍。 1.2LLM-BasedAgents的运行机制 我们使用一个例子来说明LLM-BasedAgents的运行机制。当人类询问“明天这里是否会下雨?”时,下图展现了一种可能的LLM-BasedAgent“思考流程”: 图表5:LLM-BasedAgent运行机制示例 来源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,国金证券研究所 感知模块将指令转换为大语言模型可以理解的表示形式;然后大脑模块开始根据天气的图片、地理位置或是其他天气相关的数据进行推理和行动规划;最后由行动端做出响应并将雨伞递给人类。以上只是大致的运作流程,实际上该流程内部可能存在多轮迭代,譬如: 第一轮,智能体识别出需要对下雨的概率进行估计,那么会规划对天气相关的数据进行实时收集,行为模块就会执行联网的查询或是数据库调取这类操作; 第二轮,模型读取收集到的数据,再决定是基于自有知识或是直接调用天气预测模型,来给出下雨的概率;…… 最终,智能体在重复上述过程中不断与环境交互并获得反馈,最后得出结论。 总结来说,智能体的运行流程可以简化为:感知(Perception)、规划(Planning)、行动(Action)。 图表6:智能体运行流程示意图 来源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,国金证券研究所 感知的核心目的是将数据统一化为模型可以操作的向量形式,当然在实践层面它还负责Prompt的编写等工作。规划模块则负责进行推理和决策,主要是基于模型自身的参数来给出回答。在大语言模型的加持下,它能获得“记忆”能力,结合自身过去的观察、思考和行动进行规划。行动模块接收规划给出的行动安排,并与环境产生互动,这也是让智能体拥有自主性的最关键部分。工具一般以API或函数的形式提供,丰富的工具选择可以大大拓宽智能体的能力范围,补足大语言模型不擅长的方面。例如模型并不擅长数学运算,在需要涉及运算时我们允许模型调用代码(Codeinterpreter)进行辅助,这样可以明显提升模型运算的准确度。 大语言模型为智能体带来如下的具体优势: 1)大语言模型的多模态感知扩展了智能体接受的信息范围。除了基本的文本输入外,感知模块也能添加图像编码器,在编码器与大语言模型之间增添中间层的方式将LLM-BasedAgent的感知域扩展到视觉输入层面;听觉输入方面,智能体可以以级联方式调用现有工具集或模型库来处理音频信息,将感知空间从纯文字领域扩展到包括文字、听觉和视觉模式在内的多模态领域。 2)大语言模型自身具备强大的推理能力以及丰富的知识,能提升规划模块的效率。除此之外,针对复杂问题,我们还可以使用思维链(CoT)等技术有效提升智能体的推理能力。 3)大语言模型拥有强大的zero-shotlearning和few-sho