项目TGitaliea 扶持气候Triitslke使用ge进行分析 SnubetritaletiveAI March2024 1 ©2024国际清算银行。保留所有权利。 如果说明来源,则可以复制或翻译有限的摘录。 跟随我们 执行摘要 Gaia项目-BIS创新中心欧洲系统中心,西班牙银行之间的合作,1德意志联邦银行(DeutscheBundesbank)和欧洲中央银行(ECB)利用生成人工智能(AI)来促进金融系统中与气候相关的风险的分析。 中央银行、监管当局和金融机构需要更高质量和更容易获得的数据来模拟气候变化带来的金融风险。今天 ,由于缺乏全球报告标准,获取相关的气候相关指标需要付出巨大的努力。在金融机构的公司报告中,与气候有关的数据被埋在其他财务和非财务信息中,在许多情况下,与一家公司有关的信息被分为多个报告 ,相关信息包含在文本、表格、脚注和数字中。这些挑战限制了气候相关信息的可用性。 ProjectGaia旨在帮助分析师搜索与企业气候相关的披露,并使用AI,特别是大型语言模型(LLM)快速有效地提取数据。盖亚第一阶段调查了来自中央银行和监管机构的气候风险专家,设计了一个解决方案 ,解决了这些专家提出的要求,并提供了一个概念证明(PoC),证明了该概念的技术可行性。 通过自动化信息提取,盖亚开辟了以以前不可行的规模分析气候相关指标的可能性。此外,尽管不同司法管辖区的命名约定和定义存在异质性,但Gaia仍提供统一的度量标准。语义搜索与迭代和系统的LLM提示相结合,使Gaia能够克服公开框架中的差异。这为气候相关信息提供了急需的透明度和可比性。 Gaia项目通过将LLM集成到应用程序中并利用其进行数据提取而开辟了新的领域。这带来了一些技术挑战,包括LLM的长响应时间,响应中的随机性(非可重复性)和幻觉。本报告解释了一组具体的设计选择,使GaiaPoC能够克服这些挑战。 Gaia展示了创建支持AI的智能工具以自动化现有工作流程的强大功能。例如,本报告中提供的宏观分析结果涵盖了187家金融机构在五年内的20个关键绩效指标(KPI),增加更多的机构或KPI是快速和容易的。由于其灵活的设计,该平台比气候相关的数据分析更广泛。这为中央银行和金融部门支持AI的应用程序铺平了道路,以解决例如监管和监管用例。生成式AI有望改变我们未来的工作方式,而Gaia项目是最早研究如何在实践中实现这一目标的综合研究之一。 1在Moreno和Caminero(2020年,2022年,2023年)发表的先前工作的基础上。 缩写和首字母缩略词列表 AI人工智能 BIS国际清算银行 DC设计选择 ESG环境、社会和治理 JSONJava脚本对象表示法 KPI关键绩效指标 LLM大型语言模型 NGFS绿色金融系统网络 NLP自然语言处理 PoC概念证明 SQL结构化查询语言 TCFD气候相关财务披露工作队 目录 执行摘要3 气候数据挑战7 项目范围和方法论10 10 10 12 平台设计15 15 16 17 19 Testing&评估24 26 27 宏观分析用例29 29 30 31 学习和后续步骤35 35 35 36 Conclusions39 项目参与者和确认40 参考文献41 1.气候数据挑战 项目盖亚 气候数据挑战 与气候相关的金融风险包括物理风险和过渡风险。身体风险可能来自极端天气事件(如干旱、洪水和野火)或天气模式的长期变化。转型风险与转向气候友好型经济的财务后果有关,例如由于公司估值的变化。这些风险对金融机构来说是一个新的挑战,越来越需要评估每个组织对气候相关风险的敞口。 气候变化也会对整体金融稳定产生影响。(Battiston等人(2021))。中央银行和监管机构越来越需要进行气候风险分析,以评估金融体系对气候变化的脆弱性。为了进行这些评估,他们需要高质量、可比和可访问的数据。 对公司气候相关实践的最丰富见解包含在其环境、社会和治理(ESG)披露中。法规、框架和标准构成了ESG披露的支柱,并在指导组织如何报告其可持续发展实践方面发挥着相互关联的作用。它们对于气候数据的透明度也至关重要,因为它们建立了披露和解决气候相关风险的准则。它们促进透明度,促进问责制 ,并帮助减轻与气候问题相关的风险。 有几个挑战阻碍了有关机构与气候风险有关的目标和行动的信息的可用性: •缺乏标准化-ESG报告缺乏一致的全球标准,导致不同的框架和指标激增。这使得很难提取和比较跨公司和行业的ESG指标。 •数据质量和准确性确保ESG数据的准确性和可靠性可能具有挑战性,因为它通常依赖于自我报告的信息,有时依赖于代理,这可能会受到人为错误,不准确,偏见或缺乏透明度。 •范围和重要性-确定哪些ESG因素对公司业绩最重要,哪些应该披露是一个持续的挑战,因为这些因素因行业和背景而异。 •监管碎片不同的国家和地区制定了自己的ESG报告法规,导致了复杂而分散的局面。 此外,从企业ESG报告中收集与气候相关的指标通常需要大量的人工努力。与气候相关的数据被隐藏在其他财务和非财务信息中,在许多情况下,与一家公司有关的信息被分配到多个报告中。另一个挑战是,相关信息可能包含在文本片段、表格、脚注和数字的组合中——可能需要对所有这些信息进行分析,以提取所需的指标。 不同评级机构之间的ESG评级差异很好地说明了这些数据挑战(图1)Berg等人(2022)表明,这种差异是由于对基础数据的不同解释造成的。分析质疑ESG数据的可靠性,并强调分析师需要获得更精细的信息。 7 ESG评级的差异-图1 该图说明了924家公司的ESG评级。每个点对应一个公司。水平轴表示一个评级提供者的价值。其他五个评级者的评级值在垂直轴上以不同的颜色绘制。对于每个评级者,值的分布已归一化为零均值和单位方差。 资料来源:Berg等人(2022)。 直接依赖ESG报告的另一种选择是使用商业数据提供商。多家公司提供有关可持续性风险的数据集,通常依赖于从ESG报告中手动提取的信息,并使用基于专有算法的估计数据进行丰富。商业数据目前推动了全球金融市场参与者进行的可持续性风险分析,但肯定还有改进的空间。数据可靠性仍然是一个问题,因为供应商之间的差异可能很大。尽管数据通常在源头公开,但可访问性受许可限制的限制。此外,专有算法使监督者和监管者很难根据专有数据进行可重复和可解释的决策。 因此,许多国际标准制定机构强调需要缩小气候数据差距,使现有信息可用。强调对高质量、可比的气候相关数据的需求仍然是一个紧迫的问题(NGFS2022)。2有些人还指出了使用第三方气候数据提供商的数据的困难以及与之相关的使用权限制。Ferreira等(2021)主张加强基于数据可用性、披露标准和分类方法的“气候信息架构”。Gaia旨在通过改善当前未充分利用的气候相关信息源的可访问性和可用性来填补这一空白。 2.绿色金融系统网络(NGFS)是一组中央银行和监管机构,愿意在自愿的基础上分享最佳做法,为加强环境和气候风险管理做出贡献,并动员主流金融支持向可持续经济过渡。NGFS为可靠和可比的气候相关数据确定了三个组成部分:(i)迅速趋同于一套共同和一致的全球披露标准;(ii)努力为可持续金融制定最低限度接受的全球分类/共享原则;(iii)制定透明的指标和方法标准。 8 2.项目范围和方法 项目范围和方法 问题陈述 为了让金融部门进行有效的气候风险分析,投资者、中央银行、监管机构和其他相关利益相关者需要获得相关的气候相关指标。今天,获取这些指标需要大量的人工努力。此外,法规,框架和标准的复杂环境导致了不同的报告实践和数据,这限制了可用信息的可用性和可比性。 这些挑战凸显了全面解决方案的必要性,以确保相关,可靠和可比的气候相关财务数据。 盖亚价值主张 Gaia项目的愿景是创建一个开放的基于网络的工具,帮助分析师和主管搜索与企业气候相关的披露并提取数据,从而减少气候评估中涉及的手动工作。该工具通过从非结构化PDF文档中提取结构化信息,组合所有信息元素(如文本,表格和图形)来工作。它基于尖端技术,特别是AI,更具体地说是大型语言模型(LLM),以提取相关信息并以易于使用的形式呈现(图2)。 盖亚价值主张-图2 公司报告 文档存储库KPI存储库 盖亚通过为气候风险分析师提取和构建数据来增加价值。资料来源:盖亚项目。 这种方法不需要协调准则或监管要求,而是利用当今可用的详细公共信息。盖亚承诺克服披露框架之间差异的挑战,并提供独立可靠的以前未充分利用的气候风险相关数据来源。Gaia项目第一阶段开发了这种工具的功能PoC,并证明了该概念的技术可行性。 这为以以前无法想象的规模分析与气候相关的关键绩效指标(KPI)提供了可能性。使用传统的手动收集KPI进行分析的方法,每个额外的KPI和每个额外的机构都需要专门的手动工作。分析师要么需要在公共公司报告中搜索信息,要么联系机构获取信息。使用Gaia方法,一旦平台可用,搜索新的KPI或添加新机构的成本几乎为零,而且延迟很小。 Gaia项目是一项纯粹出于研究目的(即:应用研究项目),出于公共利益和非营利性的目的进行的实验。 项目盖亚的价值主张可以总结如下: •提高对气候相关披露的可及性-ProjectGaia设想了一个开放的基于网络的工具,使财务主管和宏观分析更容易访问和搜索公司气候相关披露。 •高效的数据提取-该项目利用人工智能技术,特别是LLM,快速有效地从公司报告中提取气候相关数据。这种自动化减少了气候相关分析所需的时间和精力。 •协调的气候指标-ProjectGaia在搜索公司报告时依赖于每个KPI的定义,而不是其名称,这使其能够提供统一的指标,尽管命名和定义在不同的法律和公司之间存在异质性。 •透明生成的数据-ProjectGaia提供了透明度和可追溯性,为每个提取的KPI提供了一个理由和直接的来源视图。 •可扩展性和可靠性-PoC实施采用企业级组件构建,旨在实现高可扩展性,以满足分析师不断变化的需求和对气候相关数据日益增长的需求。 •灵活性灵活的设计确保了Gaia平台可以轻松配置,以提取项目中使用的其他类型的KPI,因此可能适用于比气候相关数据分析更广泛的背景。 用户调查 ProjectGaia采用了以用户为中心的方法,将用户的需求、偏好和体验置于项目开发的最前沿。这一原则是通过在项目的各个阶段吸引用户并纳入反馈来实现的。 该项目首先研究并详细定义了要解决的问题。这一阶段对于深入了解挑战并为开发创新和以用户为中心的解决方案奠定坚实的基础至关重要。为此,成立了一个名为“绿色金融AI工作组”的论坛。该工作组包括来自18个不同中央银行以及监管机构的气候相关数据用户。他们在广泛的业务领域工作。 通过绿色金融AI工作组的参与,ProjectGaia能够提取用户故事,以捕获和传达需求和期望。一项调查用于检查和完善来自不同中央银行和主管受众的用户故事,这些受众使用与气候相关的数据。3在所有受访者中,目前有71%使用可持续发展报告。这包括66%的受访者主要依靠可持续发展报告来调查特定机构,以及20%的受访者比较多个机构。 财务主管专家对可持续性报告的当前使用情况-图3 我不经常使用可持续发展信息 13.6%我比较了多家公司 20.0% 我搜索一般信息 8.2% 性信息 我查找文本可持续 15.5% 我寻找一个具体公司的信息 20.0% 我检查特定的数字变量 22.7% 项目盖亚调查了来自17个国家的45名财务主管专家。资料来源:盖亚项目。 2.这项调查得到了国际专家的45份答复。答复来自以下国家:奥地利、比利时、克罗地亚、法国、德国、希腊、香港特别行政区、爱尔兰、立陶宛 、卢森堡、荷兰、北马其顿、菲律宾、西班牙、蒂尔基耶、美国和一个超国家组织。 根据调查结果,可持续性报告中最有价值的变量包括CO2当量排放