BIS公告 编号 84 中央银行的人工智能 道格拉斯·阿劳霍、塞巴斯蒂安·多尔、莱昂纳多·甘巴科尔塔和布鲁诺·蒂索特 2024年1月23日 国际清算银行公告由国际清算银行的工作人员撰写,并不时由其他经济学家撰写,并由银行出版。这些论文涉及主题,并且具有技术性。其中表达的观点是作者的观点,不一定是国际清算银行的观点。作者感谢BryaHardy和GaloNño的评论,感谢IlariaMattei和KrzysztofZdaowicz的出色研究援助,并感谢LoisaWager的行政支持。 BIS公告系列的编辑是HyunSongShin。 该出版物可在BIS网站(www.bis.org)上获得。 ©BankforInternationalSettlements2024.Allrightsreserved.Briefexcerptsmaybereplicatedortranslatedprovidedthesourceisstated. ISSN:2708-0420(在线) ISBN:978-92-9259-738-2(在线) 道格拉斯·阿劳霍塞巴斯蒂安·多尔莱昂纳多·甘巴科尔塔BrunoTissot 中央银行的人工智能 关键要点 中央银行一直是机器学习技术的早期采用者,用于统计,宏观分析,支付系统监督和监督,并取得了相当大的成功。 人工智能在支持中央银行授权方面带来了许多机会,但也带来了挑战-一些是一般性的,另一些是中央银行特有的。 中央银行的合作,例如通过知识共享和专业知识汇集,在使中央银行处于人工智能发展的先锋地位方面具有很大的前景。 早在人工智能(AI)成为流行评论和广泛迷恋的焦点之前,中央银行就已经是机器学习方法的早期采用者,以获得对统计 ,研究和政策有价值的见解(Doerr等人(2021),Arajo等人(2022,2023))。新一代机器学习技术的更强大功能和性能开辟了更多机会。然而,利用这些需要中央银行建立必要的基础设施和专业知识。中央银行还需要解决对数据质量和隐私以及依赖少数提供商带来的风险的担忧。 本公告首先简要概述了机器学习和AI领域的概念。然后讨论了中央银行在四个领域的用例:(i)信息收集和官方统计数据的汇编;(ii)支持货币政策的宏观经济和金融分析;(iii)支付系统的监督;(iv)监督和金融稳定。该公告还总结了从机器学习和人工智能的使用中吸取的教训以及机遇和挑战。最后讨论了中央银行合作如何在未来发挥关键作用。 机器学习方法和AI概述 从广义上讲,机器学习包括一组旨在从数据中提取信息的技术,特别是为了进行预测。机器学习可以被视为传统统计和计量经济学技术的产物,尽管它不依赖于预先指定的模型或线性或正态等统计假设。将机器学习模型拟合到数据的过程称为训练 。成功训练的标准是预测以前看不见的(“样本外”)数据的结果的能力,无论模型如何预测它们。本节介绍了中央银行中使用的一些最常见的技术,这些技术基于在国际清算银行欧文费希尔中央银行统计委员会(IFC)的框架下在中央银行界组织的定期盘点活动。 基于树的方法是灵活的机器学习算法,可以处理各种任务。决策树通过根据感兴趣的特定特征将数据顺序划分为更精细的类别来对各个数据点进行分组。例如,树可以首先将房屋(输入数据)分类为具有三个以上房间的房屋和最多三个房间的房屋,然后将房屋划分为每个房屋。 分组为1990年之前建造的和之后建造的,以此类推。然后可以将由此产生的更精细的房屋分区与感兴趣的特定维度(输出)进行比较,以查看分区与感兴趣的属性的匹配程度。例如,捕获房价如何在更精细的分区中变化将是对类似房屋的价格进行分组的一种方法。 随机森林结合了在相同数据的不同切片上训练的几棵树,以改善样本外的预测,同时防止训练数据样本过度拟合的风险 。随机森林和相关模型可以被视为回归分析的一种更灵活的形式,因为它们可以从感兴趣的解释变量(Athey和Imbes( 2021))预测输出。此外,基于树的方法可以作为一种探索性工具,在不强加模型结构的情况下收集数据中的模式。例如 ,他们可以将数据点分类为类似的类别。本着同样的精神,森林可以通过隔离森林来识别异常值,这种方法可以挑出可以与其他数据点隔离的数据点。 神经网络可能是机器学习中最重要的技术,甚至在最新一代的模型中也有广泛的用途。它们的主要构建块是人工神经元 ,它们采用多个输入值,并以非线性方式转换它们以输出单个数字-类似逻辑回归。人工神经元被组织以形成可以堆叠的层序列:第一层的神经元获取输入数据并输出激活值。随后的层将前一层的输出作为输入,对其进行变换并输出另一个值,依此类推。这样,与人脑中的神经元类似,人工神经元的输出值类似于传输到其他神经元的电脉冲。网络的深度是指层数。每个神经元的常数和附加到先前层神经元的输出的权重统称为参数;它们确定跨神经元和层的连接强度。在训练期间迭代地改进这些参数。具有更多参数的更深入的网络需要更多的训练数据,但预测更准确。神经网络是手机中面部识别或语音助手的幕后黑手,也是人工智能最近最重要的创新的基础。 2017年推出的《变形金刚》大大改善了神经网络在自然语言处理(NLP)中的性能,并推动了大型语言模型(LLM)的兴起。转换器不仅要将一个单词与它附近的单词联系起来,还试图捕获文本序列的不同组成部分之间的关系,即使它们在句子中相距很远。这允许模型更好地理解上下文,因此一个单词可以具有不同的含义。例如,当“银行”一词出现在“我要游过河去另一个银行”和“我过马路去银行”的句子中时,它的含义就不同了。变形金刚解锁了需要处理长文本流的NLP用例,并引起了LLM的最新进展,例如ChatGPT。 LLM是生成AI(“geeAI”)迅速崛起的基础,该AI基于适当的提示生成内容,并且可以执行语言识别以外的任务。LLM是被训练来预测给定文本序列中的下一个单词的神经网络。为了执行此任务,LLM学会吸收所有接受培训的书面知识。因此,即使对于需要细微差别或现场知识的文本,他们的预测通常也是准确的。LLM可以针对具有专门数据的特定任务进行微调。例如,ChatGPT基于用人类反馈改进的LLM以生成更有用的响应。GeAI的关键特征是,它不仅可以被一小部分专家使用,而且几乎每个人都可以使用,并且可以轻松地从非结构化数据中提取见解。 中央银行中的机器学习和AI:用例 机器学习和人工智能在中央银行中的当前用例是什么?它们最好按范围进行组织:(i)信息收集和统计编制;(ii)支持货币政策的宏观经济和金融分析;(iii)对支付系统的监督;(iv)监督和金融稳定。本节提供了每个领域的相关示例。有关选定示例的更多信息以及更广泛的用例列表,请参见附件。 信息收集 确保高质量数据作为经济分析以及统计数据编制和生产的投入是中央银行面临的主要挑战。问题包括数据清理、抽样、代表性以及将新数据与现有来源相匹配。数据量和复杂性的稳步增加需要有效和灵活的数据质量工具。 为了提供高质量的微观数据,各国央行正在逐步使用机器学习技术。隔离森林特别适合中央银行典型的大型和细粒度数据集,因为它们具有可扩展性和识别异常值的能力,无论数据分布的形状如何。两步法也有好处:最初,模型会自动识别潜在的异常值,然后由提供反馈的专家进行审查,以完善算法。这种方法平衡了领域专业知识的价值与人力投入的成本。通过分析不同的方法来解释离群分类,这种方法可以克服“黑箱”机器学习模型缺乏“可解释性”的问题,这将在下面讨论。此外,可解释的机器学习方法为专家提供了关于哪些数据点需要手动验证的指导。 宏观经济金融分析支持货币政策 中央银行广泛依赖宏观经济和金融分析来支持货币政策。在复杂的环境中,一个重大挑战是从广泛的传统和非传统数据源中有效地提取信息。机器学习在这方面提供了有价值的工具。 例如,神经网络可以将服务通胀分解为不同的组成部分,揭示过去的价格上涨、通胀预期、产出缺口或国际价格导致了多少通胀。与传统的计量经济学模型相比,这种模型可以处理更多的输入变量,从而使中央银行可以使用粒度数据集,而不是更多的汇总数据。另一个优点是神经网络能够反映数据中复杂的非线性,这可以帮助建模者更好地捕获非线性,从零下界到不相等的资产持有量以及通货膨胀动态的变化。 其他用例是获得通胀预期的实时估计(owcast),或总结一段时间内的经济状况。例如,随机森林模型可以识别与价格相关的社交媒体帖子,然后将它们馈送到另一个随机森林模型中,该随机森林模型将每个帖子分类为反映通货膨胀、通货紧缩或其他预期。较高和较低通胀的每日社交媒体帖子数量的差异衡量了通胀预期。同样,社交媒体帖子可用于跟踪中央银行货币政策在更广泛公众中的可信度。 另一个例子是使用与财经新闻一起微调的开源LLM来总结很长一段时间内的经济状况叙述。模型可以处理来自企业家 、经济学家和市场专家采访的轶事文本,以产生他们(积极或消极)情绪值的时间序列。然后情绪指数可以用来预测GDP或预测衰退。 如BIS开发的中央银行语言模型(CB-LM)项目(Gambacorta等人(2024))所示,使LLM适应中央银行术语可以带来进一步的收益。这种方法使用了成千上万的中央银行演讲和BIS中央银行集线器编写的研究论文,以适应Google和Meta发布的广泛使用的开源基金会LLM。这项针对中央银行文本的额外培训将解释中央银行术语和习语的准确性从50-60%提高到90%。它还改善了联邦公开市场委员会政策立场分类和预测市场对货币政策公告的反应等任务的表现。 对支付系统的监督 运作良好的支付系统是金融系统稳定的基础,然而大量的交易数据,通常具有高度偏斜的分布,在区分异常交易和常规交易方面提出了挑战。正确识别异常支付对 及时解决潜在的银行倒闭,网络攻击或金融犯罪等问题。特别是洗钱,破坏了全球金融体系的完整性和安全性。 BIS创新中心的Arora项目使用合成洗钱数据来比较各种传统和机器学习模型的欺诈性支付识别(BISIH(2023))。这些模型包括隔离森林和神经网络,经过已知(合成)洗钱交易的训练,然后在看不见的数据中预测洗钱的可能性。机器学习模型优于大多数司法管辖区或传统逻辑回归中流行的基于规则的方法。图神经网络以支付关系为输入,可以很好地识别可疑交易网络。即使使用保障机密性的数据池,这些模型也可以有效运行,这表明合作共同分析多个数据库可能是安全和有益的 。这说明了当局之间更多合作的潜力。 另一种监督支付交易的方法是使用无监督学习方法自动挑出值得仔细检查的交易。例如,自动编码器模型,输入层和输出层都查看相同数据的神经网络,将典型支付与异常支付区分开来,并可以检测非线性动态,例如银行挤兑。在模拟中,这些模型有效地识别了几天内大量银行存款取款的模式。自动编码器还发现了支付系统中的一系列现实生活中的异常情况,包括重要的国内银行之间的运营中断。 监督和金融稳定 监管人员分析广泛的数据源,以有效地监督金融机构。这些来源包括文本文档,例如新闻文章,内部银行文件或监督评估。筛选这些丰富的信息以提取相关的见解可能是耗时的,并且随着数据量的不断增加,它变得几乎无法克服。此外,与气候和网络风险相关的分析已成为监管重点,但它们缺乏针对更“传统”风险的全面数据基础设施。 许多中央银行追求的一个途径是在一个地方整合丰富的信息,并帮助对非结构化数据的监督分析。例如,与NLP技术一起对监管内容进行微调的模型可以对公共和监管文件进行分类,进行情绪分析并确定趋势主题,就像在欧洲央行的平台Athea中所做的那样。在大量文本上训练模型,再加上专家定义的相关单词和子句词典,也可以帮助自动发现包含不同风险信息的摘录。这样的模型,例如美联储的LEX,促进了监管人员对散布在数百万个文档中的相关信息的访问,并减少了审查文档提交所花费的时间。利用基于树的技术或神经网络的分类模型还可以帮助识别贷款人低估潜在信贷损失的个人借款人,巴西中央银行为此创建了ADAM。包括经过训练的网络的第一层的神经网络可以改善具有高预期损失的借款人的识别。然后