预测法律 来自国际货币基金组织中央银行立法数据库的人工智能调查结果 KhaledAlAjmi,JoseDeodoro,AshrafKhan,KeiMoriya WP/23/241 货币基金组织工作文件描述了作者正在进行的研究,并发表了这些论文,以引起评论并鼓励辩论。 基金组织工作文件中表达的观点是作者的观点,不一定代表基金组织、其执行董事会或基金组织管理层的观点。 2023 NOV ©2023国际货币基金组织WP/23/241 IMF工作文件 信息技术部和货币与资本市场部 预测法律:来自IMF中央银行立法数据库的人工智能调查结果,由KhaledAlAjmi,JoseDeodoro,AshrafKhan1和KeiMoriya编写 1通讯作者 所有作者都对这项工作做出了同样的贡献 授权由BachirBoukherouaa和JihadAlwazir分发 2023年11月 货币基金组织工作文件描述了作者正在进行的研究,并发表了这些论文,以引起评论并鼓励辩论。基金组织工作文件中表达的观点是作者的观点,不一定代表基金组织、其执行董事会或基金组织管理层的观点。 摘要: 使用国际货币基金组织中央银行立法数据库(CBLD)的2010年,2015年和2020/2021年数据集,我们探索了人工智能(AI )和机器学习(ML)方法来分析中央银行立法模式。我们的发现突出表明:(i)简单的朴素贝叶斯算法可以将CBLD搜索类别与法律中的文章中的特定文章和短语(i。Procedres.预测搜索分类);(ii)中央银行立法中出现了特定的模式或主题(最值得注意的是,关于中央银行治理,中央银行政策和运营以及中央银行利益相关者和透明度);(iii)其他AI/ML方法产生了有趣的结果,值得进一步研究。 推荐引用:AlAjmi,K.,J.Deodoro,A.Khan,K.Moriya,2023,PredictingtheLaw:ArtificialIntelligenceFindingsfromtheIMF’sCentralBankLegislationDatabase.IMFWorkingPaper23/241. 华盛顿特区:国际货币基金组织。 JEL分类号: C53、C55 关键字: 中央银行立法;中央银行;人工智能;机器学习;贝叶斯算法;布尔算法;中央银行治理;法经济学 作者的电子邮件地址: kalajmi@imf.org;jdeodoro@imf.org;akhan4@imf.org;kmoriya@imf.org 工作文件 预测法律 来自国际货币基金组织中央银行立法数据库的人工智能调查结果 由KhaledAlAjmi、JoseDeodoro、AshrafKhan和KeiMoriya1编写 1JulieVaselopulos提供的生产援助。 Contents Figures 1.CBLD数据覆盖率2010/2015、2020/2021)6 2.包含的法律数量(按国家)7 3.CBLD数据流9 4.CBLD编码应用程序10的登录页面和编码页面示例 5.类别的多重性11 6.类别1.01的最相关词和系数13 7.正确类别相对于排名14的分数 8.正确类别相对于所有类别的排名的分数14 9.计数最多的标记词15 10.CBLD16中经常出现的标记词的主题 11.常见Bigram的Word网络图(阿尔巴尼亚)17 12.常见Bigram的Word网络图(意大利)18 13.英国和印度法律中的单词关联18 内容(结束) Figures(concluded) 14.Bigram组合在中央银行“不依赖”和“自治”上的比例立法19 15.中央银行立法2016.CBLD外部用户:数量搜索23 17.CBLD外部用户:区域覆盖率(百分比)23 18.CBLD每日用户查询(2021年,2022年)24 19.按搜索类别划分的CBLD每日用户查询(2021-2023)25 20.按国家/地区划分的CBLD每日用户查询(2021-2023)25 21.按国家划分的CBLD用户查询(2021-2023)25 词汇表 AI 人工智能 AIV 货币基金组织第四条 AML/CFT 反洗钱/打击资助恐怖主义 API 应用程序编程接口 英国央行 英格兰银行 CBI 中央银行独立性 CBLD IMF中央银行立法数据库 CBT 国际货币基金组织中央银行透明度准则 ELA 紧急流动性援助 EM 新兴市场 ESCB 欧洲中央银行体系 FSAP 金融部门评估计划 FX 外汇 IMF 国际货币基金组织 ITD IMF信息技术部 LIC 低收入国家 LLM 大型语言模型 LOLR 最后的贷款人 MCM 国际货币基金组织货币和资本市场部 MIT 麻省理工学院 ML 机器学习 MOID IMF货币业务和工具数据库 NBU 乌克兰国家银行 NLP 自然语言处理 NLTK 自然语言工具包 RBI 印度储备银行 TF-IDF 术语频率-逆文档频率 Introduction 人工智能(AI)和机器学习(ML)为金融部门参与者提供了许多机会。FSB(2017)强调,总体上刺激金融科技使用的各种因素也导致了AI/ML在金融服务中的进一步采用。这包括更多的计算能力,更便宜的存储,解析和数据分析的可用性,以及“由于数字化的增加和基于Web的服务的采用,用于学习和预测的数据集的快速增长。因此,中央银行、监管机构/监管机构和市场参与者可以部署AI/ML工具,以改善其产品、服务、风险管理、合规性,特别是立法者/监管机构,以及制定相关立法和法规。 国际货币基金组织的中央银行立法数据库(CBLD)是基于文本的大型数据集,为分析全球中央银行立法的发展提供了一个有趣的测试平台。CBLD是世界上最全面的中央银行立法数据库。2CBLD目前包含175个中央银行和货币联盟的法律,并有273个特定的搜索类别,允许用户对可能涉及中央银行的几乎任何主题进行精细查询。CBLD包括来自四个特定更新时刻的数据集:2010年 、2015年、2020/2021年和2023年。展望未来,CBLD的年度更新将优先进行(I。Procedres.,根据e。Procedre,最近已经全面更新的法律,包括新概念的法律,来自CBLD中数据有限的国家的法律等。).可以通过按国家或预先设定的国家集团(特别是按地区,收入水平,汇率安排和货币联盟成员资格)搜索来访问CBLD数据。该数据库于2019年2月向公众开放;访问需要通过CBLD的网站进行一次性(免费)注册(https://data。imf.org/cbld)。 中央银行在法律框架、任务授权、政策、运作、制度结构和规模等方面都是由公共机构组成的异质群体。在所有情况下,中央银行都受到法律框架的约束,该框架概述了其目标,功能和工具/工具。该法律框架通常包括中央银行法,以及一个国家的宪法和其他法律 (例如银行,预算,反洗钱/打击资助恐怖主义(AML/CFT),(数字)货币,支付系统法律和其他金融部门法律),只要它们包含对中央银行的相关引用。中央银行和其他法律的详细程度也有所不同-一些法律可以轻松计算数百页;其他法律是一个寻呼机 。由于各国之间的法律传统和法律框架差异很大,因此无法在管理中央银行的法律之间进行统一的比较。 CBLD包括中央银行和货币联盟提供的数据。对于2010年和2015年的更新,向所有中央银行行长和货币联盟行长发送了一份问卷,要求他们向IMFCBLD团队提交相关的中央银行立法。从2020/2021年更新起, 1AI和ML是相关的,但不是相同的概念。AI是指计算机执行通常需要智能的任务的一般能力,例如思考,解决问题和学习。机器学习是AI的一个分支或子集,它使用算法自动从数据中学习并形成预测模型。机器学习是我们在日常生活中使用的人工智能的当前应用。换句话说,机器学习是通往人工智能的途径。AI的这个子类别使用算法自动学习洞察并从数据中识别模式,应用这种学习来做出更好的决策。 2另见Khan(2017)。 数据主要是通过类似的问卷(2020年)收集的,然后由国际货币基金组织CBLD团队在没有咨询中央银行的情况下补充立法(2021年)3-考虑到几乎所有国家的相关立法现在都可以在线获得。3所有收集的数据只有英文-由当局提供或由国际货币基金组织翻译(在这种情况下,将添加免责声明,注意到所提供的文本不是官方翻译)。下面的图1显示了2020/2021年更新的CBLD数据覆盖范围,以及2010年和2015年合并的CBLD更新的数据覆盖范围。未列入的国家要么没有对货币基金组织的调查表作出答复,要么不是货币基金组织的成员,要么货币基金组织的CBLD小组未能列入相关立法(要么是因为修正案正在进行中,等到修正案通过后才有意义,要么是因为时间不够)。 图1.CBLD数据覆盖率(2010/2015、2020/2021) 资料来源:货币基金组织CBLD。 CBLD对低收入国家(LIC)和新兴市场(EM)具有强大的附加值。鉴于LIC和EMs的法律能力限制,资源有限以及中央银行法律框架的遗留问题,这些国家的当局显然需要有效地获取相关同行国家的中央银行法律框架,特别是在正在进行的立法修订过程中 。CBLD允许此类访问,并可以协助国家当局就其当前的中央银行法律框架和可能(未来)的相关法律修正案做出明智的决定。 2020/2021年CBLD更新大大扩展了数据库涵盖的内容。CBLD的2020/2021更新将搜索类别扩展到273个(从之前的112个)。搜索类别现在还包括详细的搜索选项,用于广泛的中央银行职能,从宏观审慎政策到与外汇相关的政策和储备管理,以及与支付系统,金融诚信,消费者保护以及金融科技和气候变化等相对较新的主题有关的方面。4主要原因是中央银行(法律)的显着扩张。 3在国际货币基金组织CBLD团队有疑问的情况下(例如,几个国家会有不同版本的中央银行法,例如中央银行,宪法法院和财政部),团队成员将联系各自的中央银行法律部门要求澄清。 3唯一的例外是厄立特里亚,那里的中央银行法没有在网上公布。 4附件二详细概述了CBLD的主要搜索类别。 全球金融危机以来的任务,以及中央银行在单个组织内承担更多职能的(联系)发展。 如上所述,《CBLD》中包含的文件通常是中央银行法律/章程,宪法的相关摘录以及与中央银行以一种或另一种形式相关的许多其他法律。在中央银行是货币联盟的一部分(有或没有国家中央银行)的情况下,相关的超国家立法也将包括在内(例如,在欧洲货币联盟的情况下,这将包括《欧盟条约》和《欧盟规约》)。作为一个例子,图2描述了每个授权机构的CBLD中包含的文档数量。例如,对于欧洲联盟成员国的中央银行和西非货币联盟的中央银行,CBLD每个中央银行包含超过4条单独的法律。对于大多数中央银行来说,文件数量限制在1-3个。尽管这与对这些法律内容的实质性分析无关,但在分析应用于CBLD的机器学习应用程序时,请注意这一点-请参阅下一节。 图2.包含的法律数量(按国家) 资料来源:货币基金组织。 CBLD还包括中央银行法律以外的其他法律。尽管CBLD中包含的大多数文件都是中央银行法律,但就中央银行而言,也越来越多地包含其他法律。例如,这包括支付系统法、银行/监管法、反洗钱/CFT法和解决法。同样包括金融稳定法,重点是微观审慎监督 ,宏观审慎监督,ELA/LOLR和决议。 CBLD的设计牢记了新推出的IMF中央银行透明度守则。2020年,国际货币基金组织发布了《中央银行透明度准则》(CBT)。 CBT5是一项自愿性国际标准,包含47条原则(大多数原则还包括子原则,这些原则对特定主题提供了更详细的指导),分为五组 :(i)中央银行治理的透明度;(ii)中央银行政策的透明度;(iii)中央银行业务的透明度; (iv)中央银行结果的透明度;(v)中央银行官方关系的透明度。对于大多数原则,列出了三组不同的实践(核心,扩展和全面)。CBLD和CBT在按功能划分的中央银行透明