您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[美国国家经济研究局]:用机器学习改进公共政策:税务审计案例 - 发现报告
当前位置:首页/其他报告/报告详情/

用机器学习改进公共政策:税务审计案例

用机器学习改进公共政策:税务审计案例

美国国家经济研究局工作论文系列 利用机器学习完善公共政策:税务审计案例马可·巴塔格利尼 路易吉·吉索基亚拉·拉卡瓦道格拉斯·米勒 爱莉Patacchini 工作文件30777http://www.nber.org/papers/w30777 国家经济研究局(NATIONALBUREAUOFECONOMICRESEARCH) 麻萨诸塞州大道1050号马萨诸塞州,剑桥021382022年12月 我们非常感谢意大利税务局授予我们访问数据的权限。我们对论文中表达的想法负全部责任。我们感谢康奈尔大学、苏黎世联邦理工学院和意大利部长会议主席国的研讨会参与者的宝贵讨论。本文表达的观点是作者的观点,不一定反映国家经济研究局的观点。 分发NBER工作文件供讨论和评论之用。它们没有经过同行评审,也没有接受NBER官方出版物随附的 NBER董事会的审查。 ©2022年由马可·巴塔格利尼、路易吉·圭索、基亚拉·拉卡瓦、道格拉斯·米勒和埃莉奥诺拉·帕塔奇尼执导。保留所有权利。未经明确许可,可以引用不超过两段的短段文字,但须注明来源,包括©通知。 利用机器学习完善公共政策:税务审计案例 MarcoBattaglini、LuigiGuiso、ChiaraLacava、DouglasL.Miller和EleonoraPatacchiniNBER工作文件第30777号 2022年12月 冻胶。h2o,H26H2, 摘要 我们研究了ML技术在多大程度上可用于使用行政数据来提高税务审计效率,而无需随机审计。利用意大利关于独资企业纳税申报表、审计及其结果的人口数据,我们开发了一种新方法来解决所谓的选择性标签问题——ML算法必须根据内生选择的数据进行训练。我们通过改进纳税人的选择来使用ML进行审计,记录了从审计中增加收入的大量利润。用我们训练的算法选择的相同数量的纳税人取代10%效率最低的审计,可将检测到的逃税提高多达38%,而实际偿还的逃税则增加了29%。 马可·巴塔格利尼经济系乌里斯·霍尔 康奈尔大学伊萨卡分校,NY14850和EIEF,CEPR 而且NBERbattaglini@cornell.edu 路易吉新郎 安盛家庭金融教授伊诺第经济与金融研究所 ViaSallustiana62-00187意大利罗马luigi.guiso55@gmail.com 奇亚拉赛艇队而 法兰克福歌德大学金融的房子Theodor-W.-Adorno-Platz3FrankfurtamMain,HE60320德国 道格拉斯·l·米勒 政策分析与管理系MVR大厅康奈尔大学伊萨卡分 校,NY14853和NBER dlm336@cornell.edu 埃莉奥诺拉·帕塔奇尼康奈尔大学经济系 430年uri大厅 纽约伊萨卡岛14853期ep454@cornell.edu 机器学习的公共政策:税务审计案例* 马可Battaglini?路易吉新郎?奇亚拉赛艇队而?道格拉斯·l·米勒?爱莉Patacchini? 我们研究了ML技术在多大程度上可以使用行政数据来提高税务审计效率,而无需进行以运行为主的审计。利用意大利关于独资企业纳税申报表、审计及其结果的人口数据,我们开发了一种新方法来解决所谓的选择性标签问题— —ML算法必须根据内生选择的数据进行训练。我们记录了通过证明纳税人的选择与ML审计来增加审计收入的大量利润。用我们训练的算法选择的相同数量的纳税人取代10%效率最低的审计,将检测到的逃税提高多达38%,而实际偿还的逃税增加了29%。 关键字:税收执法,逃税,政策预测问题。凝胶抚慰阳离子:C55H26。 1介绍 税务机关定期收集有关税务人员的深度数据集,可用于确定审计目标。这使得审计策略的选择成为首要候选人 *我们非常感谢意大利税务局授予我们访问数据的权限。我们对论文中表达的想法负全部责任。我们感谢康奈尔 大学、苏黎世联邦理工学院和意大利部长会议主席国的研讨会参与者的宝贵讨论。 ?博科尼大学和EIEF电子邮件:marco.battaglini@unibocconi..教育 ?EIEF电子邮件:luigi.guiso55@gmail.com ?法兰克福歌德大学电子邮件:lacava@econ.uni-frankfurt.de ?康奈尔大学电子邮件:dlm336@cornell.edu ?博科尼大学电子邮件:eleonora.patacchini@unibocconi.edu 机器学习技术(以下简称ML)的应用程序,可以部署以明智,一致和透明地利用可用信息。虽然税务机关和研究人员都意识到了这些机会,但大多数税务机关遵循的审计程序的不透明性使得不清楚他们在生产可能性前沿的运作程度,或者是否通过更有效地使用数据来改进。 在本文中,我们利用意大利税务局(以下简称IRA)的独家数据集来探索ML技术是否可用于改进授权政策。该数据集包括2007年至2012年意大利非公司小企业的纳税申报表和相关审计结果。此外,该数据集还包括有关纳税人是否反对审计的信息,以及IRA可获得的有关税收的所有统计信息。 ML技术背后的一般思想是利用政策结果的数据(在我们的案例中是审计)来训练一种预测算法,旨在实现特定目标(例如,最大化逃避的可能性)。理想情况下,在验证样本分析后,该算法可用于指导策略(在我们的特定情况下,选择审计哪些les) 。然而,即使有详细的数据,有两个挑战使得使用ML设计和评估政策成为一项艰巨的任务。首先是Kleinberg等人(2018)所认为的选择标签问题:仅观察已内源性选择用于治疗的LES的结果。在我们的案例中,如果IRA选择审计也依赖于可能与审计绩效相关的未观察到的变量,则这个问题尤其严重。第二个问题是省略payo偏见.这是指决策者的观察可能是多维的和未被遵守的,因此,当考虑到税务机关的所有目标时,在狭隘的成功衡量标准方面不成功的审计政策可能是合理的。尽管存在这两个问题,我们的数据仍允许在评估改进审计过程的好处方面取得进展。我们提出的方法利用了一些国家共有的审计数据的具体特征,即税务机关在审计数量方面受到严重限制,以及目前未经审计的les偶尔可以在以后进行审计。这两个功能都可以在其他环境中找到 ,因此我们的策略也可以应用于其他环境。 我们首先记录ML算法可用于识别在观察到的审计集中表现特别差的审计的程度。由于我们观察税务审计和相关结果的范围,我们可以测试 我们识别在各种标准下表现不佳的审计的能力。与其他类型的政策制定者相反,税务机关的政策授权范围很窄,在决定其政策目标方面没有很大的自由度。尽管如此,他们的活动至少有两个目标:最大限度地发现逃税;并在审计过程结束时最大限度地收回逃税金额 。1这两个目标可能有所不同,因为一些审计在发现逃税方面似乎很有希望,但就可以收回的金额而言,由于纳税人可能会对审计提出上诉,因此要小得多。我们的数据集使我们能够评估这两个目标。我们表明,我们的ML算法可以根据预期逃税和预期回收逃税对审计进行准确排名。更重要的是,我们表明,被预测为表现最差的审计表现极差。取消审核中垫底的10%,只能减少3%的检测逃税;更重要的是,它还会导致回收的逃避率仅减少2.6%,这意味着省略的Payo偏差问题虽然在原则上很重要,但在实践中可能不会改变定性结论。 一旦我们确定了表现不佳的审计,下一个问题是我们是否可以用事前高级税收来取代表现最差的审计。这就是选择性标签问题开始发挥作用的地方。为了解决这个问题,我们提出了两个互补的战略。rst策略依赖于我们数据集的纵向性质来选择替换les。在意大利 (与许多其他国家一样),IRA有多年的时间来审计税收。虽然大多数企业从未接受过审计,但有些企业在后来的几年中被审计过。这个事实给了我们一个合理的反事实,我们可以实际观察到审计的真实结果:一个可审计但未经审计的let在以下所有可审计期间都是相同的,因为它指的是之前的纳税年度t.因此,我们可以将我们预测为不良的经审计的le替换为今天可用于审计但在接下来的几年中审计的le。我们认为,用同等数量的最佳未经审计的LES替换最差预测的10%的LES后审计,可以改善38%的逃税行为。当然 ,在以后被审计的那一套未经审计的les可能与一般人群不同。然而,IRA不太可能故意推迟对好人的审计。通过不审计一个好的le在时间t,IRA的代理人使该机构面临将来永远不会对其进行审计的风险(如果被未来的代理人忽视)或失去恢复能力的风险 1这些法定目标得到了财政部的指示,并在爱尔兰共和军的许多官员的采访中向我们描述了这些目标。审计师无 权偏离这些目标。 任何逃避的收入,因为一些公司可能会在IRA可以在RM资产负债表上记录索赔之前解散或破产。事实上,我们记录了几年未经审计但随后被审计的les,在发现和追回逃税方面与其他被审计的les没有根本区别。 第二种策略尝试从替换值下方绑定,而不使用ML来选择替换les。该战略依赖于这样一个事实,即IRA在资源方面受到严重限制,以至于只有约3%的独资企业被审计(相比之下,2017年法国个人收入的审计覆盖率为5%,美国EITC接受者的审计覆盖率为6%)。如果当局根据预测的绩效从拟议的审计列表中删除最低的10%的les,并用相同数量的les替换它们(以满足资源限制)随机性能,替换是否值得?可以合理地假设,对于这种边际替代,被替换的les与平均审计的les差别不大。相对于被审计的替换质量应该有多差,才能使这种替代变得不可取?我们表明,用平均审计的LES取代最差预期LES的底部10%将分别使检测到的逃税和追回的逃税增加6.7%和7.6%。事实上,即使替换的les明显低于平均水平,替换也是有利的。 使用ML指导策略决策时,一个常见的风险是在决策中注入意外的偏见。我们通过比较置换前后的大量敏感可观察特征来评估替代物可能引入偏差的程度。然而,在税务人员的关键人口特征(性别、年龄和婚姻状况)及其业务性质(家族企业状况、活动年限和雇员)方面,我们没有观察到显著差异。 2相关文献 在计算机科学和经济学的交叉点上,一个重要且不断增长的文献将ML技术应用于政策问题。例如,几篇论文提出了检测逃税的算法(Bonchi等人,1999年;机器人和洛曼2003;克利里,2011年;Hsu等,2015;阮等人,2019;吴等,2020;其中),保险欺诈(Bhowmik,2011)和欺诈性财务报表(Kirkos等人,2007)。2这些论文将注意力集中在算法的设计上 ,以预测阳性 2的SE工作受到比我们小得多的数据集的限制,通常仅限于几千名纳税人。 结果,将其性能评估限制在样本外预测的质量上,从而忽略了选择性标签问题并省略了Payo偏差。因此,它们对有兴趣决定如何分配稀缺资源的政策制定者几乎没有指导 (Athey,2017)。这个问题对于政策目的和经验解决同样重要,因为它需要关于反事实条件的信息。虽然这个问题在随机分配治疗的情况下得到缓解(例如随机审计) ,3政策干预几乎从来都不是随机的。本文是在税务审计的背景下提出这个问题的解决方案。然而,我们提出的策略可以应用于稀缺资源的任何分配问题,其中有纵向数据可用,一小部分未经处理的单位在以后处理,并且其结果在此期间保持不变。Lakkaraju和Rudin(2017),Jung等人(2017)强调了选择性标签问题对公共政策应用的重要性,他们依靠可观察量的选择假设来评估ML适用于司法判决,以释放或拘留等待审判的被告。Lakkaraju等人(2017)和Kleinberg等人(2018)依赖于这些决策的制度特征。特别是,Kleinberg等人(2018)利用案件的准随机分配给不同宽大法官:他们使用算法对宽大法官处理的案件的预测来预测更严格的法官释放的被告的结果。使Kleinberg等人(2018)能够解决选择性标签问题的制度特征可能并非在所有政策预测应用程序中都可用。我们论文的一个关键贡献是确定了选择性标签问题的替代方法。我们不是依靠随机冲击来观察标签的倾向,而是使用某些标签仅在稍后才会显示的特征。 3机构设置和数据 我们数据