战场县的种族和代表性 2020年总统大选中选民投票率和投票拒绝的种族差异分析 技术附录 HIGHTS 本研究以视觉化方式呈现了2020年总统选举的11个县区数据,这些县位于7个关键选区州。具体来说,本研究展示了亚特兰大、夏洛特、克利夫兰、底特律、密尔沃基、凤凰城、费城、匹兹堡和罗利-达勒姆大都会地区的投票站选民参与率和弃票情况。这些11个县的人口构成也包含在可视化中。对数据的分析表明,种族不平等是一个重大威胁,公平代表性的挑战在于整体选民参与度较低,弃票率在主要由有色人种组成的投票站更高。此外,分析还揭示了关于大规模非法投票的说法是错误的。 丽莎·戈登·罗杰斯MichaelLatner 克里斯托弗·威廉姆斯 2024年8月 www.ucsusa.org/resources/race-and-representation-战场县https://doi.org/10.47923/2024.15576 CONTENTS 数据透明度和民主问责3 谁投票,谁投票?3 研究设计5 选择标准5 县级比较6 表1.县级选举和投票结果7 表2.2020年数据可用性8 2020年投票率的不平等9 表3.2020年区级登记道岔10 图1.2020年按人口普查定义的种族群体划分的登记选民投票1率2 表4.2020年投票率与地区种族多数关联的多元分1析3 投票中的累积不等式13 表5.2020年选票问题14 图2.2020年登记道岔16 图3.每个投票拒绝类别17中的区域比例 Table6.MulticanalysisofBallotrejectionsasafunctionofprecinctturnoutandracialma1jo8r 作者18致谢18参考文献1 9 数据透明和民主问责 谁投票,谁投票? 政治参与的研究长期以来确立了资源与关系在培养政治兴趣和行动中的重要性。一系列广为人知的研究概括了政治参与的三重能力逻辑:人们参与1)因为有能力(利用时间、信息和技能等资源),2)因为有意愿(具有兴趣和参与度),以及3)因为有人邀请他们参与(通过招募和网络建立来动员)(Verba,Schlozman,andBrady,1995,p.15)。 缺乏连接共享资源、参与规范和组织活力的选民的社会网络背景下,社区可能缺乏能力行使其政治声音 (Bond等,2012;Carlson、Abrajano和Bedolla,2019;Rolfe,2012)。美国民主受到持续的阶级和种族不平等的困扰,部分原因在于这些条件在不同群体间分布不均(Schattschneider和Adamany,1975;Schlozman、Brady和Verba,2018)。 这部分分析受到认识的影响,即政治制度,特别是选举规则,会产生选择性压力,塑造参与资源的发展、参与激励以及招募和动员的机会(Burden等,2016;Cox,2015;Davidson和Grofman,1994)。 自第二次重建和1965年《投票权利法》的实施以来,评估参与度和政治平等的主要指标之一是不同种族人群之间的选民参与率差异,也被称为种族参与差距(Morris和Grange,2024;Fraga,2018)。近期的研究表明,从重新划分选区的结果到注册名单管理、投票方式和身份验证要求等选举法律,对不同种族群体的投票倾向性、投票能力以及选票被计入的概率有着不同的影响(Fraga,2016;Fraga和Miller,2022;Morris和Pérez,2018)。选举法律的变化可能会以加剧现有不平等的方式进一步扭曲种族代表情况,这取决于其实施方式(McDonald等人,2024;Shino、Suttmann-Lea和Smith,2022)。 理解选举规则和程序如何影响选民参与度,以及确定选举操作是否对某些选民产生歧视性影响的程度,需要可靠的记录,包括谁投票、如何以及在哪里投票、如何计票、关于验票的详细信息以及每张被计入或否决的选票的结果。遗憾的是,系统地描述最终产物——各投票站级别的选举结果——是一项艰巨的任务,涉及收集、清洗和标准化来自不同地方管辖区的数据,且对于数据质量没有多少保证(Baltz等,2022年)。在前端,从聚合的选民文件中获取的注册选民和单个选民参与记录在覆盖率和准确性上存在差异,这在一定程度上是由各地区的出版要求、内容和格式差异所决定的(Igielnik等,2018年;Willis 、Merivaki和Ziogas,2022年)。选举数据的质量(包括选票)的完整性和准确性对于确保选举过程的公平性和透明性至关重要。 在县一级层面,由于数据报告的一致性问题和数据透明度的缺口,验证、拒绝以及相关信息的评估即便是在州级选举数据透明度有所提升的情况下(Merivaki和Smith,2020;国家城市联盟,2022;StewartIII,2020;StewartIII,2018),仍然具有挑战性。 研究设计 本分析代表了科学与民主中心Precinct分析项目的第一阶段研究,旨在评估关键选区的选民数据透明度。分析的目标包括: •增强对不同社区选民参与率和弃票率不平等性的认识与理解 •提升向公众普及选票验证过程及计票过程中审查工作能力 •确定数据生成与发布的最佳实践,并开发流程以减少选票处理过程中的投票者及行政错误 为了实现这些目标,研究团队确定了一组关键性的选举管辖区域样本:宾夕法尼亚州的阿勒格尼(匹兹堡)和费城县;北卡罗来纳州的哥伦布、杜伦和梅克伦堡县;俄亥俄州的克里夫兰(库亚豪加)和洛兰县;乔治亚州的亚特兰大(福坦县);亚利桑那州的马里科帕县;威斯康辛州的密尔沃基县;以及密歇根州的底特律(韦恩县)。研究关注的量包括选区级别的注册选民参与度数据;接受的选票数量;缺席 、补充和预填选票的投递、计数及被拒情况;以及拒收的原因。通过公民投票年龄人口(CVAP)的种族人口统计数据和地理选区形状文件数据(或投票人登记区VTDs),可以进行地理空间数据分析展示。 通过开发一个ArcGISStoryMap来推进分析。StoryMaps是一种基于网络的应用程序,允许作者以叙述性文本的形式分享地图和地理编码数据。以下的统计分析包括了根据人口普查定义的种族群体在2020年的投票参与率和弃票率的一般描述性统计信息,以及针对州县固定效应的多变量分析,以此控制这些结果 。 选择标准 研究小组根据三个标准选择了司法管辖区。首先,根据管辖权在确定总统选举结果方面的重要性来选择管辖权。这些县通常是战场州中人口最多的县,在过去的几次总统选举中,这些县在决定选举团的结果方面至关重要。我们还在这些州内选择了更多的农村县,以解决投票行为中可能存在的城乡差异。其次 ,这些县中的许多县在2016年和2020年都明确成为压制选民的目标,至关重要的是,这些县是特朗普 竞选团队指控广泛的选民欺诈(大谎言)和共和党推翻2020年选举的主要目标。 在2016年和2020年,特朗普竞选团队多次指控这些所谓的“大城市中心”是民主党党派“作弊”的源头(Brownstein,2020;Graham,2016)。推翻2020年选举结果的法律努力也集中在对这些县的选票认证和欺诈指控上(Broadwater&Eder,2023;Eggers,Garro,&Grimmer,2021)。第三点, 这些相同的司法管辖区将在2024年的选举中扮演关键角色,并再次成为挑战选票和操纵选举结果认证努力的目标(Latner,2022)。 县级比较 在很多方面,这些地区的选举结果反映了全美选举管理人员所面临的模式和挑战。表1展示了从2016年和2020年的《选举管理与投票调查全面报告》中获得的县一级选举结果。对于本次分析而言,多个关于选票验证和否决的相关模式是关键点。 首先,由于COVID-19疫情的影响,从2016年到2020年,邮寄选票/缺席选票的使用出现了显著增加。这种投票方式的重大转变伴随着我们11个县中7个县的预审票数量减少,而阿勒格尼、哥伦布(小)、福廷和费城县的预审票数量则有所增加。 其次,尽管这些县的许多选民使用了新的或不同类型的选票进行投票,但选票被拒率下降每了一。个在 我们的分析中,这一现象在很多情况下以显著的比例出现。这一结果归因于多种因素,包括对投票验证流程的加强培训和关注、以及针对选民如何正确填写选票的公共宣传活动(Frontline2020;Persily和Stewart2021)。 第三,由于选民未正确注册、身份识别不当或签名不符(用于验证资格)导致被拒收的选票数量和比率在不同选举和管辖区之间变化显著,在某些县份,因这些原因被拒收的选票数量达到数千张。在2016年和2020年的两次大选中,每一张投出的选票都经过了严格的验证流程,许多选票因各种原因被拒收,包括选民无法证实其资格。这是关于那些投票但未正确注册或当时不符合投票条件的人数的记录观察结果 。在研究中的每一个县份,因这些原因被拒收的选票数量最多占总投票数的1%。这些结果进一步证明了2016年和2020年的大选中不存在广泛的选民欺诈行为。从民主合法性的角度来看,更令人担忧的是,被拒收的大部分选票可能是符合联邦公民身份和年龄要求的人所投的。 异常或非典型的离群值(如0%或100%的投票率、被拒绝的预审票等)在数据中出现频率较低,原因有几点。首先,大多数事件分布包含极端但罕见(远离平均值)的事件,这就是它们被称为离群值的原因 。在数千个投票站中,几乎可以肯定存在几个无人居住或不投票的地点。其次,异常值可能反映在获取 、记录和汇总原始人口普查和选举数据时未被发现的人类错误。第三,错误可能源自将个人或较低级别 (如街区)的数据聚合到VTD边界的过程。我们并未进行系统比较选民文件中投出的选票数量与各投票站的总票数,但在分析过程中并未发现重大差异。手动分析数据聚合和插补的准确性(识别不同数据集之间不兼容或缺失的数据,或来自同一数据源的多个来源具有非常不同的结果)导致移除了无法纠正差异或存在大量缺失数据的投票站。表2提供了用于分析的选举事件数据信息。 表1.县级选举和投票结果 县 已注册选民 已注册道岔 Mail-in选票 暂定选票 Mail选票拒绝 暂定选票拒绝 拒绝rate Eligibility问题 Signature问题 阿勒格尼 2016 924,631 654,841 31,762 2,220 NA 1,081 NA 1,315 NA 阿勒格尼 2020 937,910 729,838 344,841 17,668 2,482 3,127 1.5% 1,501 801 哥伦布 2016 36,626 23,446 485 283 12 128 18.2% 105 12 哥伦布 2020 37,056 26,519 2,086 294 54 126 7.6% 121 35 Cuyahoga 2016 890,626 617,350 191,566 19,396 1,351 3,237 2.2% 2,700 558 Cuyahoga 2020 888,556 631,199 314,898 18,051 1,291 2,307 1.1% 1,908 832 达勒姆 2016 232,725 151,376 4,826 1,926 153 1,037 17.6% 920 91 达勒姆 2020 245,199 180,568 46,390 1,246 396 839 2.6% 691 368 富尔顿2016 741,634 433,036 21,625 2,528 926 1,300 9.2% NA NA 富尔顿2020 836,563 527,532 146,029 4,047 69 449 0.3% 436 18 Lorain2016 206,401 143,296 33,230 4,001 150 517 1.8% 469 28 洛兰2020 218,501 158,732 61,846 3,877 171 496 1.0% 4