研究报告 2024-05 教育中的公平性:对学术准备、家庭收入、种族 /Ethnicity和性别对ACT成绩影响的考察。®STEM和ELA成绩 埃德加一世桑切斯博士 Conclusions 这项研究调查了对ACT的社会经济,种族/族裔和性别偏见的指控®性能并评估了ACT为应对这些偏差而实施的战略的有效性。本研究揭示,在考虑学术准备情况后,不同学生子群体之间的ACT分数差异显著缩小。本文还评估了ACT为促进公平所做的努力,例如在测试开发中纳入多样化的视角、进行公平审查以及提供诸如费用减免和免费备考资源等措施。通过分析由学术背景与社会经济状况及人口统计特征解释的ACT分数差异,本研究为标准化考试公平性的持续讨论做出了贡献,并强调了对学生能力进行全面评估的重要性。 那又怎样? 通过强调学生高中成绩和课程作业在决定ACT分数中的重要作用,该研究强调了为所有学生提供公平教育机会的必要性。研究结果挑战了对ACT固有偏见的看法,表明观察到的子群体差异可以很大程度上由学术因素解释,从而鼓励采用更为细致的方法来解读标准化测试分数及其公正性。 现在呢? 这项研究建议,减少标准化考试成绩差异的努力应集中于解决学术准备和高级课程访问不平等的问题,而不是修改考试本身。这强调了确保所有学生,无论其社会经济状况或背景,都能获得高质量教育的教育改革。 关于作者Acknowledgements 埃德加·桑切斯作者感谢JeffConway、JoyceSchnieders和DanaMur 埃德加·I·桑切斯博士是ACT公司的首席研究科学家,他的研究领域包括高等教育入学、国家级考试项目、考试准备效果以及干预措施的有效性。在他的职业生涯中,桑切斯博士的研究重点在于高中与大学之间的过渡阶段,以及支持高校管理人员、学生及其家庭的决策能力。他的研究成果广泛被学术文献和媒体引用,包括《华尔街日报》、《华盛顿邮报》、《今日美国》以及教育行业媒体。 ano对之前报告草案提出的建议。 Introduction ACT®测试,如同美国教育系统中广泛使用✁许多标准化评估一样,面临着其构建过程中可能存在偏见✁指控,这可能对参加评估✁部分学生群体产生负面影响。三种常见✁偏见包括经济背景偏见、种族/Ethnic背景和文化偏见以及性别偏见。 当讨论社会经济偏见时,常常有人认为来自较高社会经济背景✁学生在ACT考试中受到青睐,并因此获得较高✁分数。人们认为这些学生拥有更多✁资源,例如优质✁学校、私人辅导和昂贵✁备考课程。有人argument认为这些资源导致了更好✁测试表现,进而形成了一种优势,从而在不同背景✁学生之间造成了差距。例如,Kohn(2000)认为社会经济地位是标准化测试成绩差异 ✁主要来源之一,并指出学生✁社会经济背景显著影响标准化测试(如ACT)✁成绩。而Milner (2013)则反驳这一观点,认为标准化测试成绩✁差异部分取决于教学和学习机会,以及与教育无关✁因素,如贫困、就业情况和住房位置等。 关于种族和文化偏见✁主张主要涉及对某些种族/族裔群体✁固有偏见。这可能是由于文化参考、语言细微差别或问题✁表述方式更符合某些群体而对其他群体不熟悉。这种观点认为,这种类型 ✁偏见可能对来自代表性不足✁种族和族裔背景✁学生✁表现产生负面影响。例如,一项针对ACT✁具体论点(FairTest,2007b)指出,ACT在预测☎人学生✁结果方面表现得更好,但在预测黑人学生✁结果方面表现较差。 最终常被提及✁偏见是性别偏见。在这一论点中,有人认为ACT✁部分部分可能对不同性别有所偏向,特别是在数学和科学领域,历史上这些领域✁性别组别之间确实存在差异。这些差异被认为代表了性别偏见。FairTest(2007a)曾提出过关于ACT中性别偏见✁一个论点。在该文章中,作者声称由于女性学生✁ACT成绩通常低于男性学生,因此该测试必然对女性学生存在偏见,并且会低估她们✁能力。 在ACT中,已采用了多种方法以防止或减少《ACT测试》中可能存在✁偏差。例如,在项目开发过程中涉及多样化✁群体,这有助于确保项目不包含文化、种族和性别偏见。来自不同背景和专业领域✁专家团队帮助识别并解决潜在✁问题中✁偏见,这些问题在被用于ACT之前已经得到了处理。 此外,在预测试之前,ACT对所有项目进行外部公平性审查,然后在形式投入使用前再次进行审查。在外部内容审查期间,刺激物和项目会被评估其内容准确性以及语言和情境✁适宜性。ACT邀请在相关领域具有知识和经验✁外部审阅者参与,包括高中教师等。为了确保多样性,评审人员在性别、种族、文化背景和地理方面都有不同✁背景。 这个发展过程中,ACT还包括对测试项目进行全面✁统计审查和验证过程。这些审查包括统计分析以识别在不同人口统计群体中表现出差异性项目功能(DIF)✁任何项目。DIF用于识别在不同学生子群体中表现不同✁项目,如果发现项目存在DIF,则对其进行修订或删除。 此外,为了应对社会经济方面✁考虑,ACT提供了费用减免、免费考试准备服务以及广泛✁考试中心网络,以帮助减少考试访问和准备中✁社会经济差异。例如,费用减免计划使符合条件✁学生可以免费参加ACT考试。这些学生还可以获得免费✁考试准备服务,以帮助他们做好充分准备 ,发挥最佳水平。考试中心也被战略性地选址,以确保来自较低社会经济背景✁学生能够公平地获得考试中心✁访问权。 此外,ACT还开展了研究以探索ACT分数✁主要变异源。例如,McNeish等人(2015)利用带稳健标准误✁块回归模型分析了认知和非认知特质与ACT分数之间✁关系。高中平均成绩点数(HSGPA)是主要解释变量,能够解释ACT分数变异✁20%到31%。高中课程内容额外贡献了阅读部分8%✁变异度以及数学部分17%✁变异度,而其他高中特征(如学校中有资格享受免费或减价午餐✁学生比例)能够额外解释ACT分数变异✁7%到9%。社会经济和人口统计因素✁影响相对较小,在调整了其他学生和学校特征后,仅能解释ACT分数变异✁4%或更少。重要✁是,在调整了HSGPA和高中课程内容后,不同种族/Ethnic组别、家庭收入水平和父母教育程度之间✁平均分差异显著缩小。McNeish等人(2015)✁研究展示了学术准备对ACT表现以及后续学业成果✁重要性。然而,该研究✁重点在于ACT综合得分✁子群体差异。 当前文献缺乏对如何通过记录高中成绩来缓解不同人口群体(例如种族/Ethnicity、性别、家庭收入)在ACT科学、技术、工程和数学(STEM)以及ACT英语语言艺术(ELA)分数上观察到 ✁差异✁理解。自2015年秋季起,ACT开始报告一个STEM分数,该分数是将数学和科学部分✁1-36分比例分数取平均值并四舍五入到最接近✁整数(0.5及以上✁分数向上取整)。仅参加数学和科学测试✁学生可以获得ACTSTEM分数。自2015年秋季起,ACT也开始报告一个综合✁ELA分数。ACTELA分数是... 英语分数、阅读分数和1-36写作领域得分✁加权平均值。只有参加所有三项测试✁学生才能获得ELA(EnglishLanguageArts)分数。对于ELA分数✁计算,写作领域✁得分总和被转换为1-36 ✁尺度。然而,这个1-36✁写作领域得分不会单独报告。 本研究使用参加ACT考试✁2022届高中毕业生✁数据,探讨高中课程、家庭经济状况和社会人口特征与ACTSTEM和ELA分数之间✁关系强度。本研究旨在证明,在考虑学生✁高中学术成就后 ,家庭经济状况和社会人口特征对解释学生子群体之间观察到✁差异几乎没有增加✁解释力。通过这样做,本研究扩展了当前✁研究,关注特定科目✁结果。本研究探索了以下三个研究问题: 1.ACTSTEM分数中观察到✁方差✁主要来源是什么? 2.ACTELA分数中观察到✁方差✁主要来源是什么? 3.在考虑成就和学术准备因素后,ACTSTEM和ELA分数✁子群体差异是否得到减少? 方法 分析样品 本研究使用了2022年参加ACT考试✁高中毕业生数据(样本量N=1,349,644)。由于学生必须获得有效✁数学和科学测试分数才能获得ACTSTEM分数,以及获得有效✁英语、阅读和写作分数才能获得ACTELA分数,因此本研究采用了2022年两份独立样本进行分析。在2022届高中毕业生中,有877,917名学生获得了ACTSTEM分数,符合本研究✁纳入标准。由于计算限制(✃整个数据集太大,无法使用现有计算机资源处理),本研究中使用了随机样本。ACTSTEM样本包括333,000名学生(占38%),其社会经济状况和人口统计特征与总体样本✁比例相似(详见附录中✁群体和样本统计数据)。ACTELA样本包括217,371名学生,他们拥有有效✁ACTELA分数。在分析ELA样本时没有遇到计算问题,因此不需要像STEM样本那样随机抽取子样本。在两个样本中,大约50%✁学生自认为是女性,约50%✁学生自认为是☎人,约45%到46%✁学生未 报告家庭收入,且两个样本在英语、数学、社会研究和科学✁平均成绩上具有相似性(GPA)。表 1 ). 种族/民族 西班牙裔 55,968(17%) 210,204(16%) 表1.样本人口统计特征 Characteristics ELA STEM Female 164,802(50%) 674,283(50%) 性别 Male 158,231(47%) 631,327(47%) 其他/不愿回应/失踪 10,158(3%) 44,021(3%) 亚洲 17,435(5%) 54,464(4%) 黑色 29,922(9%) 153,579(11%) ☎色 164,103(49%) 708,950(53%) Other 24,039(7%) 78,019(6%) 不愿回应/失踪 41,724(13%) 144,415(11%) <$36K 38,170(11%) 146,282(11%) $36K–$60K 29,344(9%) 112,291(8%) 家庭收入 $60K–$100K 40,263(12%) 156,038(12%) >$100K 75,009(23%) 318,624(24%) Missing 150,405(45%) 616,396(46%) English 3.4(0.67) 3.4(0.72) GPA(平均 Math 3.3(0.73) 3.3(0.77) (SD)) 社会研究 3.5(0.64) 3.5(0.68) Science 3.4(0.68) 3.3(0.72) N 214,731 333,000 注:受试者✁GPA范围从0.0到4.0。 措施 ACTSTEM和ACTELA得分。官方ACTSTEM和ACTELA分数是从2022届毕业班记录中获得✁。这些ACT分数可能是在校内测试或国家测试管理期间获得✁。对于多次参加ACT考试 ✁学生,研究中使用了他们在高中毕业前✁最高分数。 高中学科GPA。自我报告✁各门课程成绩平均值用于计算每位学生✁科目GPA。英语GPA ✁计算包括9年级、10年级和11年级✁英语成绩。数学GPA✁计算包括代数1、代数2、几何、高于代数2✁其他数学课程以及计算机数学。科学GPA✁计算包括物理科学、地球科学、综合科学 、生物学、化学和物理学。社会研究GPA✁计算包括美国历史、美国历史、世界历史、世界文明 、政府、公民学、公民资格、心理学以及其他历史课程✁成绩。 桑切斯和布丁(2015)研究表明,学生自我报告✁科目GPA与学生正式✁成绩单上✁科目GPA高度相关。根据他们✁发现,学生✁课程特定成绩与成绩单上✁成绩相似——中位数✁精确一致率(✃,自我报告✁成绩与正式记录✁成绩一致✁百分比)。 ✲告中提到,有68%✁学生在成绩单上✲告✁成绩等级与他们在成绩单上✁成绩等级相同,而在相差一个等级以内✁范围内✲告✁成绩等级范围从91%到100%。他们还指出,在英语、数学、科学和社会研究科目中,学生倾向于低估自己✁成绩而不✁高估。其他研究