您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[世界银行]:选择正确工具来衡量儿童早期成果的指导性问题:为什么、什么、谁和如何 - 发现报告
当前位置:首页/行业研究/报告详情/

选择正确工具来衡量儿童早期成果的指导性问题:为什么、什么、谁和如何

信息技术2022-02-18世界银行改***
选择正确工具来衡量儿童早期成果的指导性问题:为什么、什么、谁和如何

选择正确工具来衡量儿童早期成果的指导性问题:为什么、什么、谁和如何Adelle Pushparatnam、Jonathan Seiden 和 Diego Luna-Bazaldua介绍对儿童早年重要性的日益了解导致人们越来越渴望衡量儿童早期发展 (ECD) 的成果。现在国际上有近 150 种用于衡量 ECD 结果的工具,1 这使得为给定的测量工作选择合适的测量工具变得具有挑战性。这些工具在以下方面差异很大:它们的设计目的(为什么),适合使用的相关人群和年龄范围(谁),他们产生的关于儿童发展的信息,包括他们评估的技能、发展领域和行为(什么),它们的管理方式(如何).本文档指导用户通过为什么,谁,什么, 和如何 在选择衡量 ECD 结果的工具之前必须考虑的问题。用户应在每个步骤中记录他们的响应,以整理识别和选择合适的 ECD 测量工具所需的信息。1 有关 ECD 测量工具清单,请参阅战略影响评估基金制作的儿童早期发展测量工具包随附的 ECD 测量清单。该工具包还包含有关如何衡量 0-8 岁儿童发展的详细信息。本指导说明来自这些综合资源。公开披露授权公开披露授权 21.明确测量的目的:“为什么”清楚地确定收集信息的理由(换句话说,为什么 数据收集)是选择合适的工具来衡量 ECD 结果的主要基础。不幸的是,这一步经常被跳过,用户在决定工具之前没有首先确保该工具与其测量工作的目标完全一致。不同的工具是为不同的目的而设计的,例如在人群或系统层面监测 ECD 结果,筛查有延误风险的儿童,或评估干预措施的影响。测量目的和测量工具设计之间的不一致可能会限制所收集数据的效用以及可以从数据中得出的关于儿童发展的结论。此外,这种错位可能导致财务资源和时间的低效支出,用户可能会根据他们的目标在衡量工作上花费太多或太少。下面介绍了 ECD 结果测量的五个常见目的。人口监测包括测量给定幼儿群体的大型代表性样本的 ECD 结果。数据收集通常会产生不同时间点的横截面数据(例如,在给定背景下对 3 至 5 岁儿童的年度调查)。在人口监测研究中,重点是描述人口水平趋势的汇总信息,而不是每个孩子的 ECD 结果的个人分数。 ECD 结果往往只是作为数据收集工作的一部分进行衡量的众多方面之一;因此,为此目的的测量工作通常需要简短、整体的 ECD 测量工具。计划/影响评估测试政策或干预措施如何影响 ECD 结果。通常,数据是在多个时间点收集的(至少有基线和终点测量),并且可能会尝试纵向跟踪治疗组和对照组中的儿童样本。影响评估的实施者通常需要具有高可靠性的 ECD 测量工具,以确保以最小的测量偏差进行准确测量。2工具的领域覆盖范围将取决于干预的重点,可以包括一套整体的发展成果或专注于干预所针对的特定技能(例如,基础阅读技能或社会情感发展)。形成性评估最常使用教室内由教师/看护人或学校领导调整教学实践,向儿童提供建设性反馈,并提供更多机会来促进发展和学习。通常,形成性评估的结果不会离开课堂/学校环境,而是被教师用来为个别儿童及其整个班级提供量身定制的支持。形成性评估通常会经常重复,并且不用于高风险决策。2 信度和测量误差是心理测量中相互关联的概念。可靠性被定义为评估分数没有随机测量误差的程度;当同一个孩子使用同一工具的不同管理部门的分数保持一致时,或者当不同的调查员对同一个孩子产生相似的测试分数时,就可以获得可靠性。在工具的选择过程中,确保它有文件证明其可靠性和有效性。心理测量学专家可以在工具选择过程中就这些技术问题提供专业指导。另一方面,测量误差是指由与所测量的发展领域无关的因素引起的分数的非系统变异性。这些因素可能包括猜测、评估管理中的模棱两可或普查员分配的分数的不规则性。 步 3筛查进一步评估或诊断进行识别个别儿童谁可能有发育迟缓的风险,并帮助儿童获得进一步需要的服务。单独筛查工具的结果通常不足以诊断儿童,而是用于将儿童转介给专业人士进行进一步评估和支持。探索关系或检验假设的研究最常由学术和研究中心进行,研究儿童如何发展以及哪些因素会影响他们的发展。研究人员通常需要更严格的测量,通常在多个场合对同一个孩子进行多次评估,但通常使用比影响评估或人口监测更小的样本量。跨越上述目的的另一个考虑因素是需要在不同组和环境之间具有可比性的数据。当打算比较不同人群的 ECD 结果(例如,比较不同国家、地区或文化背景的数据)时,数据可比性很重要,但当打算比较给定内的亚组之间的结果时,数据可比性也很重要人口(例如,比较跨性别、年龄组、种族、城市与农村群体等的数据)。如果由于利益相关者的信息需求不同而需要实现多个目的,则可能需要多种方法和测量工具来服务于每个目的,因为单个工具不太可能为多种目的产生最佳数据。多种工具和方法的使用将对实现这些多重目的所需的时间、人力和财力资源产生影响。本文档末尾的表 1 说明了在选择工具时确定测量目的如何影响对其他问题的回答。 第2步。确定感兴趣的人群:“谁”识别后为什么 正在收集数据,选择 ECD 测量工具时的下一个考虑因素是谁 感兴趣的目标人群是。年龄通常是需要考虑的最重要因素——许多测量工具仅适用于狭窄的年龄范围(例如,0 至 3 岁和 4 至 6 岁是常见的年龄范围)。当对多个年龄范围感兴趣,或者数据收集希望随着时间的推移跟踪儿童时,找到一个或多个具有适当年龄覆盖范围的测量工具至关重要。区域、语言或文化方面也应该考虑到人口。一些工具被设计成具有全球相关性并以数十种语言提供,而另一些工具则专为在特定国家、背景或地区使用而定制。大多数全球 ECD 测量工具都试图捕捉发展的普遍方面,但可能会错过发展的重要特定背景方面。相比之下,高度上下文相关的工具提供了额外的深度,但可能以结果与其他上下文的有限可比性和普遍性为代价。平衡上下文相关性和全局可比性的一种方法是在测量工作中嵌入一组标准的全局项目核心,并用满足本地信息需求的上下文特定项目来补充这个核心。无论选择何种工具,在新的文化和语言环境中使用工具时,通常都需要进行翻译和改编活动。发育状况/能力感兴趣的人群影响正在使用的评估类型。在评估发育迟缓或残疾儿童时,设计用于发育正常的儿童的 ECD 测量工具可能不适合。 43.映射相关的 ECD 域或结果:“什么”这什么 衡量标准需要清楚地说明用户打算收集和使用什么样的分数。 ECD 测量工具可以生成一个整体总体得分捕获跨多个发展领域的信息 ECD 结果的发展,例如精神运动、语言或社会情感发展。测量工具也可以生成特定领域的分数专注于小范围的特定技能或发展领域。ECD 测量工具最常涵盖的一些领域包括:3认知能力包括孩子的记忆力和解决问题的能力。语言能力需要表达和理解语言。算术技能通常用于比较数量、识别和使用数字以及执行基本的算术运算。执行功能以及儿童控制抑制、集中注意力和调节行为的能力。运动技能包括精细和粗大运动技能。社交情感技能包括儿童的情感知识和冲突解决。生成工具总分的发展尝试在一个单一的工具中衡量各种发展领域。每个测量工具的域覆盖范围略有不同,但通常会尝试覆盖三个或更多域。通常用于人口监测的较短工具通常只会产生总体发展分数。特定领域的分数是根据孩子对一组特定技能的能力生成的。一些 ECD 结果测量工具侧重于更广泛的发展领域中更具体的子领域,包括精细运动技能、表达性语言技能、情绪自我识别或短期记忆。用户应详细检查每个工具所涵盖的域和子域;这些详细信息通常包含在评估框架、报告和普查员手册中。更复杂的数据收集可能需要多种工具来确保足够的领域覆盖或随着时间的推移捕捉发展趋势,特别是对于研究项目和一些计划/影响评估。特定领域的工具更常用于评估特定计划/干预对特定技能的影响的政策影响评估、量身定制的形成性评估或试图深入了解特定领域发展的研究项目。 第4步。考虑数据收集的逻辑现实:“如何”澄清后为什么,谁, 和什么 数据收集,物流现实如何 数据将收集框架有关选择哪种 ECD 结果测量工具的重要问题。下面描述的因素可以帮助确定在数据收集工作中使用哪种测量工具是可行的,特别是是否使用涉及直接的或者间接对孩子的评价。3 没有在早期儿童文献中确定的所有发育领域的单一综合清单。衡量中低收入国家儿童早期发展的工具包的表 3.1 包括九个领域,这些领域可以进一步细分为子领域。工具包中的图 2.3 还展示了不同发育领域的相关性如何在不同年龄段发生变化。 步 5教师或其他利益相关者回答有关个别儿童发展的问题。什么时候在可能的情况下,间接和直接评估工具的联合使用为从不同来源收集的数据提供了一个宝贵的机会,从而提高了给定测量工作结果的可信度。当不能同时进行直接和间接评估时,在决定是否使用直接或间接评估工具中起作用的一些因素包括:数据收集上下文可以定义哪些评估方式是可行的。如果数据收集将在 ECD 中心或学前教室进行,那么直接评估儿童或依靠教师报告的措施可能比调查父母或看护人更容易。基于家庭的数据收集工作提供了最大的灵活性。电子或电话调查使直接评估具有挑战性,通常使用父母、看护人或教师报告的评估。训练强度因给定工具的评估方式而异。虽然所有工具都需要培训以确保可靠的管理,但直接评估通常需要更长时间和更多参与的培训,以确保适当的标准化、对评估管理协议的理解和质量保证。直接评估工具通常还要求管理人员具有更多与衡量儿童发展和与幼儿互动相关的资格和/或经验。数据收集者的能力和可用的培训时间会影响测量工具管理的复杂程度。时间和频率计划数据收集的多少会影响测量工具的选择。通常,涉及直接评估需要更长时间管理的儿童的工具对于不太频繁但更深入的数据收集更有用。需要定期进行的数据收集工作通常可以通过依赖间接评估的更短且资源密集度更低的工具来更好地服务。实施测量工具的成本也因人而异。培训普查员所需的资源和实施给定工具所需的每个孩子的时间取决于工具的复杂性和评估方式。直接评估往往比间接评估更复杂,因此需要更多的时间和资源来培训普查员并在该领域实施工具。这些成本在经常大规模重复的测量工作中尤其重要,例如监测工作和形成性评估。另一方面,对于规模较小、频率较低的数据收集,使用可能更复杂的工具可能是可行的,甚至是可取的。最后,在思考的时候“如何”数据收集,值得考虑是否可以将 ECD 测量工作纳入正在进行的数据收集计划中(例如,现有的家庭调查、教育管理信息系统 (EMIS) 等),因为这可以提高收集数据所需资源的效率。也可能有以前的 ECD 测量工作由用户可以借鉴的其他利益相关者。例如,可能有用户可以使用的现有数据、已经适应给定环境的工具,或者从过去的数据收集经验中吸取的教训。直接评估工具利用训练有素的调查员按照规定的协议让儿童参与一系列游戏、任务或活动。间接评估工具依赖于父母、照顾者、 65.整合信息并选择评估在记录上述步骤提示的注意事项后,下一步是确定可能适合目的的潜在测量工具。对于这一步,参考 ECD 测量清单以获取针对 0-8 岁儿童的 147 种工具的完整列表可能会有所帮助。虽然没有通用的方法来确定每种情况的确切工具,但上述步骤与此电子表格中的列相关。通过按每个标准进行过滤,用户可以识别出满足给定 ECD 测量工作要求的测量工具子集。在确定了可能使用的 ECD 测量工具后,检查每个工具并完成以下清单,以验证该工具是否满足 ECD 测量工作的特定需求。这测量目的是明确定义的,并且该工具是为此确定的目的而设计的。这儿童发展的期望领域涵盖并包含足够的深度以允许在需要时进行特定领域的报告。这工具涵盖相关年龄。对于纵向研究或给定样本的重复测量,重要的是要确保所选工具涵盖所有数据收集时间点的相关年龄。4这评估的直接/间接性质与数据收集的访问点对齐。这评估是相关的在感兴趣的文化/语言背景下,或有足够的时间和资源来翻译和调整评估。有可用资源支付与实施该工具相关的许可费用(如果适用;一些工具是免费的并且可以公开使用)培训要求考虑到普查员的能力、可用于培训的时间和可用资源,这些是合理的。数据收集成本和时间要求考虑到所需的数据收集频率是合理的。结论近年来,ECD 测量工具激增