授权公开披露 政策研究工作文件10695 记录时分 基于智能手机和召回的时间使用测量方法的比较研究 TalipKilicGayatriKoolwal 授权公开披露 WilbertDraziVundruThomasDaumHannesBuchwaldGregSeymourPeterMvulaAlisterMunthaliMoniceKachinjika 发展经济学发展数据集团 2024年2月 政策研究工作文件10695 Abstract 基于马拉维的一项随机调查实验,本研究探讨了时间使用数据收集中的创新技术如何与传统的基于召回的时间使用测量相回避测量问题。该实验将家庭和成年男女的随机样本分配给两个治疗组之一的时间使用测量:传统的24小时回忆时间使用日记和自我管理的基于智能手机的图片时间日记,称为TimeTracer应用程序,用于实时数据收集。与召回部门相比,智能手机部门的男性和女性参与就业和无偿家务和护理工作的比例都较高。由此产生的性别差距估计虽然仍然很大,但在智能手机中却缩小了。 手臂,除了估计性别差距增加的护理工作。召回处理导致下午6点之后的活动大量减少,否则这占了智能手机手臂每日报告时间的近30%。同样,在召回机构中,同时活动的程度,特别是在妇女中,明显较低。然而,由于用于记录24小时召回日记的活动的持续时间至少为15分钟,因此召回臂的总体报告时间更高,而超过三分之一的活动在智能手机臂中持续不到15分钟。分析还表明,使用程式化的时间使用问题进行7天的召回 ,而不是24小时的召回日记,会导致报告的就业和无薪工作时间的高估。 本文是发展经济学发展数据组的产物。这是世界银行为开放其研究并为世界各地的发展政策讨论做出贡献的更大努力的一部分。政策研究工作文件也在http://www上发布。世界银行。org/prwp.可以通过tilic@worldba与作者联系。org和goolwal@worldba。 政策研究工作文件系列传播了正在进行的工作结果,以鼓励就发展问题交换意见。该系列的目标是快速得出发现,即使演示文稿还不够完善。论文带有作者的姓名,应相应地引用。本文表达的发现、解释和结论完全是作者的观点。它们不一定代表国际复兴开发银行/世界银行及其附属组织的观点,也不代表世界银行执行董事或它们所代表的政府的观点。 由研究支持团队制作 录制时间划分: 基于智能手机和召回的时间使用测量方法的比较研究 塔利普·基利卡,加亚特里·库尔瓦拉,威尔伯特·德拉齐·文德鲁亚,托马斯·道姆,HannesBuchwaldc,GregSeymourd,PeterMvulae,AlisterMunthalie,MoniceKachinjikae1 JEL代码:C83,J16,J22。 关键词:时间使用,就业,无报酬工作,召回偏差,智能手机时间使用日记,调查方法,家庭调查,性别,马拉维,撒哈拉以南非洲 1通讯作者:TalipKilic(tkilic@worldbank.org)和GayatriKoolwal(gkoolwal@worldbank.org)。a世界银行;b 哥德堡大学;c独立顾问;d国际粮食政策研究所;e棕榈咨询公司。马拉维时间使用计量方法学实验是在世界银行生活水平计量研究(LSMS )计划下,与促进性别平等措施(MAGNET)倡议和PALM咨询公司合作实施的,后者实施了实地工作。这项研究得益于国际农业发展基金 、世界银行变革知识方案和世界银行两性平等伞式基金与比尔和梅林达·盖茨基金会合作提供的资金。作者感谢AdreyProhoreo(软件编程)和NatalisLorez(插图),他们在设计用于本研究的TimeTracer智能手机应用程序的版本方面发挥了重要作用;以及DiegoZardetto协助采样设计。我们感谢NacyFolbre和HazelMalapit对本文的宝贵意见,以及2023年国际食品政策研究所RISE会议的参与者的反馈。第九届国际农业统计会议(ICAS),马里兰大学时间使用和福祉测量会议以及世界银行发展数据小组让我们谈谈数据研讨会。 1.背景 关于个人时间使用的代表性调查对于理解男女经济决策和强调家庭内部和家庭之间更广泛的不平等非常重要。有效设计、确定目标和评价与劳动力发展、提供儿童保育和改善运输服务等有关的政策/项目,还需要准确衡量不同亚群体中男女的时间使用和时间使用差异。 可用的时间使用调查显示,在不同活动的时间分配方面,包括无偿家务和护理工作,这在劳动力调查和社会经济家庭调查中经常被遗漏(Charmes,2019;Hirway,2017)。虽然各国以不同的格式实施了时间使用数据收集— —无论是作为独立时间使用调查的一部分,还是作为劳动力调查或社会经济家庭调查一部分的时间使用模块的一部分,低收入和中等收入环境中的时间使用数据收集要么依赖于采访者协助的基于回忆的时间使用日记——通常是过去24小时,要么依赖于回忆程式化的问题,即在给定的参考期内,可以是最后一天、最后7天或最后30天(妇女署,2021年)。 这些调查设计选择引起了人们对回忆时间使用中潜在认知错误的担忧(Seymor等人。,2020年),特别是在识字和计算能力较低、经济活动难以预测的情况下,包括在小农农业盛行的国家(Arthiet。艾尔,2018;菲尔德等人。,2023)。3串联进行的活动也可能更难以回忆,这取决于活动发生的频率(规律性)以及与其他活动的可区分性(显着性)(Meo,1993;Brow等。,2007)。这些错误也可能在较短的参考期内发生(Sdma和Bradbr,1973)。 尽管这些测量挑战可能对我们对时间使用中的性别差异的理解(Floro和Miles,2003;Bdig和Folbre,2004)以及依赖于时间使用数据的分析应用有直接影响,包括设计和评估对性别问题有敏感认识的政策,以改善男女的经济机会和福祉(世界经济论坛,2021年;Kig等。,2021),很少有证据表明依赖基于召回的调查方法可能会如何影响时间使用数据的准确性和可靠性。基于回忆的日记实施起来也很耗时,最近的工作也很耗时(Field等人。 ,2023年,国际劳工组织,2023年;Folbre,2021年)讨论了简化时间使用日记的作用(例如,通过减少或汇总活动类别的数量),作为更密集的数据收集的替代方案。 2但是,在这些方法中,各国和年份之间存在很大差异-例如,包括报告的活动集的选择;参考期的长度;对自我报告和代理报告的依赖;采访员援助的程度;以及时间使用数据收集是作为独立调查还是现有家庭调查的一部分设计的(请参阅联合国妇女署,2021年,用于讨论 )。也使用了没有预定义时间间隔的开放式日记,但很少使用(参见Chatzitheochari等人。,2018,用于讨论)。 3农业遵循固有的不规则时间表,通常由农民无法控制的因素决定,例如气候变化,并且农业中涉及的特定任务通常非常重复(例如除草 ,收获和分类)。 在此背景下,我们提出了在马拉维进行的大规模随机调查实验的新发现,以记录基于召回的时间使用调查数据收集方法的相对准确性。该实验将家庭和成年男女的随机样本分配给两个治疗臂中的一个时间使用测量:传统的24小时回忆时间使用日记;和一个自我管理的基于智能手机的图形时间日记,称为TimeTracer应用程序。虽然在高收入环境中的其他调查中已经探索了实时数据收集的使用时间(Gershy等人。,2020年),我们的研究是迄今为止在低收入国家实施的规模最大的研究,扩展了关于基于智能手机的时间使用数据收集的可行性和实用性的新生证据基础-以前仅适用于赞比亚,尽管适用于小得多的农村样本(Dam等人。,2018年,2019年)。除了我们工作的方法论贡献外,我们还揭示了有关日内变化和时间使用同时性的新的政策相关见解。 该分析比较了11天报告期内两个调查治疗组的男性和女性自我报告的时间分配,以对较短(24小时)和较长 (7天)召回期的实时和基于召回的调查方法进行分类,比较分析: (1)在第一个治疗部门中,每个家庭中的一名成年男子和成年女子(15-64岁)都收到了一个基于Adroid智能手机的图形时间使用日记应用程序,称为TimeTracer4,可以连续,实时地自我报告他们在一系列活动中的时间使用情况。该应用程序是专门为低识字率环境中的时间使用数据收集而开发的(Dam等人。 ,2018),受访者不一定有基于时钟的时间概念,也没有智能手机的先前经验。 (2)在第二治疗组,在本报告所述期间,每个家庭的一名成年男子和成年妇女在不同的三天接受了传统的基于回忆的24小时日记访谈,面试官要求受访者回忆过去24小时的时间分配,并根据受访者的叙述将报告的活动编码为15分钟的间隔,每个15分钟的间隔最多可以记录两个同时进行的活动。召回日记臂中的报告涵盖了与智能手机臂中相同的活动设置。 (3)最后,在本报告所述期间结束时,两个治疗组的受访者都收到了一个程式化的基于访谈的7天召回模块 ,涵盖了智能手机/召回日记方法中的一部分活动。7天模块遵循劳动力调查或社会经济家庭调查中通常实施的结构(Seymor等人。,2020),并允许我们调查相同的群体在不同长度的召回期内如何改变他们的反应。 我们的发现涵盖了三个关键领域,对文献有重要贡献。首先,关于不同活动的参与和时间,我们表明智能手机和召回武器提供了非常不同的观点,以及在两个武器中突出显示的活动集的有趣二分法。例如,回想一下,导致参与就业和无偿工作的报告不足,包括较低的。 4时间追踪器最初是由霍恩海姆大学和应用科学研究所(斯图加特传媒大学)(Daum等人,2018年,2019年)开发的,并在世界银行 LSMS支持下增强了这项研究。 农村妇女分担护理工作。另一方面,我们观察到召回部门对休闲和自我护理活动的参与度更高,包括个人护理,睡眠和食物消费。重要的是,智能手机部门还反映出男性更多地参与无偿工作的不同领域-因此,与召回部门相比,智能手机样本中无偿工作的性别差距虽然仍然很大,但仍在缩小。此外,我们表明,在召回部门中,男性和男性以及城市和农村地区,大多数活动的总报告时间平均较高。这一发现的主要驱动因素是设置24小时时间使用日记,以15分钟为间隔记录活动,而智能手机部门报告的活动中约有三分之一实际上持续不到15分钟,其中非农业就业,无偿家政和护理工作以及自我护理活动占这些任务的最大份额。鉴于时间使用日记的15分钟结构的常见用法(联合国妇女署,2021年;Seymor等人。,2020年),我们的发现强调了这种结构如何导致“四舍五入”和高估报告时间。 其次,智能手机数据收集提供了关于全天进行的活动的多样性和频率的更深入的见解,并且相对于召回治疗部门,彼此同时进行的活动(特别是非休闲活动)的发生率明显更高。这些关于时间分配的细微差别也可以帮助解释我们在召回部门中观察到的参与活动的一些下降。例如,回想一下,导致傍晚时分(下午6点之后)活动时间的报告大幅下降,尤其是在女性中。这些时间占日常时间的很大一部分-在智能手机领域,女性约占日常时间的26% ,男性占日常时间的29%。我们讨论了召回部门晚上活动的漏报可能是由于受访者疲劳-因为每次召回面试可能持续30到40分钟-以及其他与面试相关的因素。我们还讨论了智能手机数据收集中与活动相关的弹出式窗口如何记录其他儿童的存在,可能突出了被动儿童保育的一个重要但未得到充分研究的维度(Folbre,2005),超出了受访者自己对儿童保育的估计。 第三,我们表明,与24小时召回日记相比,具有7天参考期的程式化召回模块对报告的每日时间的估计甚至更高。因此,从实时数据收集到24小时召回,再到7天召回,导致对就业和无偿家务和护理工作的时间分配的估计增加。最近对农场劳动的研究(Arthi等人,,2018;加迪斯等人。,2021)还发现更长的召回期(例如。Procedre,在过去30天或过去的季节相对于过去7天)高估了劳动时间。 我们的发现在不同的报告日是一致的,并且治疗效果对于