阿拉伯联合酋长国 基金组织第22/303号国别报告 2022年9月 技术援助报告——价格指数使命的享乐方法 这份关于阿拉伯联合酋长国的技术援助报告由国际货币基金组织的一个工作人员团队编写。它基于 2022年1月完成时可用的信息。 本报告的副本可从以下网址向公众索取 国际货币基金组织出版服务邮政信箱92780华盛顿特区 20090电话:(202)623-7430传真:(202)623-7201 电子邮件:publications@imf.org网址:http://www.imf.org价格:每份印刷版18.00美元 国际货币基金组织华盛顿特区 ©2022国际货币基金组织 米拱 2022 üNITED一个RAB乙海盗 R电子报告H爱多尼克米方法磷白饭我NDICES米任务(J一年一度16−20, 万达·格雷罗(VandaGuerreiro)编写 本报告的内容是国际货币基金组织(IMF)工作人员应阿拉伯联合酋长国当局的技术援助请求向其提供的技术建议。基金组织可向基金组织执行董事及其工作人员以及技术援助接受方的其他机构或机构披露本报告(全部或部分)或其摘要,并应他们的要求,向世界银行工作人员披露,以及其他具有合法利益的技术援助提供者和捐助者,除非技术援助接受者明确反对此类披露(请参阅技术援助信息传播操作指南)。发布或披露本报告(全部或部分)或 向基金组织以外的各方提供摘要,而不是TA的机构或工具 受援国、世界银行工作人员、其他技术援助提供者和具有合法利益的捐助者应征得技术援助受援国和基金组织统计部的明确同意。 内容 词汇表 3 任务成果和优先建议摘要 4 详细的技术评估和建议 6 A.雷比 6 B.网页抓取 9 C.任务期间会见的官员 11 数字1.数据结构 7 2.REPI的当前结构7 3.REPI的推荐结构8 4.R代码的打印屏幕,供参考8 5.将WebScraping集成到CPI11 桌子 1.优先建议5 2国际货币基金组织 词汇表 COICOP个人消费按目的分类CPI居民消费价格指数 DLD迪拜土地局 DSC迪拜统计中心 REPI房地产价格指数 RPPI住宅物业价格指数技术援助 阿联酋阿拉伯联合酋长国 国际货币基金3 任务成果和优先建议摘要 1.应迪拜统计中心(DSC)的要求,技术援助(TA)任务于1月16日远程进行−20,协助在消费者价格指数(CPI)和房地产价格指数(REPI)中引入享乐方法进行质量调整。 2.DSC愿意改进其实验REPI编译的当前方法。目前,REPI是使用具有简单平均值的分层编制的。从简单平均到特征回归将提高指标的准确性,因为它将考虑到每个层内属性的质量组合。 3.考察团建议使用具有12个月滚动窗口的享乐时间虚拟方法来编制RPPI。有许多享乐方法可用于RPPI编译 ,其中,任务建议使用具有12个月滚动窗口的享乐时间虚拟方法。这种方法提供了更稳定的结果,即波动性较小的 指数,因为它汇集了一年的数据而不是四分之一的数据,并且在几乎没有可用观测值的情况下特别推荐。它广泛用于 RPPI编译和带有网络抓取数据的CPI编译。对该方法进行了扩展培训,并附有适用于迪拜样本数据的R代码。 4.REPI使用自2016年以来从迪拜土地局(DLD)获得的数据编制而成。这些数据涵盖所有类型的物业,即住宅建筑、商业建筑和土地(住宅和商业)。无论获得涵盖所有类型房地产的整体房地产指数(REPI),都应编制和发布一个跟 随住宅建筑价格趋势的住宅房地产价格指数(RPPI)作为独立指标。RPPI是监测金融稳定性的关键指标。这同样适用于商业地产,应为每种类型的活动发布独立指数。最后,住宅用地和商业用地(按活动类型)需要单独的指数。 5.该任务根据DSC提供的样本数据创建了R代码,以继续进行数据清理、分析、准备数据以进行处理和建模。分析和异常值检测是按每个月按每平方米价格进行的分层(部门)进行的。应通过更改四分位数乘数的值来尝试针对异常值的不同选项。 6.DSC正在使用交易数据计算流量权重,以将分层指数聚合为更高级别的指数。该任务建议每年更新权重上一年或前三年的交易数据,并保持全年稳定(Laspeyres型指数)。 7.新RPPI的发布应包括发布技术说明和/或 4国际货币基金组织 方法论文件。代表团提供了一份技术说明草案。该发布应在媒体上公布,以告知所有潜在用户,即房地产开发商、金融机构 、家庭以及税务机关、中央银行、国民账户工作人员等所有机构用户。 8.网络抓取越来越多地用于编制CPI子指数,以更好地反映品种的质量变化.最常见的被网络抓取的产品是航班、电子产品和衣服。首先使用具有12个月滚动窗口的时间虚拟特征方法使用网络抓取数据计算子指数。子指数 用网络抓取的数据为每个网站编译,然后汇总。两个子指数;使用网络抓取的数据和现场数据;也被汇总。每个包含的公司/商店的营业额权重用于这些聚合。营业额数据可以从商业登记处和/或税务局获得,并且通常可用于国民账户。 为了支持上述工作领域的进展,代表团提出了一项详细的行动计划,其中包含以下优先建议,以在改进REPICPI方面取得进展: 表1.优先建议 目标日期 优先推荐 负责机构 受DSC管理评估和批准 使用特征方法进行REPI编译 DSC 每年 每年更新权重 DSC 连续的 网络抓取每个产品的所有可用数据,每月3次。 DSC 有关优先建议和相关行动/里程碑的更多详细信息,请参见详细技术评估和建议下的行动计划。 国际货币基金5 详细的技术评估和建议 优先 行动/里程碑 目标完成日期 H 用时间虚拟享乐法编译实验RPPI 2022年2月 米 用时间虚拟享乐法编制其他实验性房地产指数 2022年3月 H 起草一份新的方法论文件/技术说明,以告知用户和管理人员这些变化 2022年4月 米 发布新的REPI 须经DSC管理层评估和批准 米 与房地产数据提供商会面,以提高数据质量并了解当前数据集中的变量 2022年2月 H 开始在手机、电视和其他电子产品上抓取数据 2022年4月 米 使用时间虚拟特征方法对网络抓取产品进行编译实验 须经DSC管理层评估和批准 米 调查有关网络抓取产品的公司营业额(权重)的数据源 2022年12月 起草一份新的方法论文件/技术说明,以告知用户和管理人员这些变化 须经DSC管理层评估和批准 米 发布新的CPI 须经DSC管理层评估和批准 A.雷比 9.DSC愿意改进当前用于编译其实验性REPI的方法。目前,REPI是使用具有简单平均值的分层编制的。从简单平均到特征回归将提高指标的准确性,因为它将考虑到每个层内属性的质量组合。 10.主要用户和关键利益相关者应参与该过程。DSC应与中央银行、DLD和其他主要利益相关者会面,分享当前的方法和未来。 11.REPI使用自2016年以来从DLD获得的数据编制而成。这些数据涵盖所有类型的物业,即住宅建筑、商业建筑和土地(住宅和商业)。可用的主要变量是价值,如果是公寓或房屋,位置(面积和部门),以平方米为单位的大小,阳台和停车场的存在,财产是否存在或计划外的信息,和过程类型。一些变量及其实例的含义仍不清楚,例如程序 类型,因此代表团建议DSC与DLD会面以澄清。应为数据完成后如图1所示的表格。这 6国际货币基金组织 与DLD的会议还应旨在通过完成具有大量缺失值的建成年份来改进未来数据,并将数据扩展到其他有意义的变量。 图1.数据结构 资料来源:RPPI实用编译指南。 12.编制了涵盖所有房地产类型的整体房地产价格指数REPI。目前的结构如下: 土地 房地产价格综合指数 领域 部门 部门 款待 部门 商业的 领域 部门 多用途 领域 部门 住宅/商业 领域 领域 住宅 领域 领域 领域 部门 部门 部门 商业的 住宅 住宅 建造 单元 图2.REPI的当前结构 资料来源:迪拜统计中心。 国际货币基金组织7 13.特派团建议改变当前结构以建立RPPI。无论获得涵盖所有类型物业的整体房地产指数,都应将遵循住宅价格趋势的RPPI作为独立指标发布。这是监测金融稳定性的关键指标。这同样适用于商业地产,应针对每种类型的活动发布独立指数。最后,住宅用地和商业用地(按活动类型)需要单独的指数。代表团提出以下建议 结构体: 图3.REPI的推荐结构 农业 农业 第9区 商业 商业 (...) 工业的 工业的 第2区 款待 款待 第1区 商业用地 住宅用地 商业的 住宅 REPI 14.该任务根据DSC提供的样本数据创建了R代码,以继续进行数据清理、分析、准备数据以进行处理和建模。 从最初的观察次数开始,执行以下步骤来清理数据: 删除重复项 删除模型中使用的变量中具有缺失值的观测值。 异常值的识别和去除 为卧室数量创建类别。 分析和异常值检测是按每个月按每平方米价格进行的分层(部门)进行的。应通过更改四分位数乘数的值来尝试针对异常值的不同选项。图4是应该进行该实验的R代码的打印屏幕,以供参考。 图4.R代码的打印屏幕,供参考 8国际货币基金组织 15.DSC正在使用交易数据计算流量权重,以将分层指数聚合为更高级别的指数。代表团建议每年使用前一年或前三年的交易数据更新权重,并保持当年的稳定(Laspeyres型指数)。 16.DSC旨在通过使用特征方法而不是简单平均来改进RPPI方法。有许多享乐方法可用于RPPI编译,其中,任务建议使用具有12个月滚动窗口的享乐时间虚拟方法。这种方法提供了更稳定的结果,即波动性较小的指数,因为它汇集了一年的数据而不是四分之一的数据,并且在几乎没有可用观测值的情况下特别推荐。它广泛用于RPPI编译和带有 网络抓取数据的CPI编译。对该方法进行了扩展培训,并附有适用于迪拜样本数据的R代码。 17.RPPI最多可在参考日期前两个季度进行修订。修订政策应在网站和方法说明/文件上明确公布。RPPI是许多国家根据行政来源的数据进行了修订,以包括 与上一季度有关的交易延迟登记。 18.新RPPI的发布应包括技术说明和/或方法论文件的发布。代表团提供了一份技术说明草案。该发布应在媒体上公布,以告知所有潜在用户,即房地产开发商、金融机构、家庭以及税务机关、中央银行、国民账户工作人员等所有机构用户。 建议的操作: 与主要用户和主要利益相关者会面,分享当前的方法和未来。 与DLD会面以澄清当前数据并改进未来的数据收集 调整REPI的当前结构,使其具有RPPI、商业地产指数、住宅用地指数和商业用地指数。 通过更改四分位数乘数的值来试验异常值的不同选项。 每年更新权重并保持全年稳定。 使用滚动窗口为12个月的享乐时间虚拟方法 发布带有技术说明和/或方法论文件的新RPPI B.网页抓取 19.使用网络抓取的数据有望提高CPI的质量。与传统的价格收集相比,网络爬取数据有几个优势,即提供更长时期的价格信息,而不是每月仅一天;它是一个更好的信息来源,可以将新项目包含在其中;可以减轻行政负担零售商并节省价格收集成本;预计将增加零售商和商品的覆盖率。此外,指数生产过程效率的提高是 国际货币基金组织9 由于可以实现更高水平的自动化,也可以预期。一旦到位,网络抓取的数据可以减少耗时以获得更好的结果。 20.网络抓取越来越多地用于编制CPI子指数,以更好地反映品种的质量变化.最常见的产品是网络 刮掉的是航班、电子产品和衣服。网络抓取活动应在每月的前三周每周执行一次。之后,与一个月有关的所有数据,并且将一种产品加入一个数据集中。应检索所有可用数据,即所有品种和每个品种的所有特征。应该为每个产品抓取一个以上的网站。 21.网络抓取的数据需要在编译索引之前清理异常值和缺失值。清洁和分析的方法与以前一样针对每个产品的房地产指数、一个月的数据执行。品种的每个特征对应一个变量/列,其中大部分是分类变量,在计算过程中会变成虚拟变量。在许多情况下,当有大量实例(超过五个)时,会像以前一样为床位创建类别