2020 年人口普查数据产品研讨会论文集总结
背景与目标
2020 年人口普查局计划采用新的披露规避系统——差分隐私算法(TDA)来保护人口和住房特征(DHC)文件中的隐私。为帮助人口普查局更好地理解数据产品的用途及其重要性,并评估 TDA 对数据可用性的影响,国家科学院、工程院和医学院的国家统计委员会(CNSTAT)召集了研讨会,邀请数据用户评估应用 TDA 生成的 2010 年人口普查演示文件。研讨会旨在收集用户反馈,帮助人口普查局最终确定 DHC 文件中的 TDA 参数,并提高数据效用同时保护隐私。
演示数据与反馈
研讨会重点关注了应用 TDA 生成的 2010 年人口普查演示文件,并与已发布的 SF1 数据进行比较。人口普查局发布了三版 DHC 演示文件,分别于 2019 年 10 月、2020 年 5 月和 2022 年 3 月发布。研讨会收集了来自政府、学术、商业和社区等领域的用户反馈,涵盖了人口统计、住房、公共卫生、教育、资源分配等多个方面。用户普遍关注 TDA 对数据准确性的影响,特别是对小区域和人口稀疏地区的影响。此外,用户还提出了关于数据隐私、数据获取、数据沟通等方面的担忧和建议。
案例应用
研讨会中展示了多个应用案例,涵盖了 DHC 数据在各个领域的应用。例如,学校规划者使用 DHC 数据来预测入学人数,公共卫生官员使用 DHC 数据来监测疾病发病率和健康风险,城市规划者使用 DHC 数据来规划城市发展和交通。这些案例表明 DHC 数据对于各个领域都具有重要意义,但同时也突出了 TDA 对数据可用性的潜在影响。
隐私问题
研讨会还讨论了 TDA 对隐私的影响,特别是重新识别的风险。研究人员模拟了重新识别跨性别儿童的风险,并发现 TDA 可以有效降低这种风险。然而,用户仍然担心 TDA 可能导致对某些群体的不公平影响,并呼吁人口普查局提高数据透明度,并提供更多关于数据隐私的信息。
未来展望
研讨会提出了多项建议,以帮助人口普查局改进 DHC 数据产品并更好地满足用户需求。这些建议包括:
- 提供更多关于数据质量和隐私损失预算的信息。
- 提高数据透明度,并建立更有效的沟通机制。
- 为用户提供更多数据获取工具和资源。
- 优先考虑农村和小区域的数据需求。
- 继续收集用户反馈,并改进数据产品和披露规避系统。
结论
研讨会表明,DHC 数据对于各个领域都具有重要意义,但 TDA 也对数据可用性产生了潜在影响。人口普查局需要平衡数据隐私和数据效用之间的关系,并采取措施改进数据产品和沟通机制,以满足用户需求并保护个人隐私。