商务数据伦理框架 2022 介绍 数据对于履行美国商务部创造条件的使命至关重要 对于经济增长和所有社区的机会都是必要的。作为“美国的数据机构”,商务部通过开发商务数据展现了领导力 策略1.该战略提供了一个路线图,以最大限度地发挥商业数据的积极影响和员工。《战略》的执行将通过五个相互依存的战略目标来执行,一个 其中是“促进适当的数据使用和公平获取”,更具体地说,是“促进数据 通过促进数据政策的质量、透明度、问责制和公平性,实现整个商务领域的道德规范和实践在整个数据生命周期。 为了支持这一目标,建议制定2021-2022财年商业数据战略行动计划制定商业数据道德框架。 该框架使员工了解并为道德、负责任和公平的数据提供指导 在整个数据生命周期中实践,以充分利用联邦数据在任务、服务、通过指导联邦政府有意识地实施道德治理来促进公共利益 设计和学习文化2. 数据伦理是行为规范,在以下情况下促进适当的判断和问责 获取、管理或使用数据,目的是保护隐私和机密性,最大限度地减少对个人和社会的相关风险,以及最大化公共利益3。在这种背景下,公众善被定义为美国人民的利益和福祉,并通过以下服务得到增强: 由政府提供给所有社会成员。 仅靠技术解决方案或遵守相关法律、规则、 法规和标准。必须推进,而不仅仅是对问题的理解 手,也是问题表述中不可或缺的一部分的数据。循证决策 制造——即使用数据来表示已知事实,为我们的推理和决策奠定基础制作—其可信度取决于其所基于的数据。 数据伦理原则包括隐私、保密、公平、客观、包容、透明、 责任、安全性、可靠性、安全性和信任。在每个方面应用数据道德和勤奋至关重要数据生命周期的阶段,包括数据收集、存储、传输、聚合、分析、使用、 共享和处置。数据的质量及其管理决定了可靠性、准确性和数据驱动决策结果的公平性。 以下框架旨在具有前瞻性和实用性。它提出建议和 提供指南,而不是要求。法律或法规明确适用于某项活动的情况在此框架中讨论,法律或法规可能取代最佳做法,并且 该框架的建议。在实施任何最佳实践或建议时 在此框架下,各局应咨询其法律顾问,以确保遵守法律。 1见https://www.commerce.gov/sites/default/files/2021-08/US-Dept-of-Commerce-Data-Strategy.pdf2见https://strategy.data.gov/assets/docs/federal-data-strategy-principles.pdf 3见https://resources.data.gov/assets/documents/fds-data-ethics-framework.pdf 商务数据道德框架基于四大支柱,如图1所示。通过这些支柱,该框架为道德考虑、意识和指导建立了最佳实践 目标是使员工能够在整个数据中使用适当且负责任的数据实践生命周期,并了解其数据实践的潜在风险和影响。 图1.美国商务部数据伦理框架 以下是支持数据道德框架的定义和最佳实践。 隐私和保密 定义 隐私和机密性在数据的访问、所有权、使用和收集中非常重要。隐私是不受无端侵犯个人私生活和私人行为的自由 企业。机密性是个人和商业信息不受不恰当的访问和使用。 最佳实践 1.1制定保护隐私和机密的措施。 确保数据实践符合保密和隐私法律、规则和法规,包括隐私法4,同时遵守透明度法律、规则和规章,包括《信息自由法案》(《信息自由法》)5. 遵循相关数据治理标准,例如公平信息实践原则6 (公平)。 识别敏感数据,对其进行分类,并根据需要对其进行标记,以符合国家档案和记录管理局(NARA)法规和其他适用数据 标志着法律法规7. 根据保护人类的共同规则为研究而收集的任何数据受试者必须遵守共同规则的所有要求8. 定义数据使用策略和监视数据访问的机制。 请记住,数据主体拥有其个人身份信息(PII)和业务可识别信息(BII),并有权了解收集,存储和 在法律允许且符合法律(包括《隐私法》)的情况下使用该数据9. 确保现有数据和正在准备的数据的组合 发布不允许重新识别个人、企业或其他实体包括法律法规禁止披露的政府机构。 仅收集个人和业务数据,仅收集完成所需的信息授权的目的。 为所有相关数据制定保留计划,并仅保留PII和BII的时间为实现授权目的所必需的,除非数据主体已同意。是 意识到多个记录保留计划可能同时应用。 在可能的情况下探索和实施数据隐私和保护技术,包括匿名化技术10,符合法律、法规和规章。 考虑使用数据保护技术,例如差分隐私、匿名化和合成数据。 1.2在整个数据生命周期中应用负责任的数据管理。 具体数据实践的目的。 在收集、访问、传输、 使用、存储和删除数据,包括定义适当的边界和控制。 确保收集的有关个人的信息准确无误,并允许个人根据《隐私法》修改或访问自己的PII的机会。 4见https://www.govinfo.gov/content/pkg/USCODE-2018-title5/pdf/USCODE-2018-title5-partI-chap5-subchapII- sec552a.pdf 5见https://www.foia.gov/ 6见https://www.whitehouse.gov/wp-content/uploads/legacy_drupal_files/omb/circulars/A130/a130revised.pdf7见https://www.archives.gov/about/regulations/regulations.html 8见https://www.ecfr.gov/current/title-15/subtitle-A/part-27 9见https://www.osec.doc.gov/opog/PrivacyAct/PrivacyAct.html 10见https://www.nist.gov/itl/applied-cybersecurity/privacy-engineering/collaboration-space/focus-areas/de- id/工具 确保采取控制措施以防止未经授权的访问,并最大限度地减少可能的危害的严重性。 使用数据收集方法,包括自动化和人工智能驱动符合法律要求和道德规范的程序。 建议使用 privacy-by-design原则。 鼓励长期保存数据并存档可以合法保留的数据。 将数据访问限制为具有合法政府目的或业务需求的人员信息,以及符合所有法律和法规要求的人员。 公平和包容性 定义 公平和包容确保平等和公正的待遇,不分种族、性别、年龄、其他保护状态,或社会经济地位。 公平是实现包容性代表性的一种方法。它通过最大限度地减少人类偏见来做到这一点研究和数据收集,以便所有社区都能得到公平和客观的代表。公平也 意味着减轻偏见并确保数据项目不会对社会群体产生意外影响和个人。在评估数据应用、文化、背景、法律、经济、 政治、伦理和历史因素都应该被考虑在内。 数据伦理的包容性意味着所有相关人员都有平等的机会被纳入 收集的数据和数据使用,没有人被排除在外,声音被听到,人们有平等访问数据,人们可以理解数据。弱势社区必须有意识 考虑并包括在内。 2.1确保收集的数据是公平的和完整的。 控制和监测所收集数据的质量、适用性和客观性。 请注意,偏差可能源于数据生命周期的任何步骤(创建、采样、收集和处理),并考虑缓解或消除它的最佳做法。 确保适当、非致命、公正、包容的数据收集和管理。考虑数据收集的目的和预期用途。 实施数据质量标准和治理,以确保数据完整、包容、公正和保护。 2.2确保数据能够代表所有受众。 收集和处理数据,以包括来自所有已知潜在用户的输入以及数据,以确保数据表示、处理和使用中的公平性和公正性。 确保数据集适合预期用途。这需要注意几个 因素,包括数据质量、缓解代表性问题的统计方法,考虑应用程序所处的社会技术背景的过程 部署,并意识到人为因素的相互作用。 最佳实践 主动收集代表性不足的社区对可能不公平的数据的意见影响和减轻这种影响。 让分类数据成为常态,同时保护隐私11. 2.3减轻或消除数据和数据处理中的偏见。 提高对多种形式偏见的认识并提供培训,包括系统性偏见、统计、计算和人为偏见,并采取措施减少它。 建立程序以主动搜索数据偏差并采取措施减轻影响,包括支持公平和包容的移除做法。 使用统计和数据科学方法来评估结果的准确性和偏差。 使用统计量来纠正偏差,包括加权、平衡和其他方法消除样本偏差。 2.4对数据的收集和使用方式保持透明。 以合乎道德的方式收集数据,并在需要时通知相关人员并征得其同意,在符合所有适用的政策、法规和法律要求。 不要收集禁止、不相关或不必要的数据来实现目的的工作。 在使用数据时增强访问和透明度,包括处理个人和敏感数据,以支持公平和包容的过程,同时考虑对不同群体的人。 请注意以与目的不一致的方式使用数据的潜在用途它们被收集起来,这可能会导致有偏见的结果。 实施一个尽可能透明和开放的流程,提供合并的方法 来自最终用户和社区的反馈,例如受保护和保密的途径,在哪些数据主体可以匿名报告数据滥用、误用和意外负面 结果。此过程应严格、高效,并包括调查方法指控和预防伤害,如果必要的。 2.5采用最佳实践,以确保包容。 通过多元化促进包容和知情的沟通和协作围绕数据实践和影响评估的代表性。 提供有关数据治理的作用及其影响的教育服务 使用通俗易懂的语言的弱势社区,同时考虑到语言的差异和学习类型要尽可能具有包容性和可访问性。 对数据的使用方式、目的和人员使用保持透明。 在利益相关者之间建立协作流程并保持整个透明度该过程,包括主动监控无意的偏见和排斥,以及记录社区中相关利益相关者的反馈。 提供支持和翻译服务,以确保可访问性并增加机会参与政府数据。 参与数据用户了解他们的需求。 11见https://www.whitehouse.gov/wp-content/uploads/2022/04/eo13985-vision-for-equitable-data.pdf 确保数据主体、弱势和代表性不足的社区以及相关利益相关者在早期参与数据道德对话。 教育自己有关社会和历史背景的信息,以与代表性不足的人互动社区,优先考虑他们的需求,并优先考虑他们在所有对话中的存在数据实践。 为数据主体提供资源,使他们能够行使自主权、控制和代理权对自己的数据,并在需要时自由给予或撤回对其使用的同意根据法律、规则和规定: 提供工具,以便在允许的情况下轻松选择加入和选择退出。 提供教育服务,尽早告知数据主体其权利的过程。 在适当的时候寻求同意,而不仅仅是咨询。 2.6数据实践和数据驱动的影响监测民主化。 为数据用户提供有关如何在整个组织中理解和使用数据的培训。 增强数据驱动型文化和数据道德参与度。 使对不受限制的公开可用数据的访问民主化,无论用户在何处都无需支付任何费用可能的。 为数据主体创建受保护、可访问和保密的匿名途径 报告不正确的数据、数据滥用或误用以及意外的负面结果(如果不是)有限的律例。 启用透明度以监视下游影响(正面或负面),启用根据法律、规则和 规定。 透明度和问责制 定义 透明度是公开披露和共享有关项目的信息,完整、清晰、简单易懂,易于访问的格式。 问责制是通过明确定义组织的 使命、价值观和目标,同时承认对行动、决策和产品的责任。问责制要求任何获取、管理或使用数据的人都了解利益相关者和负责任的,适当的。 最佳实践 3.1在整个数据生命周期中保持透明度。 确保数据实践符合透明度法律、