国际指导原则草案 用于开发高级AI系统的组织 (征求意见稿) 组织开发先进AI系统的国际指导原则 在全球推广安全、可靠和值得信赖的人工智能,并将为开发和使用先进人工智能系统的组织,如基础模型和生成AI。组织可能包括来自学术界、民间社会、 私营部门和公共部门。 这份非详尽的指导原则清单将作为生活进行讨论和阐述文件,以现有的经合组织人工智能原则为基础,以应对先进的人工智能系统,旨在帮助抓住好处,解决风险和 AI技术带来的挑战。这些原则应适用于所有AI参与者,当和适用于高级AI系统的设计、开发、部署和使用。 我们期待着进一步发展这些原则,作为全面政策的一部分 框架,来自其他国家和学术界、商界和商界更广泛的利益相关者的投入公民社会。 我们还重申致力于制定一项国际行为守则 基于以下指导原则开发先进AI系统的组织。 不同的司法管辖区可能会采取自己独特的方法来实施这些指导不同的原则。 我们呼吁各组织与其他相关利益攸关方协商,遵循这些 行动,符合基于风险的方法,而政府发展更持久和/或详细的治理和监管方法。我们还承诺在 与经合组织、GPAI和其他利益攸关方协商,引入监测工具和帮助组织对这些行动的实施负责的机制。 我们鼓励组织支持发展有效的监督机制, 我们可以通过提供最佳实践来探索发展。 在利用创新机会的同时,组织应尊重法治, 人权、正当程序、多样性、公平和不歧视、民主和人- 在高级AI系统的设计,开发和部署中的中心性。组织 不应该开发或部署侵犯人权、破坏人权的先进人工智能系统民主价值观,对个人或社区特别有害,助长恐怖主义,使犯罪滥用,或对安全、安保和人权构成重大风险,并因此不可接受。 各国必须遵守国际人权法规定的义务,以确保 人权得到充分尊重和保护,而私营部门的活动应保持一致与《联合国工商业指导原则》等国际框架 人权和经合组织多国企业准则。 具体而言,我们呼吁组织遵守以下原则,与风险: 1在先进AI的发展过程中采取适当措施系统,包括在部署之前和整个部署和放置在 市场,以识别、评估和减轻整个AI生命周期中的风险。 这包括采用不同的内部和独立的外部测试措施 先进的人工智能系统,通过混合方法,如红色团队和实施测试和缓解 例如,措施应寻求确保系统的健壮性、安全性和安全性 在他们的整个生命周期中,这样他们就不会构成不合理的风险。在支持在这样的测试中,开发人员应该寻求实现与数据集、流程、 以及系统开发过程中做出的决策。 2识别和缓解漏洞,并在适当情况下识别和缓解事件和部署后的误用模式,包括投放市场。 组织应在适当的时候按照预期使用人工智能系统,并监控部署后的漏洞、事件、新出现的风险和滥用,并采取适当的采取行动解决这些问题。鼓励组织考虑,例如,促进 部署后第三方和用户发现和报告问题和漏洞。进一步鼓励各组织保存报告的适当文件 事件并减轻已识别的风险和漏洞,与其他 利益相关者。在适当的情况下,确定漏洞的报告机制应该是面向不同的利益相关者。 3公开报告先进的人工智能系统的能力、局限性和领域适当和不适当的使用,以支持确保足够的透明度。 这应包括发布包含对所有人有意义的信息的透明度报告先进AI系统的新重要版本。 组织应使透明度报告中的信息足够清晰 可理解,使部署人员和用户能够解释系统的输出并启用 用户适当地使用它,并且透明度报告由以下人员支持和通知强大的内部文档流程。 4致力于负责任的信息共享和事件报告 在开发包括行业在内的先进人工智能系统的组织中,政府、民间社会和学术界。 这包括负责任地分享信息,包括但不限于, 关于安全和安全风险、危险、预期或非预期能力的信息,以及尝试AI参与者规避整个AI生命周期的保护措施。 5开发、实施和披露AI治理和风险管理 政策,以基于风险的方法为基础-包括隐私政策,以及缓解措施,特别是针对开发先进人工智能系统的组织。 这包括披露适当的隐私政策,包括个人数据,用户 promptsandadvancedAIsystemoutput.Organizationsareexpectedtoestablishanddisclose 他们的人工智能治理政策和组织机制,以在根据基于风险的方法。这应包括问责制和治理在整个AI生命周期中评估和减轻风险的流程。 6投资并实施强大的安全控制,包括物理安全,整个AI生命周期中的网络安全和内部威胁防护。 这些可能包括确保模型权重和算法、服务器、操作安全性信息安全措施和适当的网络/物理访问控制。 7.开发和部署可靠的内容身份验证和来源 诸如水印或其他技术之类的机制,使用户能够识别AI- 生成的内容 这包括内容认证,如水印和/或来源机制 用于使用组织的高级AI系统创建的内容。水印或来源数据应包括创建内容的服务或模型的标识符,但不包括包括用户信息。组织还应努力开发工具或API以 允许用户确定特定内容是否使用其高级AI系统创建。 进一步鼓励组织实施其他机制,如标签或 免责声明,使用户在可能和适当的情况下知道他们什么时候与AI系统交互。 8优先考虑研究,以减轻社会、安全和安保风险,并优先考虑投资于有效的缓解措施。 这包括开展、合作和投资支持 推进人工智能安全、安保和解决关键风险,以及投资开发适当的缓解工具。 9优先发展先进的人工智能系统,以解决世界最大的挑战,特别是但不限于气候危机、全球卫生和教育 这些努力是为了支持在联合国可持续发展 发展目标,并鼓励人工智能发展以造福全球。 组织应优先负责任地管理值得信赖和以人为中心的AI 并支持数字扫盲计划。 10推动发展,并在适当情况下采用适当的国际技术标准 这包括促进发展和酌情利用国际 技术标准和最佳实践,包括水印,以及与国际SDO。 11实施适当的数据输入控制和审计。 组织应承诺在整个AI中实施适当的保障措施 生命周期,特别是在培训之前和整个培训期间,关于个人数据、材料的使用受知识产权保护,包括受版权保护的内容和其他数据 这可能会导致有害的模型功能。训练数据集的适当透明度也应得到支持,组织应遵守适用的法律框架。