人工智能在处理和生成新数据中的作用 开放数据生态系统中的法律和政策挑战探讨 本研究作为data.europa.eu的一部分进行,这是欧盟委员会的一项倡议。欧盟委员会出版办公室负责data.europa.eu合同的管理。 1 有关本文的更多信息,请联系以下内容。 EuropeanCommission 通信网络、内容和技术总局 G.1单元数据政策和创新 电子邮C件NE:CT-G1@ec.europa.eu data.europa.eu 电子邮件:info@data .europa.eu作者: HansGrauxPieterGryffroyMagdalenaGad-NowakLiesaBoghaert 最后更新时间:202 4年7月https://data.europ免a.责e声u/明 本出版物中阐述的信息和观点属于作者(们),不一定反映委员会的官方意见。委员会不对本研究中包含的数据准确性提供任何担保。委员会及其代理人均不对本信息的使用负责。 卢森堡:欧盟出版物办公室,2024©欧洲联盟,2024 欧洲委员会文件再利用政策由2011年12月12日发布的欧盟委员会决定2011/833/EU执行(官方期刊L330,2011年12月14日,第39页,ELI:http://data.europa.eu/eli/dec/2011/33/oj).除非另有说明,否则可根据创意commonsAttribution4.0国际许可协议(CreativCommonsAttribution4.0InternationalLicense,CCBY4.0)授权重用此文档。https://creativecommons.org/licences/by/4.0/).Thismeansthatre-useisallowedprovidingapropriatecreditisgivenandanychangesareindicated. ISBN:978-92-78-44246-0 doi:10.2830/412108 目录号:OA-02-24-797-EN-N 目录 人工智能系统对开放数据生态系统的潜在影响介绍5 1.人工智能和开放数据生态系统5 2.问题陈述及本研究论文✁结构.6 3.本文中✁工作定义.7 人工智能与基本权利9 1.引言.................................................................................................................................. ...9 2.基本人权框架................................................................................................................... 9 3.隐私和数据保护作为欧洲的基本权利............................................................................... 10 欧洲委员会法律框架.1 0 欧盟法律框架.1 1 一般数据保护条例(GDPR)............................................................................................ 11 数据主体✁权利.1 8 其他问责机制.21 4.示例案例:在医疗保健领域导航人工智能的影响............................................................. 23 引言................................................................................................................................... ..23 医疗保健中✁人工智能:简要概述.2 3 与医疗保健中使用人工智能相关的风险............................................................................ 25 人工5.智风能险与缓知解识措产施权:—通—用人策工略智和能方的法创....造...性....局...限....及....其...对....现...有....输....入...的....依...赖....性2.. ....6........................................................................................27 6.结论................................................................................................................................. 12.6人工智能与训练数据:应对版权挑战.27 2.人工智能可以成为创作者吗?处理(非)创造性输出31 3.人工智能输出与版权侵权33 4.生成式人工智能的未来与版权34 5.结论................................................................................................................................. ......36 减少问题的立法尝试:欧盟《人工智能法》的野心 1.人工智能法案✁起源与原则概述.37 -人工智能法案及其目标——背景与上下文.37 -人工智能法案将于何时生效(材料范围).38 -人工智能法案——基于风险✁方法.38 -人工智能法案下✁受监管角色(个人范围).42 TheArtificialIntelligenceAct–地域适用范围......................................................................... .43提供者在《人工智能法案》下的义务43深 入探讨高风险人工智能系统的提供者义务:数据管理与治理.................................................. ............46深入探讨高风险人工智能系统的提供者义务:风险管理系统................................. ............................48《人工智能法案》下的部署者义务......................................................... .......................................50执行与罚款.................................................................................. ................................502.《人工智能法案》在开放数据生态系统中的实际意义.................... .......................................52理解您的项目和角色.................................................................... ....................52在人工智能应用中使用开放数据..................................................................... .......53开放数据人工智能应用场景的风险评估与风险管理..................................................... ............55《人工智能法案》的时间线及未来预期.................................................................. ................563.结论................................................................................................................ .................57data.......................................................................................................................................... .59 关于人工智能与开放交叉中法律挑战的总体结论参考书目61 人工智能系统对开放数据生态系统的潜在影响简介 1.人工智能和开放数据生态系统 人工智能(AI)系统对企业和政府以及全球经济的一般影响目前是一个热门话题。这并不令人意外,因为人们普遍认为AI有可能带来前所未有的、根本性的变化,改变人们的生活和工作方式。 人工智能的变革潜力主要源自其大规模分析数据的能力,以及识别和内化人类(或完全确定性算法)难以发现的数据模式和关联。简单来说:现代人工智能尤其能够在大量数据的训练和应用中蓬勃发展。 一个高度显眼的例子便是当前“生成型”人工智能系统(AI系统,AIS)的流行趋势。这些系统能够根据用户的要求生成看似全新的文本、图像、视频或其他数据。它们通过分析大量输入数据中的模式(预先存在的文本、图像和视频)来识别常见模式。基于用户的提示,它们可以生成新的输出,这些输出具有输入数据的特征。生成型AI聊天系统已被市场广泛接受,并能够快速生成文本响应,这些响应很容易被误认为是由人类提供的合格答案。类似系统也存在用于图像和视频输出的情况。 由于这些特性,人工智能与开放数据之间存在一种内在的紧密联系。与其他计算技术相比,人工智能具有从大量数据集中提取见解并生成有用的新输出的显著能力;但是,为了使其有效运作,必须有大量的可访问数据作为训练材料。大量数据的可访问性和免费使用是开放数据的主要特征之一。换句话说:开放数据生态系统可以成为——并且可能已经成为——高性能人工智能所需的数据来源。 为了使AI系统(AIS)正常运行,以下三个关键因素,被称为三个Vs,是必要的。 •数据量——AI需要大量数据进行训练。 •数据多样性——多样化的数据来源能够提升AI的能力并降低偏见风险。 •数据真实性——不良的数据训练会导致性能不佳,因此数据的真实性至关重要。可靠的来源在确定数据质量方面起着重要作用。 开放数据可以有助于满足这些前提条件。虽然在每一个单一的开放数据集中,并非三个V(Volume、Velocity、Variety)都会自然存在,但数据范围将有助于满足数量和多样性要求。此外,在欧洲开放数据社区中,数据来源的可靠性也将得到保障。 有助于满足真实性要求。总结来说,开放数据生态系统有可能通过提供可用的训练数据仓库来帮助构建可靠的AI;反之,开放数据社区也可以从AI中受益,利用它们来浏览大量数据集并获得原本不易察觉的洞察。通过这种方式,AI与开放数据的结合有可能彻底改变数据生态系统,促进创新并支持更加明智的决策。 2.本研究论文的问题陈述和结构 尽管这些潜在好处十分明显,人工智能也可能会从法律和政策的角度带来新的挑战。问题可能在多个方面出现。输入侧面(如何创建和训练AI)和输出侧面