知识产权与前沿技术 WIPO对话 生成AI 生成AI “偶尔,一种新技术出现,它抓住了世界各地的公众想象力,主导着公共头条新闻和私人对话,分裂批评者和支持者,似乎把我们的世界置于十字路口。WIPO总干事唐达仁 什么是生成式AI? 传统的人工智能系统主要用于分析数据和进行预测。然而,生成人工智能通过创建类似于其训练数据的新数据来扩展这些功能。这种进步使得能够生成各种形式的新内容,包括音频、代码、图像、文本、模拟和视频。 生成AI是指任何能够在训练后动态创建输出的机器学习模型。重要的是,生成AI的范围远远超出了内容生成。生成AI模型的潜在应用非常广泛,从音乐创作和视频生成到药物发现和医学诊断中的分子建模。随着技术的不断发展,其应用程序有望扩展到新的领域。 虽然当前的生成AI模型特别适合关联语言和生成内容,但生成AI的潜力在创造和创新领域都具有广泛的应用。 照片:GettyImages/Just_Super,nathaphat,janiecbros;Pexels/GoogleDeepMind 2022年11月推出的ChatGPT将生成AI带到了最前沿,引起了主流的关注,并改变了我们的工作和创造方式。ChatGPT利用自然语言处理和深度机器学习来生成书面内容。虽然这是同类机型中的第一个,但包括谷歌的Bard,微软的BigChat和Meta的Llama2在内的类似机型很快就随之而来。其他AI模型(包括Midtry 、DALL-E和StableDiffsio)根据文本提示生成图像。 ChatGPT是第一个大型语言模型,它利用自然语言处理和深度机器学习来生成书面内容。 尽管有些人惊叹于生成AI产生内容的准确性和速度,但批评家担心生成的输出可能缺乏可靠性和错误。给定文本片段之类的上下文,基本级别的生成AI模型仅预测最可能的下一个单词。 然而,令人信服的输出可能会出现,目前的生成AI模型仍然表现出严重的局限性,通过结合 在没有真正理解的情况下,统计上可能的顺序中的单词。 Definitions 深度学习是机器学习的一个子集,它从人脑的结构和操作中汲取灵感,以获取模式和 来自数据的表示。深度学习使用具有互连节点或神经元的神经网络模型,这些节点或神经元被安排成多个层。网络通过这些层处理输入数据并产生非线性输出。每个神经元都有几个可适应的参数,这些参数可以从数据中学习,而不是预先编程。 照片:GettyImages/LaurenceDutton 生成式AI(通常称为语言模型(LM)或大型语言模型(LLM))的最新进展是由于非常适合关联语言的新模型。重要的是,LM和LLM并不局限于人类语言的处理和生成。在机器学习术语中,语言可以指代在上下文(语法,单词之间的关系)中可以传达含义的任何符号(例如单词)。在语言中,单词创建序列,意义不仅取决于单词的选择,还取决于这些单词之间的关系。为了有效地捕获这些关系,LLM适用于处理序列并保持足够的内存,并设计用于处理大型数据集。LLM可以执行各种自然语言处理任务,包括文本生成、语言翻译、文本摘要、问答等。 照片:盖蒂图片社/网格立方体;Pexels/GoogleDeepMind 调节生成AI 生成性人工智能既代表着巨大的机会,也代表着巨大的风险。在风险方面,它引发了许多超出其技术限制的担忧,涉及可靠性、准确性和伦理问题。在许多公开辩论的最前沿是伦理问题,例如 虚假信息,市场操纵,网络犯罪,对隐私和民主的威胁以及对内容创建和文化多样性的意外后果的社会风险的可能性。此外,对工作流离失所,语言偏见,缺乏透明度,大公司对法规的影响,经济不平等以及从没有相应利益的国家收集的数据货币化的担忧也很重要。 许多人担心生成人工智能的破坏性潜力,需要采取监管措施。他们倡导人工智能的国际合作和全球治理。对快速、短期解决方案的需求正在推动决策者探索立法补丁和替代途径。 生成型人工智能引发了许多监管问题,尤其是伦理问题。监管机构正在积极寻求快速、短期的解决方案,以适应快速的技术变革。 IP关键注意事项概述 许多人正在接受用于写作,视觉内容和编码的生成AI工具。由于其独立创建内容的感知能力,生成AI有可能与人类创作者进行经济竞争,并在各个行业提高人类的创造力和生产力。说明其在创意产业中潜在颠覆的一个重要例子是歌曲“HeartoMySleeve”,该歌曲使用AI生成的未经授权的人声来模仿音乐家Drae和Weed。这凸显了围绕版权问题的持续辩论:一方面,版权作品被用来训练生成。 AI模型和模型本身能够生成真实的内容。这些AI系统生成的内容可能会挑战传统的作者和原创性概念。 但是,生成AI的IP接触点要广泛得多,值得牢记整个IP权利范围。 通过将受保护的作品纳入培训数据和AI生成的输出的版权保护,生成AI引发了有关潜在版权侵权的激烈讨论。但是,必须认识到与生成AI相关的IP问题不仅限于版权。 生成的AI模型 专利和商业秘密起着至关重要的作用,特别是在保护AI模型以及使用开源制度方面。 照片:GettyImages/Just_Super 专利保护可用于新颖和创造性的AI模型、算法和学习方法。然而,人工智能系统的可专利性在不同的司法管辖区各不相同,这给区分可专利的人工智能系统和使用标准计算技术实现的不可专利的抽象概念带来了挑战。一些公司还选择公开分享未经训练的模型,即使他们拥有基本技术的专利。 在某些司法管辖区,与专利相比,人工智能模型源代码的版权保护和通过商业秘密保护关键方法组件可能会提供即时和可靠的保护。 使用IP保护生成AI模型的最佳方法取决于几个因素,包括AI模型的性质,管辖权以及旨在保护的特定元素。专利,商业秘密和版权都起作用。 用创成式AI发明 生成人工智能有可能以人类可能找不到明显的方式结合知识集,从而帮助创新突破。它可以探索大量数据集,识别模式和解决方案,从而更有效地解决问题和发现新方法。 在发明过程中使用AI工具可以通过产生新的想法和解决方案来补充人类创新 。人类仍然通过定义问题,设定目标以及确定如何应用AI生成的见解在发明过程中发挥关键作用。 However,employinggenerativeAIinassistinginventionmayrisethebarforcreativestep,potentiallymakesithardtoobtainpatentforsuchinvenovations.Inturn,inventorsmightresulttosafethroughtradesecrets,potentiallystifling- 关于创新。 生成的AI输入 照片:GettyImages/dem10 生成AI模型需要大量的训练数据。例如,原始的GPT-3模型是在570GB的文本上训练的。在某些情况下,这些训练数据集的一部分是从互联网上抓取的,并包含受版权保护的文本和图像。这引发了潜在的版权侵权问题。 生成AI模型的开发人员认为,这些模型不会保留任何受版权保护的作品的永久副本,而只是在其神经网络中生成权重。这样,训练数据的使用类似于人类通过阅读书籍或观看艺术品来学习。他们认为训练模型属于现有的版权例外和限制,因为它们不复制训练数据。大型训练数据集还确保AI模型能够反映人类,并且偏差的风险较小。最后,他们说,生成式人工智能并不是在取代人类的创造力,而是在补充人类的创造者,并作为一种额外的工具来培养新的创造力形式。 另一方面,版权所有者声称,如果未经授权,将其作品用作训练数据集的一部分,则表示侵犯版权。版权所有者已经对人工智能开发者发起了几起诉讼,但这些复杂的法律问题的明确答案不太可能在不久的将来出现。同样,没有简单的方法来评估单个作品对训练AI模型的贡献以及如何潜在地补偿版权所有者。此外,版权登记在许多司法管辖区不是强制性的,这使得版权作品的识别变得困难。 有时。 关于版权所有者的利益与生成AI开发人员将版权作品用作其训练数据集的一部分之间的平衡,存在着相互矛盾的观点。 生成的AI输出 生成性AI可以产生大量的创造性输出,并且有大量讨论这些AI生成的输出是否应受益于版权保护。生成性AI的多产性质可能导致质量和创造力不同的内容大量涌入,挑战既定的作品原创性,作者和所有权的法律概念。 照片:Pexels/GoogleDeepMind 版权被设计为以人为中心的权利,在许多国家,只有人类可以成为创作者,因此也是版权所有者。但是,这一概念目前在某些司法管辖区受到挑战。 照片:Pexels/GoogleDeepMind 例如,美国的一些申请人要求保护仅由AI产生的输出,但被拒绝了。最近,北京互联网法院表示,稳定扩散产生的图像被视为原始作品,因为许多人类提示相当于足够的人类创造力。 同时,生成AI可以用作人类创作者打开创造力和作品新领域的工具。如果人类创作者正在使用生成AI作为工具,但对人类做出了重大贡献,则由此产生的作品可能会获得版权保护。问题仍然是如何衡量这种贡献并建立 一个门槛。 在AI在创作过程中起着重要作用的世界中,关于独创性的含义的辩论正在进行中。 生成AI正在蓬勃发展,并被用于许多目的。在世界知识产权组织第八届对话会议上展示了多样性。讨论的案例从编舞表达到撰写新闻文章。另一个例子展示了生成AI如何为边缘化社区(如聋人和听力障碍人士)提供手语识别服务。这些案例研究还证明了潜在的广泛的相关知识产权问题。这些例子说明了生成AI模型开发人员,人类创作者和版权所有者之间的潜在利益紧张关系。科技公司要求更多的数据访问权限,而权利人认为,未经同意和公平报酬,不得使用他们的作品。 案例研究示例IP挑战/问题 开放式生成AI模型 AI增强时尚和电视制作 自动 文本处理 访问高质量的培训数据对于增强AI安全性和减少偏见至关重要。导航与版权限制和例外以及合理使用相关的司法管辖区变化具有挑战性。 确定AI生成内容的所有权是困难的。 培训数据缺乏多样性可能导致盗用和歪曲传统文化表现形式。 获取训练数据和生成训练模型是昂贵且耗时的。 如果模型无法受到知识产权保护,则存在竞争对手或客户逆向工程竞争系统的风险。对于小公司来说,遵守有关培训数据的IP规则是一个问题,因为大公司可以采取更高风险的方法。 音乐制作AI生成的作品不符合 在大多数考虑过这个问题的司法管辖区,版权保护给无线电和流媒体服务带来了问题。 未经授权使用歌曲,音乐和歌词进行机器学习是一个问题。 作者和艺术家应该能够选择退出他们用于训练AI的内容。 手语识别和翻译软件 保护AI模型可能会阻止进一步的研究和访问 个性化电视广告 输出的版权和所有权,特别是在有多个贡献者的情况下,仍然不确定。 库存图像供应商视觉数据通常受版权保护, 照片:Pexels/GoogleDeepMind 需要机器学习应用程序的授权。 风险缓解策略 降低与利用生成AI相关的风险对于进入这一动态领域的公司至关重要。 企业可以实施几项战略措施来利用人工智能的潜力,同时最大限度地减少不利后果。 对于AI开发人员 尽职调查至关重要。公司应该考虑与服务和数据提供商建立全面的合同,这对于防止人工智能开发过程中可能出现的潜在法律责任至关重要。例如,在训练AI模型时,对从第三方获得的数据使用许可协议可以帮助确保IP合规性。公司还可以考虑采用合同和技术,以帮助保护其AI系统和敏感数据免受潜在威胁和逆向工程的影响。 对于AI模型的用户 企业应该清楚地了解他们使用的生成AI工具的使用条款,这可以帮助公司应对潜在的许可限制和限制,并了解其法律责任。 对于版权所有者 照片:GettyImages/popba 可能值得明确说明该作品不适用于训练AI模型或版权作品可用的条件。此外,实施技术保护措施可以进一步保护受版权保护的作品免受未经授权的使用。 照片:GettyImages/dem10 WIPO知识产权和前沿技术对话是一