让创新生态系统为AI做好准备IP策略工具包 让创新生态系统为AI做好准备 IP策略工具包 这项工作是根据知识共享归因4.0国际许可。 允许用户在未经明确许可的情况下复制、分发、改编、翻译和公开执行本出版物,包括用于商业目的,但前提是内容附有WIPO是来源的确认,并且如果对原始内容进行了更改,则应清楚地表明该内容。 建议引用:世界知识产权组织(WIPO)(2024)。为AI做好创新生态系统准备:知识产权政策工具包。日内瓦:WIPO。DOI:10.34667/tind.48978 改编/翻译/衍生产品不应带有任何官方标志或徽标,除非它们已获得WIPO的批准和验证。请通过WIPO网站与我们联系以获得许可。 对于任何衍生作品,请包括以下免责声明:“WIPO秘书处对原始内容的转换或翻译不承担任何责任。” 当WIPO发布的内容(如图像、图形、商标或徽标)归于第三方时,此类内容的用户全权负责与权利持有人进行权利清算。 要查看此许可证的副本,请访问https://creativecommons.org/licenses/by/4.0 根据本许可证产生的任何不能友好解决的争议,应根据当时有效的联合国国际贸易法委员会(贸易法委员会)仲裁规则提交仲裁。作为此类争议的最终裁决 ,各方应受到因仲裁而作出的任何仲裁裁决的约束。 本出版物中使用的名称和材料的表述并不意味着WIPO对任何国家、领土或地区或其当局的法律地位或对其边界或边界的划定表示任何意见。 本出版物无意反映成员国或WIPO秘书处的观点。 提及特定公司或制造商的产品并不意味着它们得到WIPO的认可或推荐,而不是未提及的类似性质的其他公司或产品。 ©WIPO,2024 世界知识产权组织34,chemindesColombettes,P.O.Box18CH-1211Geneva20,Switzerland wipo.int ISBN:978-92-805-3604-1(打印) ISBN:978-92-805-3605-8(在线) 国际归因4.0(CCBY4.0)封面:GettyImages/MF3d;LariBatWIPO出版物第2003EN号 Contents 1/AI底漆7 2/当前AI发明和支持发明人的可能行动12 3/根据专利法,谁(或什么)是“发明人”?18 19 4/为AI产生的发明世界做好准备23 附件:案例研究33 Sign-Speak,美利坚合众国36Meticuly,泰国37 附注38 3 前言 AI正在改变我们的工作,学习和交流方式,似乎每隔一天就会取得惊人的进步。以AI工具GNoME为例 ,它确定了220万个新晶体,包括380,000种稳定材料,可以改善计算机芯片,电池和太阳能电池板等技术。1这项人工智能驱动的研究代表了人类已知的稳定材料的数量级扩展,只是人工智能如何推动科学发现和创新的一个例子。 人工智能专利的趋势也增强了我们正在快速前进的感觉。在过去五年中,数字技术专利申请的增长速度比平均水平快170%,而人工智能的增长速度超过700%。2生成型人工智能已经成为世界各地的头条新闻,现在超过五分之一的人工智能相关专利,而且这个数字正在迅速上升。3 作为联合国机构,我们认为,人工智能的巨大转型能力应该被驱动,让我们的世界变得更美好。从能够优化作物产量的精准农业到预测疾病爆发、优化水资源管理和气候变化建模的新方法,人工智能能够而且应该促进创新,帮助我们实现2030年可持续发展目标。 在这种复杂的背景下,政策制定者必须努力解决人工智能给知识产权生态系统带来的多方面、有时是新颖的问题,因为他们试图在支持创新的同时平衡相互竞争的利益,并最终找到符合国家政治、经济和社会需求的最佳前进道路。 我们希望本指南将帮助政策制定者驾驭这些未知的水域,并找到自己的前进道路,这不仅将为他们的国家服务,而且还将建立一个全球生态系统,让人工智能创新使我们所有人受益。 唐大人 世界知识产权组织总干事 4 Acknowledgments 该工具包由WIPO知识产权和前沿技术部编写,并借鉴了DarylLim(宾夕法尼亚州立大学),Giseppia(Pia)D'Agostio(约克大学),AlexadraGeorge(新南威尔士大学)和RüdigerUrbae(洛桑联邦理工学院)编写的各种委托背景文件。报告小组感谢CarsteFi(WIPO)、AdrasJoti(WIPO)、TomooMiyamoto(WIPO)和MartiCorrea(WIPO)的同行评审。该团队还感谢CarsteFi,AlexaderCtz(WIPO)和HaseliStamm(IPI)分享了他们的论文“人工智能与知识产权:经济视角”。4其中的概要可以在这个工具包中找到。 5 Introduction AI技术正在以指数的速度发展。AI模型的进步,尤其是大型语言模型和生成AI,正在彻底改变许多领域,包括创新空间。AI创新,从智能农业解决方案和气候变化建模到 用于健康和教育的人工智能是解决一些最紧迫的全球问题的关键之一。 AI模型的开发和培训可以代表一项重大投资,包括人力资本,计算机处理能力和电力。有人估计培训下一代大型语言模型将在几年内通过10亿美元。 这些新模型结合数据集和产生见解的能力正在推动结合AI的新产品和流程的开发,例如在温室中协助授粉的农业机器人,蜜蜂被任务的规模所淹没,手持智能设备提供语音以进行手语翻译,或AI驱动的供应链和物流流程。 人工智能也被人类创新者用作一种高效的工具,例如,帮助识别潜在的新药候选物或协助工程设计。 AI创新是所有这些示例的核心:AI模型,基于AI的产品和流程以及将AI用作创新工具。知识产权(IP )是可以成为 政策制定者用来塑造适当的创新生态系统,并帮助他们培育AI创新。 但是,随着AI变得更加自主,并有可能改变创新过程,AI在现在和将来对IP和IP系统提出了许多问题和挑战。此IP工具包的目的是为决策者提供一个框架,以了解当前AI创新的状态,并思考AI变得越来越自主的未来。 该工具包从人工智能入门开始,帮助政策制定者了解人工智能技术的一些基本原理,它现在的位置以及未来的预期。 第二部分讨论了人工智能领域的创新者目前面临的许多挑战,因为他们正在探索如何充分利用知识产权来保护他们的想法和投资。该工具包旨在帮助政策制定者,为他们提供一个区分人工智能创新类型的框架,确定相关的知识产权问题,并建议政策制定者可以采取的行动来塑造他们的生态系统或为创新者提供指导 。 随着人工智能变得越来越自主,政策制定者将不得不考虑人工智能何时可以被视为知识产权法的发明者。第3部分探讨了政策制定者可能认为对评估人工智能创新是否进入新阶段有用的一些考虑因素。 如果人工智能能够自主发明,第4部分列出了政策制定者可以考虑的一些选择,包括不同选择的利弊以及对知识产权法律框架的潜在连锁反应。 总的来说,这个知识产权政策工具包旨在让政策制定者参与如何最好地塑造他们的人工智能创新生态系统,并通过对当前知识状况的深刻理解来构建他们未来的工作。 6 1/AI底漆 什么是AI? 人工智能(AI)是指计算机科学和工程学的分支,专注于创建能够执行通常需要人类智能的任务的系统 。 这些任务包括理解自然语言,识别图像,做出决策和从数据中学习。 机器学习(ML)是AI的一个子集,专门开发算法和模型,允许计算机从数据中学习并提高其在特定任务上的性能,而无需显式编程。 AI系统基于ML算法。 在AI中,“架构”一词通常描述AI系统的总体设计或总体框架。AI算法是指导AI系统从数据中学习以执行特定任务的指令集。术语“AI模型”是指在数据上训练的算法的特定实现。 在AI系统中,架构提供框架,算法定义任务执行,模型是算法的数据集训练实现。 AI具有丰富而复杂的历史,在20年代中期成为一门学科th世纪。早期的努力集中在符号AI上,旨在使用基于规则的推理创建智能系统。例如:“下雨时,提醒用户带伞。“这种方法取得了有限的成功。生活太复杂了,无法列出所有可能的规则。在解决问题,逻辑推理和游戏程序方面取得了初步进展,直到这种方法达到其局限性(有时被称为第一个“AI冬天”)。 1990年代见证了统计方法的兴起,例如ML。这很快成为主导方法,直到今天仍然如此。代替显式逻辑或基于规则的推理,统计方法根据当前输入计算可能结果的概率。然后,系统要么选择最可能的结果,要么根据结果的概率对结果进行采样,也就是说,它选择那些更可能发生的结果。 数据的重要性 从数据中学习 一种类型的ML是监督ML,这意味着算法从将特定输入连接到特定输出的标记数据集(也称为训练数据 )中学习。 ML算法最简单的例子是线性回归,其中关系 之间的输入和输出是线性的。这类似于绘制一个已知的数据集(x,y)7 8坐标并找到最接近的线性关系,从而可以预测更多的数据点(见图1)。 图1:线性回归 这样的线性回归往往是一个过于简单的函数,无法解决ML问题,从本质上讲,许多问题无法用线性关系表示。 所以用神经网络代替。神经网络是一种受人脑启发的计算模型。神经网络由相互连接的节点组成,称为神经元,被组织成层。所谓的深度神经网络是具有很多很多层的架构。 网络获取输入数据,通过这些层对其进行处理,并生成输出。与线性回归相比,输入和输出之间的关系更加复杂。每个神经元都有几个可调参数(例如Procedre,权重),并且通过调整它们,可以创建许多不同的输入输出关系(参见图2)。可以选择神经元的数量和神经网络的结构以适合设计算法来解决的特定问题。 图2:输入输出关系 输入输出 从训练数据中学习涉及调整模型的参数,以便当它接收到训练的输入时,它会生成与为该输入学习的结果相似的输出。 重要的是要理解ML算法不仅仅是简单地记忆数据集。神经元的参数最终将允许网络开始预测任何输入的统计上可能的输出。 为AI做好创新生态系统的准备-知识产权政策工具包 潜在的想法是,只要有足够的标记数据,ML模型也将能够为它从未见过的输入产生有意义的输出。这类似于人类的孩子,即使孩子只看过拉布拉多和腊肠犬,也可以正确地将贵宾犬识别为狗。这就是通常所说的概括。 最重要的收获如下: 在神经网络中,相关参数没有明确地编程到系统中,而是从数据中学习。 –一旦分配了一组参数,神经元就会使神经网络能够预测9 来自任何给定输入的输出。 –这样的模型有时也被称为训练模型。 规模就是一切 人工智能目前的快速发展主要是由于规模,而早期的机器学习系统几乎没有参数,并且在可能有几千个标记的数据点示例上进行了训练,而今天的系统有数万亿的参数。 相比之下,人类大脑只有不到1000亿个神经元,因此当前ML模型中内置的参数数量只有一小部分。虽然人类大脑访问的数据仅限于我们的常识,例如我们阅读,收听和学习的内容,但当前的ML模型也基本上是根据人类已知的所有数据进行训练的。 计算和存储的快速发展使这成为可能。从头开始训练神经网络是一项艰巨的任务,通常需要花费数亿美元。5然而,一旦这样的神经网络得到了训练,它就可以被改进以在特定任务上表现良好。改进的成本要低得多。 模型的重要性 设计一个好的机器学习模型的一个关键部分是选择一个合适的基础函数。换句话说,目前,机器学习模型需要由人类专门设计以适应某个任务,然后用高质量的数据集进行训练。神经网络和深度神经网络是流行的选择。 什么是生成式AI? 2022年11月ChatGPT的推出使生成AI成为人们关注的焦点和主流。 传统的AI系统主要用于分析数据和进行预测,而生成的AI更进一步,能够创建类似于其训练数据的新数据。 基础网络架构基于诸如变压器(GPT,例如, 代表生成预训练变压器)或GAN(生成对抗网络)。这些方法使生成AI可以创建新内容,包括音频,代码 ,图像,文本,模拟和视频。但是,生成AI不仅限于内容生成。生成AI是指任何能够在训练后动态