您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[WIPO]:2024年帮助创新生态系统做好准备迎接人工智能(AI):知识产权政策工具包报告 - 发现报告

2024年帮助创新生态系统做好准备迎接人工智能(AI):知识产权政策工具包报告

信息技术2024-02-29-WIPOL***
AI智能总结
查看更多
2024年帮助创新生态系统做好准备迎接人工智能(AI):知识产权政策工具包报告

WIPO2024年3月发布的 《帮助创新生态系统做好准备迎接人工智能(AI):知识产权政策工具包》报告 帮助创新生态系统做好准备 迎接人工智能(AI) 知识产权政策工具包 目录 前言4 致谢6 导言7 1/人工智能入门9 什么是人工智能?9 数据的重要性10 什么是生成式人工智能?13 新兴趋势以及未来可能发生的情况14 2/当前的人工智能发明和支持发明者的可能行动17 人工智能发明的范围17 知识产权局和政策制定者可能采取的行动22 3/根据专利法,谁(或什么)是“发明人”?29 为什么专利法只专注于人类的发明人?29 谁(或什么)是“发明人”?专利法中“发明人”的概念30 为什么人工智能挑战人类发明者的概念?32 4/为人工智能发明世界做好准备37 政策讨论的起点37 专利的经济和社会目的39 应对人工智能生成的发明的可能选择41 可能的连锁反应50 政策制定者应对人工智能生成的发明的可能行动51 附录:案例研究53 拉丁美洲植保协会(CropLifeLatinAmerica)53 肯尼亚的HelloTractor54 突尼斯的DigiSmartSolutions55 印度SigTuple57 美国的Sign-Speak58 斯里兰卡JendoInnovations59 泰国Meticuly60 尾注62 前言 人工智能正在改变我们工作、学习和交流的方式,似乎每隔一天就会带来惊人的进步。以人工智能工具GNoME为例,它鉴定出了220万种新晶体,其中包括可用于改进计算机芯片、电池和太阳能电池板等技术的38万种稳定材料1。这项由人工智能驱动的研究代表着人类已知稳定材料的数量级增长,这仅仅是人工智能推动科学发现和创新的一个例子。 人工智能专利申请的趋势也强化了我们正在快速发展的感觉。过去五年来,数字技术专利申请的增长速度超过平均水平170%,人工智能专利申请的增长速度超过了700%2。生成式人工智能已成为全球各地的头条新闻,目前已超过人工智能相关专利的五分之一,而且这一数字仍在快速上升3。 作为一个联合国机构,我们相信,人工智能巨大的变革能力应该用于改进我们的世界,使其变得更美好。从优化作物产量的精准农业,到预测疾病爆发、优化水资源管理和气候变化建模,人工智能能够而且应该促进创新,助力2030年可持续发展目标回到正轨。 在这种复杂的背景下,政策制定者必须努力应对人工智能给知识产权生态系统带来的多方面的、全新的问题,在支持创新的同时尽量平衡相互竞争的利益关系,并最终找到适应国家政治、经济和社会需求的最佳前进道路。 我们希望这份指南能够帮助政策制定者在这片未知领域中航行并找到前进之路,不仅服务于他们的国家,而且还建立一个全球生态 系统,让人工智能创新使我们所有人都受益。邓鸿森 世界知识产权组织总干事 、 、 、 致谢 该工具包由世界知识产权组织知识产权和前沿技术司编写,并借鉴了DarylLim(宾夕法尼亚州立大学)、Giuseppina(Pina)D’Agostino (约克大学)、AlexandraGeorge(新南威尔士大学)和RüdigerUrbanke (洛桑联邦理工学院)编写的各种背景论文。报告团队感谢CarstenFink(WIPO)、AndrasJokuti(WIPO)、TomokoMiyamoto(WIPO)和MartinCorrea(WIPO)的审阅。团队还感谢CarstenFink、AlexanderCuntz(WIPO)和HansueliStamm(IPI)分享了他们的论文《人工智能和知识产权:一个经济的视角》4,本工具包引用了该论文的概要。 导言 人工智能技术正以指数级速度发展。人工智能模型的进步,特别是大语言模型和生成式人智能,正在彻底改变许多领域,包括创新空间。从智慧农业解决方案、气候变化建模到用于健康和教育的人工智能,所有的人工智能创新都是解决最紧迫的全球问题的关键。 人工智能模型的开发和训练需要大量投资,包括人力资金、计算机处理能力和电力。有人估计,训练下一代大语言模型(largelanguagemodels)的成本将在几年内超过10亿美元。 这些新模型结合数据集并产生见解的能力正在推动人工智能新产品和新工艺的发展,例如在温室里协助不堪重负的蜜蜂进行授粉的农业机器人、为手语翻译提供语音的手持式智能设备,或人工智能驱动的供应链和物流流程。 人工智能也被人类创新者用作高效的工具,例如,识别潜在的新药候选药物,或协助工程设计。 人工智能创新是以下这些例子的核心:人工智能模型、基于人工智能的产品和工艺,以及将人工智能用作创新工具。知识产权(IP)是关键的杠杆,政策制定者用它来创建适当的创新生态系统,并促进人工智能创新。 然而,随着人工智能变得更加自主,并有可能改变创新过程,人工智能给知识产权和知识产权系统带来了许多问题和挑战。知识产权工具包的目的是为政策制定者提供一个框架,以了解当前人工智能创新的现状,并对未来人工智能越来越自主的情况作出思考。 本工具包从人工智能入门开始,帮助政策制定者理解人工智能技术的一些基本原则、现状、可能的未来。 第2部分考虑了人工智能领域的创新者目前面临的许多挑战,因为他们正在探索如何充分利用知识产权来保护他们的想法和投资。本工具包旨在为政策制定者提供一个框架,帮助他们区分不同类型的人工智能创新、确定相关的知识产权问题,并为政策制定者提供可行性建议,来创建他们的生态系统或为创新者提供指导。 随着人工智能变得越来越自主,政策制定者将不得不考虑,人工智能何时可能被视为知识产权法概念中的发明人。第3部分深入探讨了一些考量因素,政策制定者可能会发现这些因素对于评估人工智能创新是否已经进入新阶段非常有用。 第4部分列出了:如果人工智能能够自主发明,政策制定者可以考虑的一些选择,不同选择的利弊以及对知识产权法律框架的潜在连锁反应。 总体而言,本知识产权政策工具包旨在使政策制定者能够参与到如何最好地塑造人工智能创新生态系统的主题中,并在牢固理解知识现状的基础上构建未来的工作。 1/人工智能入门 什么是人工智能? 人工智能(AI)是计算机科学与工程的一个分支,致力于创建一种系统,其能够执行需要人类智慧才能完成的任务。这些任务包括理解自然语言、识别图像、作出决策和从数据中学习。 机器学习(ML)是人工智能的一个子集,专门用于开发算法和模型,允许计算机从数据中学习,并在没有显式编程的情况下,提高其在特定任务上的性能。人工智能和机器学习经常互换使用,因为最先进的人工智能系统都是基于机器学习算法。 在人工智能中,术语“架构”通常用于描述人工智能系统的整体设计或总体框架。人工智能算法是指导人工智能系统从数据中学习从而执行特定任务的一组指令。术语“人工智能模型”指的是基于数据训练的算法的具体实施。 在人工智能系统中,架构提供框架,算法定义任务实施,而模型 是基于数据集训练的算法的实施。 人工智能有着丰富而复杂的历史,20世纪中期作为一门学科出现。早期的研究集中在符号人工智能上,旨在利用基于规则的推理创建智能系统。举个例子:“下雨时,提醒用户带伞。”这种方法取得的成功是有限的。生活实在太复杂,无法列出所有可能的规则。在这种方法达到极限(有时被称为第一个“人工智能的冬天”)之前,人工智能在解决问题、逻辑推理和游戏程序方面取得了初步进展。 20世纪90年代见证了统计学方法的兴起,如机器学习。这很快成 为主流方法,并且直到今天仍然如此。统计学方法不是明确的逻辑或基于规则的推理,而是基于当前的输入来计算可能结果的概率。然后,系统要么选择最可能的结果,要么根据结果的概率对结果进行抽样,也就是说,它选择那些更有可能发生的结果。 数据的重要性 从数据中学习 机器学习的一种类型是监督式机器学习,即算法从一个标记的数据集中学习,该数据集将特定的输入连接到特定的输出,也称为训练数据。 机器学习算法最简单的例子是线性回归,其中输入和输出之间是线性关系。这类似于绘制一个已知的数据集(x,y)的坐标,并找到最接近的线性关系,从而能够预测更多数据点(见图1)。 图1:线性回归 这样的线性回归往往过于简单,无法解决机器学习问题。本质上, 很多问题不能用线性关系来表示。 取而代之的是神经网络(neuralnetworks)。神经网络是一种受人类大脑启发的计算模型。神经网络由相互连接的节点组成,这些节点被称为神经元,它们被组织成层。所谓的深度神经网络是具有很多层的架构。 神经网络接收输入的数据,通过这些层对其进行处理并生成输出。与线性回归相比,输入和输出之间的关系更为复杂。每个神经元都有几个可调参数(例如,权重),通过调整它们,可以创建许多不同的输入-输出关系(见图2)。通过选择神经元的数量和神经网络的结构,使其算法能够解决特定的问题。 图2:输入-输出关系 从训练数据中学习,包括调整模型参数,以便当它接收到一个被训练过的输入时,就会产生一个对应的输出。重要的是要理解,机器学习算法不仅仅是简单地记忆一个数据集。神经元参数最终将允许神 经网络开始预测任何输入在统计学上可能的输出。 其基本思想是:只要标记足够多的数据,机器学习模型也将能够为它从未见过的输入产生有意义的输出。这类似于人类的孩子,即使这个孩子只见过拉布拉多犬和腊肠犬,也能够正确地将贵宾狗识别为狗。这就是我们通常所说的“泛化”。 最重要的结论如下: -在神经网络中,相关参数并没有明确地编程到系统中,而是从数据中学习得到。 -一旦给神经元分配了一组参数,神经网络就能为任何给定输入预测输出。 -这种模型有时也被称为训练模型。规模就是一切 目前人工智能的快速发展主要受到规模的影响。早期的机器学习 系统只有很少的参数,并且可能在几千个标记数据点示例上进行训练,而今天的系统有数万亿个参数。 相比之下,人类大脑只有不到1000亿个神经元,所以只有一小部分参数被构建到当前的机器学习模型中。尽管人类大脑对模型的访问数据受限于我们的一般知识,例如我们读过的、听过的和学过的内容,但当前机器学习模型基本上是在人类已知的所有数据上进行训练。 计算和存储技术的快速发展使得这一点成为可能。从零开始训练神经网络是一项艰巨的任务,且通常要花费数亿美元5。 然而,一旦这样的神经网络被训练出来,它就可以被改进,从而 在特定的任务上表现良好。这种改进的成本要低得多。模型的重要性 设计一个好的机器学习模型的关键是选择一个合适的底层函数。 换句话说,目前,机器学习模型需要由人类专门设计,以适应特定的任务,然后使用高质量的数据集进行训练。神经网络和深度神经网络是比较受欢迎的选择。 什么是生成式人工智能? 2022年11月推出的ChatGPT使生成式人工智能成为焦点并获得主流关注。 传统的人工智能系统主要用于分析数据和进行预测。 生成式人工智能则更进一步,能够创建与训练数据相似的新数据。其底层网络架构基于一些方法,如转换器(以GPT为例,代表生成式预训练转换器)或GANs(生成式对抗网络)。这些方法使得生成式人工智能能够创造新的内容,包括音频、代码、图像、文本、模拟和视频。然而,生成式人工智能并不仅限于内容生成。生成式人工智能是指任何经过训练后能够动态创建输出的机器学习模型。 大语言模型 人工智能的最新进展是特别适合关联语言的一类模型。在一种语言中,单个单词形成一个序列,其含义不仅通过单词的选择来表达,而且也通过这些单词之间的关系来表达。这需要适合处理序列的模型,并且包含足够的长期记忆从而有意义地捕获这些关系。目前常见的具备该功能的类型被称为转换器(transformers),显而易见的,由此 产生的模型被称为语言模型。由于当前的模型非常大,它们通常被称为大语言模型(LLMs)。 语言模型和大语言模型并不局限于对人类语言的处理。 也就是说,语言模型和大语言模型根本不局限于英语等人类语言的处理和生成。在机器学习术语中,语言可以指在上下文(语法、单词之间的关