专利景观报告 生成人工智能 专利景观报告 生成人工智能 这项工作是根据知识共享归因4.0国际许可。 允许用户在未经明确许可的情况下复制、分发、改编、翻译和公开执行本出版物 ,包括用于商业目的,但前提是内容附有WIPO是来源的确认,并且如果对原始内容进行了更改,则应清楚地表明该内容。 建议引文:世界知识产权组织(WIPO)(2024)。生成人工智能。专利环境报告。日内瓦: WIPO.https://doi.org/10.34667/tind.49740 对于任何衍生作品,请包括以下免责声明:“WIPO秘书处对原始内容的转换或翻译不承担任何责任。” 当WIPO发布的内容(如图像、图形、商标或徽标)归于第三方时,此类内容的使用者全权负责与权利持有人进行权利清算。 要查看此许可证的副本,请访问https://creativecommons.org/licenses/by/4.0 根据本许可证产生的任何不能友好解决的争议,应根据当时有效的联合国国际贸易法委员会(贸易法委员会)仲裁规则提交仲裁。作为此类争议的最终裁决,各方应受到因仲裁而作出的任何仲裁裁决的约束。 本出版物中使用的名称和材料的表述并不意味着WIPO对任何国家、领土或地区或其当局的法律地位或对其边界或边界的划定表示任何意见。 本出版物无意反映成员国或WIPO秘书处的观点。 提及特定公司或制造商的产品并不意味着它们得到WIPO的认可或推荐,而不是未提及的类似性质的其他公司或产品。 ©WIPO,2024 首次发布2024 世界知识产权组织34,chemindesColombettes,P.O.Box18CH-1211Geneva20,Switzerland ISBN:978-92-805-3648-5(打印) ISBN:978-92-805-3649-2(在线) ISSN:2790-7007(打印) ISSN:2790-7015(在线) 封面:GettyImages/Just_Super,Naeblys Contents 13 13 本报告的动机16 119 19 20 有哪些GenAI模型?22 23 233 33 35 43 345 46 49 4GenAI模式的专利趋势51 全球发展51 顶级专利所有者52 发明人的关键位置55 GenAI模型和GenAI模式之间的连接55 5GenAI应用的专利趋势57 全球趋势57 顶级专利所有者59 发明人的关键位置62 63 64 3 进一步考虑67 对GenAI使用的担忧67 与GenAI相关的专利分析的局限性和未来69 附录71 A.1专利分析方法 71 A.2专利指标73 A.3模型、模式和应用之间的相互依赖74 A.4专利检索76 A.5提示82 A.6使用TheLens进行科学出版物查询85 A.7非专利中提到的挖掘软件和数据集 文献语料库86 A.8GenAI应用的描述/示例专利87 参考文献105 4 Acknowledgments 本关于生成人工智能的专利格局报告是在MarcoAlemán(知识产权和创新生态系统部门助理总干事)的领导下,在AlejandroRocaCampaña(创新者知识产权部门高级总监)和AndrewCzajkowski(技术和创新支持司司长)的指导下编写的。 由ChristopherHarrison(专利分析经理,知识产权分析部门,技术和创新支持部门)领导,并由日本专利局提供的信托基金日本工业产权全球慷慨的财政支持。 该报告是由ChristopherHarriso和LashmiSpriya(技术和创新支持部门知识产权分析科专利分析官)领导的项目团队编写的,其中包括KaiGrame,JocheSpc,KlasJa和MichaelFree(均来自EcoSight),PatriceLopez(科学矿工)以及HogKa(专利分析官,知识产权分析科,技术和创新支持部门),AlesadrBeliaov和CraigDsoza(前青年专家,技术和创新支持部门)。 我们还要感谢UlrikeTill(知识产权和前沿技术司司长)对报告进行了审查并提供了宝贵的意见。最后,我们还要感谢CharlotteBeauchamp(出版物和设计科科长)领导的WIPO编辑和设计团队。 电子邮件:ip.analystics@wipo.int 5 6 主要发现和见解 2022年11月,OpeAI的ChatGPT聊天机器人的发布大大提高了公众对生成AI(GeAI)的热情。包括Nvidia首席执行官Je-HsHag在内的许多人都将其描述为GeAI的“iPhoe时刻”。这是因为OpeAI平台使所有用户更容易访问高级GeAI程序,特别是大型语言模型(LLM)。这些模型已经达到了新的性能水平,展示了各种实际应用的潜力,引发了一波研发浪潮,以及对GeAI的大型企业投资。 本《世界知识产权组织专利状况报告》提供了对GeAI领域专利活动和科学出版物的观察,并以2019年世界知识产权组织人工智能技术趋势出版物为基础。它旨在阐明当前的技术发展,不断变化的动态以及预期使用GeAI技术的应用。它还确定了主要的研究国家,公司和组织。 自2017年以来,GenAI专利家族和科学出版物大幅增加 GenAI在过去几年中的崛起主要由三个因素推动:更强大的计算机,大型数据集作为训练数据来源的可用性以及改进的AI/机器学习算法。诸如LLM中的变压器架构之类的发展已经大大推进了GenAI。这使得在许多不同领域开发复杂的应用程序成为可能。 GeAI的技术进步反映在专利活动的急剧增加上。在过去的10年中,GeAI的专利家族数量已从2014年的仅733个增加到2023年的14,000多个。自2017年推出变压器以来,大型语言模型背后的深度神经网络架构已成为GeAI的代名词,GeAI的专利数量增加了800%以上。同期,科学出版物的数量增加了更多,从2014年的116篇增加到2023年的34,000多篇。仅在2023年,就有超过25%的GeAI专利和超过45%的GeAI科学论文发表。 7 专利格局报告-生成人工智能 8GenAI专利家族GenAI科学出版物 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 15,000 10,00050000500010,00015,00020,00025,00030,00035,000 GenAI拥有最多的专利的顶级组织是哪些? 1.腾讯 2.平安保险集团 3.百度 4.中国科学院 5.IBM 腾讯、平安保险集团和百度拥有最多的GeAI专利。腾讯计划在其微信等产品中添加GeAI功能,以改善用户体验。平安专注于承保和风险评估的GeAI模型。百度是GeAI的早期参与者之一,最近发布了其最新的基于LLM的AI聊天机器人ERNIE4.0。中国科学院(第四)是排名前十的唯一研究机构。阿里巴巴(第六名)和字节跳动(第九名)是排名前十的其他中国公司。 IBM(第五),Alphabet/谷歌(第八)和微软(10th)是GeAI专利方面排名第一的美国公司。IBM开发了GeAI平台watsox,使公司能够部署和定制LLM,重点关注数据安全性和合规性。Alphabet/Google的AI部门DeepMid最近发布了其最新的LLM模型Gemii,该模型正在逐步集成到Alphabet/Google的产品和服务中。微软是GeAI的另一个关键参与者,也是OpeAI的投资者。OpeAI本身直到最近才提交了其第一批GeAI专利。排在前十名的是电子集团三星电子(第七名)。大韩民国。 企业大学/研究组织9 IBM (美国 ) Microsoft( 美国) 字母(美国) 浙江大学(中国) Adobe(美国) 平安保险集团(中国 ) 索尼集团(日本 ) 华为(中国 ) 百度(中国) 国家电网 (中国) 中国移动(中国 ) 网易(中国 ) BBK 电子(中国) 三星电子(韩国) 清华大学(中国) NTT (日本) 字节跳动(中国) 阿里巴巴集团(中国) 腾讯控股 (中国) 中国科学院 (中国) 哪些机构在GenAI上发表了最多的科学出版物? 自2010年以来,中国科学院在科学出版物方面显然处于领先地位,出版物超过1100种。清华大学和斯坦福大学分别以600多种出版物排名第二和第三。Alphabet/Google(第四)是前20名(556种科学出版物)中的唯一公司。 但是,当通过引用次数来衡量科学出版物的影响时,公司占主导地位。Alphabet/Google在很大程度上是领先的机构,其他七家公司也在前20名。OpenAI的案例也值得注意。在我们的GenAI科学出版物语料库中,该公司仅发表了48篇文章(325th机构在出版物数量方面),但这些出版物总共收到了来自其他科学出版物的11,816次引用(13th总体)。 GenAI技术在哪里发明? 1.中国 2.美国 3.大韩民国 4.Japan 5.印度 6.UnitedKingdom 7.Germany 2014年至2023年期间,根据公布的专利发明人地址,中国的发明人负责38,000多个专利家族。自 2017年以来,中国每年在该领域发布的专利数量超过所有其他国家的总和。 主要发现和见解 在2014年至2023年之间,美国拥有约6,300个专利家族,是GenAI专利的第二重要研究地点。亚洲国家韩国 ,日本和印度是GenAI的其他主要研究地点,均在全球前5个国家中排名(第三, 10分别为第四和第五)。英国是欧洲领先的地点(全球第六),同期发布了714项专利。但是,德国紧随其后(708个专利家族),并且近年来发布了比英国更多的GenAI专利。这些顶级发明人地点占与GenAI相关的全球专利活动的大部分(94%)。 法国 以色列 加拿大 世界其他地区 Germany UK 印度 Japan 大韩民国 US 中国 哪个GenAI模型拥有最多的专利? 近年来,已经开发了许多GenAI程序或模型。最重要的GenAI模型包括: 1.生成对抗网络(GAN) 2.变分自动编码器(VAE) 3.基于解码器的大型语言模型(LLM) 然而,并非所有GenAI专利都可以根据专利摘要、权利要求或标题中的可用信息分配给这三个特定的核心模型。 在这些GenAI模型中,大多数专利属于GAN,在2014年至2023年之间,该模型类型的专利家族有9,700 个,仅在2023年就发布了2,400个专利家族。 就专利而言,VAE和LLM是第二大和第三大模型,约有1800个2014年至2023年之间分别有1300个新专利家族 。 专利格局报告-生成人工智能 就专利增长而言,GAN专利在过去十年中表现出最强劲的增长。然而,这种情况最近有所放缓。相比之下,扩散模型和LLM在过去三年中显示出更高的增长率,扩散模型的专利家族数量从2020年的18个增加到2023年的441个,LLM的专利家族数量从2020年的53个增加到2023年的881个。由ChatGPT等现代聊天机器人引起的GeAI热潮显然增加了对LLM的研究兴趣。 GenAI中使用的主要数据类型是什么专利?11 主要的GenAI数据类型包括: –Image –视频 –演讲稿 –声音 –音乐 在不同的GeAI模式或数据输入和输出的类型中,大多数专利属于图像/视频类别。图像/视频数据对于GAN尤为重要。涉及文本和语音/声音/音乐处理的专利是LLM的关键数据类型。其余的模式:3D图像模型,化学分子/基因/蛋白质和代码/软件,到目前为止,专利要少得多。与与GeAI核心模型相关的专利一样,某些专利无法明确分配给特定的数据类型。此外,由于某些GeAI模型(例如多模态大型语言模型(MLLM))克服了仅使用一种类型的数据输入或输出的局限性,因此某些专利被分配给了多个模式。 GenAI专利的主要应用领域 GenAI专利的关键应用领域包括: 1.软件 2.生命科学 3.文档