2023年全球生成式AI 产业研究报告 2023GlobalGenerativeAIIndustryReport 指导单位:中国互联网协会 中国软件行业协会 参编单位:天津市人工智能学会 至顶科技 至顶智库 2023年5月 1 前言 生成式AI作为当前人工智能的前沿领域,成为全球最热的科技话题。2022年OpenAI发布ChatGPT,生成式AI在模型应用层面实现重要突破,仅两个月突破1亿月度活跃用户数,成为史上用户增长速度最快的消费级应用。全球多家科技企业加大在生成式AI领域的研发投入力度,不断在技术、产品及应用等方面推出重要成果,持续推动人工智能的创新与商业化落地进程,也将带动产业链相关企业快速发展。 在此背景下,在中国互联网协会、中国软件行业协会指导下,天津市人工智能学会、至顶科技、至顶智库联合发布《2023年全球生成式AI产业研究报告》,该报告从全球视角出发,对生成式AI的产业概况、基础设施、算法模型、场景应用、机遇挑战等方面进行梳理,全面展现生成式AI的产业发展情况,为政府部门、行业从业者、教育工作者以及社会公众更好了解生成式AI提供参考。 天津市人工智能学会、至顶科技、至顶智库 第七届世界智能大会,中国天津,2023年5月 2 ©2023.5ZDInsightsinsights.zhiding.cn 专家寄语 王蕴韬 中国信通院云计算与大数据研究所副总工 胡清华 天津市人工智能学会理事长 天津大学 智能计算学部教授 作为近两年人工智能领域的发展热点,生成式AI引发社会广泛关注。未来,AIGC有关的内容生产工具将极大改变人们的工作生活方式,也将带来社会生产力的全面提升。在新技术新应用快速发展的同时,也需关注由此带来的就业、知识产权等问题,促进产业健康持续发展。 人工智能的发展正在进入新的历史时期,生成式AI的未来充满着无限的可能性。ChatGPT的问世无疑是近年来人工智能领域最重要的技术突破之一。因此,我们必要全面了解人工智能技术的现状与趋势,探讨生成式AI的机遇和挑战,更好地迎接智能时代的到来。 杨巨成 天津市人工智能学会 副理事长天津科技大学 人工智能学院教授 冯为嘉 天津市人工智能学会 秘书长 天津师范大学 计算机与信息工程学院网络工程系系主任 生成式AI作为全新的内容生产工具,必将改变人类的生活方式。随着技术不断进步和算法不断优化,未来生成式AI有望在办公、消费、文娱等各场景得到广泛应用,并在不同场景中降低创作者门槛,大幅提升内容生产效率。 伴随人工智能大模型的不断发展,生成式AI成为一个备受关注的前沿领域,将大概率改变人类与世界的互动方式。从程序设计到艺术创作,该技术正在为各行各业带来可能,有望持续推动社会的发展和人类文明的进步。 3 ©2023.5ZDInsightsinsights.zhiding.cn 报告目录 1.生成式AI产业概况篇 2.生成式AI基础设施篇 3.生成式AI算法模型篇 4.生成式AI场景应用篇 5.生成式AI机遇挑战篇 4 开篇:伴随人类文明进步和科技发展,语言的传播创造方式日益多元 语言作为人类沟通交流的主要方式,其发展历程分为三大阶段。语言1.0时代:从人类语言诞生到公元前16世纪殷商时期甲骨文的出现,文字成为人类交流的重要方式;语言2.0时代:从公元105年蔡伦发明造纸术到1946年世界第一台电子计算机诞生,语言开始通过各类机器实现传播;语言3.0时代:伴随互联网出现,人工智能NLP及生成式AI等技术的快速发展与相关应用落地,使得机器生成和创造语言的方式成为了可能。 语言发展历经三大时代,生成式AI成为语言3.0时代的核心 语言1.0时代 语言2.0时代 语言3.0时代 (公元前10万年-公元前16世纪) (公元105年-20世纪40年代) (20世纪50年代至今) 公元前10万年: 公元前16世纪: 殷商时期中国人创造甲骨文。 公元前2900年: 古埃及人开始使用象形文字进行书写。 公元前3200-2600年:楔形文字经历诞生到持续使用。 新石器时代中期以后:中国出现象形文字。 1946年: 第一台电子计算机在美国诞生。 1876年: 贝尔发明第一部电话。 1837年: 美国人摩尔斯和两个英国工程师库克、怀斯顿同时发明电报。 公元1041-1048年间:毕昇发明活字印刷术,为现代印刷术和印刷机的发展奠定基本原理。 2010年: IBM宣布开发名为Watson系统,该系统能够理解自然语言中的问题,然后使用人工智能根据维基百科提供的信息给出答案。 1950年: 艾伦·图灵提出图灵测 2017年: Transformer架构提出,其在简单语言问答和语言建模任务上有较好表现。 1969年: 互联网出现,随着互联网商 2022年: OpenAI发布ChatGPT,成为生成式AI的里程碑事件。仅用2个月时间月活用户已突破1亿,成为史上增长最快消费者应用。 2001年: 第一个神经语言模型,前馈 人类原始语言诞生,正式语言约产生于公元前4万年。 公元105年: 汉朝蔡伦发明造纸术。 试,标志着人工智能领域的开端。 业化和全球普及,为更大规模语言语料数据获取及传输提供网络支撑。 神经网络由Bengio等人提出。 资料来源:至顶智库结合公开资料整理绘制。5 ©2023.5ZDInsightsinsights.zhiding.cn 2023年全球生成式AI产业研究报告 1.生成式AI产业概况篇 6 1.1生成式AI概念及内容生成阶段 生成式人工智能(GenerativeAI)是在专业生成内容(PGC)、用户生成内容(UGC)之后,利用人工智能技术自动生成内容的新型生产方式。生成式AI基于海量训练数据和大规模预训练模型,自动生成创建文本、音频、图像、视频以及跨模态信息。自2022年OpenAI发布ChatGPT以来,全球爆发生成式AI热潮,诸多科技类企业纷纷推出生成式AI模型、产品和相关底层基础设施及服务。 PGC:专家创作时代 UGC:用户创作时代 AIGC:生成式人工智能时代 内容生成分为PGC、UGC及AIGC三大阶段 (20世纪90年代)(21世纪初)(21世纪—未来) 2017年,Transformer架构提出,其在简单语言问答和语言建模任务上有较好表现。 2022年8月,美国科罗拉多州博览会,数字艺术类冠军颁发给由AI自动生成的画作《太空歌剧院》。 2022年11月,OpenAI发布ChatGPT,成为生成式AI的里程碑事件。2023年1月,ChatGPT月活用户已突破1亿,成为史上增长最快的消费者应用。 20世纪90年代,基于“信息经济”的商业模式出现,互联网技术提供商提供技术服务,且从生产与组织内容的曝光中获得收益。门户网站、搜索引擎成为最主要产品。 21世纪初,伴随微信、微博、抖音、快手等众多社交媒体的出现,用户也可以真正参与到内容的创作之中,用户利用图文、短视频等多种方式记录生活点滴,同时也会增加人与人之间的交流与互动。 2023年3月,百度正式发布“文心一言”,推动国内生成式AI产品快 速发展与落地。 2023年3月,微软发布“Microsoft365Copilot”,将生成式AI与办公软件紧密结合,成为新的生产力工具。 2023年3月,NVIDIA在 GTC23发布AIFoundations,用于定制大语言模型和生成式AI。 资料来源:至顶智库结合公开资料整理绘制。7 1.2生成式AI产业发展驱动力 近年全球数据规模持续增长,IDC预计到2025年全球数据规模将达到175ZB,为人工智能模型训练提供海量数据资源;高性能AI芯片的推出为大规模预训练模型提供重要算力支撑;伴随技术的不断发展,Transformer、BERT、LaMDA、ChatGPT等模型实现快速迭代优化。在数据、算力和模型的共同推动下,全球生成式AI产业得以迅速发展,相关场景应用也不断丰富。 全球数据规模持续增长 175 2017年以来AI模型发展历程 27% 24% 24% 27% 26%131 101 65 23% 80 33 41 51 30%34% 201820192020202120222023E2024E2025E 全球数据量(ZB)同比增速 数据来源:IDC,至顶智库 算力呈现指数级上升 信息来源:ComputeTrendsAcrossThreeErasofMachine Google基于Transformer架构推出大规模预训练模型BERT,其包含预训练和模型微调部分,查询准确率进一步提升。 OpenAI推出ChatGPT,通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流。 OpenAI推出DALL·E2,不仅能通过文字描述创建特定风格的图像与艺术,还可以根据语言对现有的图像进行编辑,使之更加逼真。 2017 2021 2023 2018 2022 Google提出Transformer架构,其在简单语言问答和语言建模任务上有较好表现。 Google提出LaMDA模型,作为语言处理领域一项新的研究突破。LaMDA是一个面向对话的神经网络架构,可以就无休止的主题进行自由对话,克服了传统聊天机器人的局限性。 OpenAI推出GPT-4,其具备图像理解多模态能力。 Google推出PaLM-E,作为一种多模态VLM (视觉语言模型),不仅可以理解图像,还能理解、生成语言,执行各种复杂的机器人指令。 Learning,至顶智库结合公开资料整理绘制 资料来源:至顶智库结合公开资料整理绘制。8 1.3生成式AI产业图谱 在中国互联网协会、中国软件行业协会指导下,天津市人工智能学会、 至顶科技、至顶智库联合发布2023年全球生成式AI产业图谱。 图谱主要分为基础设施层(AI芯片、AI计算集群、AI云服务);算法模型层(生成式AI大模型);场景应用层(文本生成、图像生成、音频生成、视频生成、数字人)。图谱中涉及各领域全球代表性企业和相关机构,同时将其代表性产品或解决方案作相应展示,为读者提供更为详实的参考信息。 高清大图请扫描下方二维码获取。 9 1.4生成式AI商业模式 目前,生成式AI尚未建立成熟的变现方式,大部分产品仍处于免费试用“流量吸引+平台改良”阶段。从全球情况来看,生成式AI的主流营收模式有如下几类:作为底层平台收费、按产出内容收费、软件订阅服务收费、模型训练收费、具体属性收费。其中最具长期增长潜力,并将占据主要市场规模的模式为:作为底层平台收费。 软件订阅服务收费 向用户提供软件使用权,用户需要按月或其他频次支付费用。 按产出内容收费 按产出内容量收费如图片张数、请求计算量等,适用于应用层变现,会受到具体属性影响。 作为底层平台收费 作为底层平台接入其他产品对外开放,按照数据请求量和实际算量计算。 模型训练收费 包括模型定制开发,适用于NPC训练等个性化定制需求较强的领域。 具体属性收费 例如版权授予、是否支持商业用途(个人、企业、品牌使用等)、透明框架和分辨率等。 资料来源:至顶智库结合公开资料整理绘制。10 1.5生成式AI典型投资情况 2019年以来全球主要投资机构在生成式AI领域的相关投资 投资机构 被投企业 被投企业所在地 被投企业所属细分领域 2019年以来,全球知名投资机构如SequoiaCapital红杉资本、InsightPartners、CoatueManagement、创新工场、高瓴投资、启明创投等在生成式AI领域皆有所布局。从相关被投企业来看,美英生成式AI企业侧重在场景应用领域,中国生成式AI企业侧重在大模型领域,被投企业如OpenAI、StabilityAI、Jasper.ai、小冰公司、智谱AI、澜舟科技、毫末智行等。